컴퓨터/오픈소스

오픈 소스 llm 최신 모델 DeepSeek-V3

지알오알지 2024. 12. 30. 17:08

며칠 전에 DeepSeek-V3가 공개됐습니다.

https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf

 

DeepSeek-V3/DeepSeek_V3.pdf at main · deepseek-ai/DeepSeek-V3

Contribute to deepseek-ai/DeepSeek-V3 development by creating an account on GitHub.

github.com

논문 서론을 보니 패쇄형 모델과 오픈 소스 모델을 구분하고 있네요.

 

오픈 소스 모델은

DeepSeek, LLaMA, Qwen, Mistral을 언급합니다.

이 중에 DeepSeek, Qwen은 중국회사인데 LLM, 이미지, 동영상과 관련하여 생성형 AI 분야를 가리지 않고 중국산 모델이 SOTA 모델들과 성능이 비슷한게 재밌는거 같습니다.