컴퓨터/오픈소스
오픈 소스 llm 최신 모델 DeepSeek-V3
지알오알지
2024. 12. 30. 17:08
며칠 전에 DeepSeek-V3가 공개됐습니다.
https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf
DeepSeek-V3/DeepSeek_V3.pdf at main · deepseek-ai/DeepSeek-V3
Contribute to deepseek-ai/DeepSeek-V3 development by creating an account on GitHub.
github.com
논문 서론을 보니 패쇄형 모델과 오픈 소스 모델을 구분하고 있네요.
오픈 소스 모델은
DeepSeek, LLaMA, Qwen, Mistral을 언급합니다.
이 중에 DeepSeek, Qwen은 중국회사인데 LLM, 이미지, 동영상과 관련하여 생성형 AI 분야를 가리지 않고 중국산 모델이 SOTA 모델들과 성능이 비슷한게 재밌는거 같습니다.