며칠 전에 DeepSeek-V3가 공개됐습니다.
https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf
DeepSeek-V3/DeepSeek_V3.pdf at main · deepseek-ai/DeepSeek-V3
Contribute to deepseek-ai/DeepSeek-V3 development by creating an account on GitHub.
github.com
논문 서론을 보니 패쇄형 모델과 오픈 소스 모델을 구분하고 있네요.
오픈 소스 모델은
DeepSeek, LLaMA, Qwen, Mistral을 언급합니다.
이 중에 DeepSeek, Qwen은 중국회사인데 LLM, 이미지, 동영상과 관련하여 생성형 AI 분야를 가리지 않고 중국산 모델이 SOTA 모델들과 성능이 비슷한게 재밌는거 같습니다.
'컴퓨터 > 오픈소스' 카테고리의 다른 글
AI 오픈소스 목록 (0) | 2025.03.05 |
---|---|
Suno ai 경쟁자 등장? YuE (0) | 2025.02.11 |