text to image
flux, stable diffusion, imagen3, ideogram
omnigen(원하는 사진 속 인물을 한 사진에 넣을 수 있음)
image to video
hailuo minimax, kling, luma, gen3, pika
LivePortrait(얼굴 표정 바꾸기)
Pyramidal flow(오픈소스지만 개인pc 그래픽카드 수준으로는 구동 불가능)
Voice Conversion
Retrieval-based Voice Conversion(RVC), so-vits-svc, DiffSVC
가장 많이 사용하는 건 RVC임
실시간 목소리 변조 프로그램 : MMVCServerSIO
보컬, mr 분리 프로그램 : UVR5
AI Music
Suno V4, udio
etc
오픈포즈, ip adapter, controlnet
Webui
comfyui, automatic1111
'컴퓨터 > 최신 SOTA 모델' 카테고리의 다른 글
컴퓨터 비전 SOTA 모델(2025) - reddit (0) | 2025.03.21 |
---|---|
llm 관련 자료 정리 (0) | 2025.03.12 |
MS가 논문에서 추측한 최신 AI 모델 파라미터 크기 (0) | 2025.01.08 |
동영상 생성형 ai 관련 최신 모델 정리 - 2024.12.20 기준 (0) | 2024.12.20 |
2024년 10월 기준 image to video 2대장 - minimax, kling (0) | 2024.10.28 |