생성형 ai 관련 모델 정리

text to image

flux, stable diffusion, imagen3, ideogram

omnigen(원하는 사진 속 인물을 한 사진에 넣을 수 있음)

image to video

hailuo minimax, kling, luma, gen3, pika

LivePortrait(얼굴 표정 바꾸기)

Pyramidal flow(오픈소스지만 개인pc 그래픽카드 수준으로는 구동 불가능)

Voice Conversion

Retrieval-based Voice Conversion(RVC), so-vits-svc, DiffSVC

가장 많이 사용하는 건 RVC임

실시간 목소리 변조 프로그램 : MMVCServerSIO

보컬, mr 분리 프로그램 : UVR5

AI Music

Suno V4, udio

etc

오픈포즈, ip adapter, controlnet

Webui

comfyui, automatic1111

'컴퓨터 > 최신 SOTA 모델' 카테고리의 다른 글

컴퓨터 비전 SOTA 모델(2025) - reddit (0)	2025.03.21
llm 관련 자료 정리 (0)	2025.03.12
MS가 논문에서 추측한 최신 AI 모델 파라미터 크기 (0)	2025.01.08
동영상 생성형 ai 관련 최신 모델 정리 - 2024.12.20 기준 (0)	2024.12.20
2024년 10월 기준 image to video 2대장 - minimax, kling (0)	2024.10.28

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

지알오

생성형 ai 관련 모델 정리

text to image

image to video

Voice Conversion

AI Music

etc

Webui

'컴퓨터 > 최신 SOTA 모델' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

생성형 ai 관련 모델 정리

text to image

image to video

Voice Conversion

AI Music

etc

Webui

'컴퓨터 > 최신 SOTA 모델' 카테고리의 다른 글

'컴퓨터/최신 SOTA 모델' Related Articles

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역