본문 바로가기

컴퓨터/최신 SOTA 모델

생성형 ai 관련 모델 정리

text to image

flux, stable diffusion, imagen3, ideogram

omnigen(원하는 사진 속 인물을 한 사진에 넣을 수 있음)

image to video

hailuo minimax, kling, luma, gen3, pika

LivePortrait(얼굴 표정 바꾸기)

Pyramidal flow(오픈소스지만 개인pc 그래픽카드 수준으로는 구동 불가능)

Voice Conversion

Retrieval-based Voice Conversion(RVC), so-vits-svc, DiffSVC

가장 많이 사용하는 건 RVC임

실시간 목소리 변조 프로그램 : MMVCServerSIO

보컬, mr 분리 프로그램 : UVR5

AI Music

Suno V4, udio

etc

오픈포즈, ip adapter, controlnet

Webui

comfyui, automatic1111