Stability AI가 고화질 이미지 생성 AI 「Stable Diffusion 3」를 발표

Stability AI가 이미지 생성 AI 「Stable Diffusion 3」을 2024년 2월 23일에 발표했습니다. Stable Diffusion 3에서는 기존의 이미지 생성 AI에서는 어려웠던 「지정한 문자를 생성하고 위화감 없이 묘사」, 「복수의 피사체를 고화질로 묘사」라는 조작이 가능해졌습니다.
Stable Diffusion 3 — Stability AI
Stable Diffusion 3 — Stability AI
Announcing Stable Diffusion 3 in early preview, our most capable text-to-image model with greatly improved performance in multi-subject prompts, image quality, and spelling abilities.
다음은 Stable Diffusion 3을 사용하여 "cinematic photo of a red apple on a table in a classroom, on the blackboard are the words 'go big or go home' written in chalk(교실 책상 위에 사과가 놓인 영화풍의 사진, 칠판에는 분필로 'go big or go home'이라고 적혀있다)"라는 프롬프트로 생성한 이미지입니다. 대문자와 소문자의 차이는 있지만, 칠판에 "GO BIG OR go HOME"라는 지시어가 잘 적혀 있습니다. 지시대로「분필로 쓴 문자」로서 묘사되고 있다는 것도 포인트.

a painting of an astronaut riding a pig wearing a tutu holding a pink umbrella, on the ground next to the pig is a robin bird wearing a top hat, in the corner are the words 'stable diffusion'(발레 스커트를 착용한 돼지에 탄 핑크 우산을 가진 우주 비행사의 회화, 돼지 옆 지상에는 Top 모자를 착용한 새가 있다, 모퉁이에는 'stable diffusion'이라는 어구가 적혀있다)'라는 프롬프트로 생성한 이미지가 아래. 「우주 비행사」, 「돼지」, 「새」를 지시대로 묘사할 수 있고, 이미지의 왼쪽 하단에 「STABLE DIFFUSION」이라는 문자열이 적혀 있습니다. 그러나 프롬프트에서는 'stable diffusion'이라고 소문자로 지시했지만 생성된 이미지에서는 대문자로 묘사되어 있습니다.

「studio photograph closeup of a chameleon over a black background(검은 배경으로 카멜레온을 클로즈업한 스튜디오 사진)」은 이런 느낌. 카멜레온의 얼굴 부근은 깨끗이 묘사되고 몸 부분은 뿌옇게 묘사되고 있어, 매크로 렌즈로 촬영한 것 같은 분위기가 나오고 있습니다.

Stable Diffusion 3에는 800만 ~ 80억 파라미터의 복수의 모델이 존재한다는 것. 현시점에서는 선행 미리 보기 단계로, 아래 링크에서 대기자 목록에 등록할 수 있습니다.
SD 3 Waitlist — Stability AI