Stability AI가 이미지 생성 AI 「Stable Diffusion 3」을 2024년 2월 23일에 발표했습니다. Stable Diffusion 3에서는 기존의 이미지 생성 AI에서는 어려웠던 「지정한 문자를 생성하고 위화감 없이 묘사」, 「복수의 피사체를 고화질로 묘사」라는 조작이 가능해졌습니다.
Stable Diffusion 3 — Stability AI
https://stability.ai/news/stable-diffusion-3
다음은 Stable Diffusion 3을 사용하여 "cinematic photo of a red apple on a table in a classroom, on the blackboard are the words 'go big or go home' written in chalk(교실 책상 위에 사과가 놓인 영화풍의 사진, 칠판에는 분필로 'go big or go home'이라고 적혀있다)"라는 프롬프트로 생성한 이미지입니다. 대문자와 소문자의 차이는 있지만, 칠판에 "GO BIG OR go HOME"라는 지시어가 잘 적혀 있습니다. 지시대로「분필로 쓴 문자」로서 묘사되고 있다는 것도 포인트.
a painting of an astronaut riding a pig wearing a tutu holding a pink umbrella, on the ground next to the pig is a robin bird wearing a top hat, in the corner are the words 'stable diffusion'(발레 스커트를 착용한 돼지에 탄 핑크 우산을 가진 우주 비행사의 회화, 돼지 옆 지상에는 Top 모자를 착용한 새가 있다, 모퉁이에는 'stable diffusion'이라는 어구가 적혀있다)'라는 프롬프트로 생성한 이미지가 아래. 「우주 비행사」, 「돼지」, 「새」를 지시대로 묘사할 수 있고, 이미지의 왼쪽 하단에 「STABLE DIFFUSION」이라는 문자열이 적혀 있습니다. 그러나 프롬프트에서는 'stable diffusion'이라고 소문자로 지시했지만 생성된 이미지에서는 대문자로 묘사되어 있습니다.
「studio photograph closeup of a chameleon over a black background(검은 배경으로 카멜레온을 클로즈업한 스튜디오 사진)」은 이런 느낌. 카멜레온의 얼굴 부근은 깨끗이 묘사되고 몸 부분은 뿌옇게 묘사되고 있어, 매크로 렌즈로 촬영한 것 같은 분위기가 나오고 있습니다.
Stable Diffusion 3에는 800만 ~ 80억 파라미터의 복수의 모델이 존재한다는 것. 현시점에서는 선행 미리 보기 단계로, 아래 링크에서 대기자 목록에 등록할 수 있습니다.
SD 3 Waitlist — Stability AI
https://stability.ai/stablediffusion3
'AI · 인공지능 > 이미지 생성 AI' 카테고리의 다른 글
배경이 투명한 이미지를 쉽게 생성할 수 있는 이미지 생성 AI「Layer Diffusion」리뷰 (77) | 2024.03.07 |
---|---|
Stability AI가 이미지에서 3D 모델을 생성할 수 있는「TripoSR」을 발표 (77) | 2024.03.06 |
사진이나 일러스트가 노래하도록 하거나 말하게 하는 AI 시스템 「EMO」가 등장 (76) | 2024.03.04 |
Stable Diffusion XL이 「SDXL-Lightning」의 데모를 공개 (75) | 2024.02.28 |
스테이블 디퓨전의 제작사 Stability AI가「Stable Cascade」를 발표 (85) | 2024.02.22 |
Google이 스마트폰을 사용해 0.5초만에 이미지를 생성하는「MobileDiffusion」을 발표 (114) | 2024.02.02 |
고해상도 이미지를 0.5초 만에 생성하는 오픈 소스 AI 이미지 생성 모델 「PixArt-δ」가 등장 (90) | 2024.01.30 |
Google이 초 고품질의 동영상 생성 AI 「Lumiere」를 발표 (108) | 2024.01.26 |