본문 바로가기
AI · 인공지능/이미지 생성 AI

「Midjourney V5」등장, 취약했던 '손'도 깨끗하고 실사와의 구별은 거의 불가능

by 두우우부 2023. 3. 17.
반응형



이미지 생성 AI「Midjourney」의 개발 팀이, 2023년 3월 16일(목)에「Midjourney V5」의 '알파판'을 릴리즈 했습니다. Midjourney V5에서는 초고화질 이미지 생성이 가능할 뿐만 아니라, 이미지생성 AI의 과제였던「'손'을 정확하게 묘사할 수 없는 문제」가 해결되었다고 합니다.



개발팀에 따르면 'Midjourney V5'에서는
- 프롬프트에 대한 반응 향상
- 출력 이미지의 해상도가 두 배로 향상
- 프롬프트에 포함된 텍스트의 양을 줄여도 상세한 이미지를 출력 가능
- 2:1 비를 넘는 폭넓은 이미지에 대응
등의 기능 개선이 실시되었다고 합니다.



이미 SNS에서는 "Midjourney V5"를 사용하여 생성한 이미지가 다수 공개되고 있습니다.

「Midjourney V5」로 생성한「다른 앵글로부터 촬영한 2장의 인물을 옆에 늘어놓은 이미지」가 아래.
"동일한 인물의 얼굴을 다른 각도에서 묘사"라는 복잡한 작업을 문제없이 해내고 있습니다.


Midjourney나 Stable Diffusion등의 이미지생성 AI에서는 '손'을 정확하게 묘사하는 것이 어렵다는 문제가 존재하고 있었습니다. 그러나 'Midjourney V5'에서 생성된 다음 이미지에서는 손이 정확하게 묘사됩니다.


'Midjourney V5'에서 생성된 인간의 얼굴이나 손, 배경의 흐림 상태 등은 매우 자연스럽고, 따로 말하지 않으면 AI가 생성한 이미지인지 눈치채기 어려울 정도의 완성도입니다.



Midjourney V4(왼쪽)와 Midjourney V5(오른쪽)에 같은 프롬프트를 입력하여 비교하면,「Midjourney V5」쪽이 복장이나 시선의 부자연스러움이 줄어들고 있습니다.



아래를 보시면 사물에 대한 묘사도 매우 정교합니다.



위에서 언급했듯이 "Midjourney V5"에서는 매우 아름다운 이미지를 만들 수 있지만 약점도 존재합니다. 예를 들어, 아래의 이미지는 언뜻 보면 실사풍으로 보입니다만, 잘 관찰해보면「이미지 좌측 하단의 진열물이 유리 케이스를 관통하고 있다」,「간판에 읽을 수 없는 수수께끼 언어가 적혀 있다」라는 비현실적인 부분도 있습니다.


「Midjourney V5」는, 현 시점에서는 테스트 단계라고 합니다. Midjourney 관련 최신 정보는 다음 Discord 서버에 게시됩니다.

Midjourney | Discord
https://discord.com/invite/midjourney

반응형