본문 바로가기
AI · 인공지능/이미지 생성 AI

「Stable Diffusion」의 고성능 모델 「SDXL 0.9」를 Stability AI가 발표

by 두우우부 2023. 6. 26.
반응형

이미지 생성 AI 'Stable Diffusion'을 개발한 AI 연구 기업인 Stability AI는 2023년 4월 기존 이미지 생성 AI를 대폭 강화한 'Stable Diffusion XL(SDXL)'의 베타 버전을 출시했습니다. 그리고 현지 시간의 6월 22일, SDXL 베타판으로부터 이미지와 구도의 디테일이 대폭 개선된 신모델 「SDXL 0.9」가 릴리스 되었습니다.
 

Stability AI launches SDXL 0.9: A Leap Forward in AI Image Generation

Stability AI launches SDXL 0.9: A Leap Forward in AI Image Generation — Stability AI

Discover SDXL 0.9, Stability AI's cutting-edge release in the Stable Diffusion suite. Unleashing remarkable image and composition precision, this upgrade revolutionizes generative AI imagery. From hyper-realistic media production to design and industrial a

stability.ai

 

 
 
Stability AI가 2023년 4월에 베타 버전을 발표한 'SDXL'은 모델의 파라미터 수가 기존의 9억에서 23억으로 증가하여 생성할 수 있는 이미지의 퀄리티가 대폭 향상되었습니다. 실제로 SDXL의 베타 버전을 사용하여 이미지를 생성해 본 리뷰는 아래에서 읽을 수 있습니다.
 
이미지 생성 AI를 대폭 강화한 「Stable Diffusion XL」베타판 사용 리뷰

이미지 생성 AI를 대폭 강화한 「Stable Diffusion XL」베타판 사용 리뷰

Stable Diffusion을 개발한 AI 연구기업 Stability AI가 기존의 이미지 생성 AI를 대폭 강화한 「Stable Diffusion XL(#SDXL)」을 테스트하고 있는 것으로 밝혀졌습니다. Stability AI의 웹 서비스인 DreamStudio에서 Stab

doooob.tistory.com


Stability AI에 따르면, SDXL의 베타판에는 7000명 가까이가 참가하는 Discord 커뮤니티 로부터 큰 반향이 전해져, Discord 유저가 생성한 이미지는 누계 70만 장을 넘었다고 합니다.

6월 22일 Stability AI는 SDXL의 베타 버전에서 이미지와 구도의 디테일이 개선된 최신 버전인 'SDXL 0.9'를 발표했습니다. SDXL 0.9에서는 파라미터 수가 베타 버전에서 더욱 증가하고, 35억의 파라미터를 가지는 단일 모델과 58억의 파라미터를 가지는 복수 모델로 되어 있어, 오픈 소스 모델 중에서도 최대급 파라미터가 되고 있습니다. Stability AI는 두 모델을 결합하여 이미지를 생성하여 이미지에 미세한 디테일을 추가할 수 있다고 설명합니다. 

Stability AI는 공식 블로그에 이전 모델의 SDXL 베타 버전과 최신 모델의 SDXL 0.9에서 동일한 프롬프트로 이미지를 생성한 결과를 공개하고 있습니다.

다음은 "aesthetic aliens walk among us in Las Vegas, scratchy found film photograph"라는 프롬프트로 SDXL 베타 버전(왼쪽)과 SDXL 0.9(오른쪽)에서 이미지를 생성한 결과입니다. SDXL 0.9의 이미지는 더 디테일이 선명한 인상입니다.
 

 

다음은 "A wolf in Yosemite National Park, chilly nature documentary film photography"라는 프롬프트의 생성 결과. SDXL 베타판(왼쪽)과 비교해, SDXL 0.9(오른쪽)은 늑대의 얼굴이 보다 뚜렷합니다.
 

 

현재 SDXL 0.9는 2023년 3월에 인수한 AI 이미지 편집 앱 「ClipDrop」의 공식 사이트로부터 액세스 가능하게 되어 있으므로, 실제로 사용해 SDXL 0.9의 성능을 확인해 보았습니다.
 



ClipDrop 공식 사이트를 방문한 후 중앙 입력란에 프롬프트를 입력합니다. 이번에는 "Horse show jumping in nature in good weather"라는 프롬프트를 입력하고 "Generate"를 클릭했습니다.

수십 초 만에 이미지가 생성되었습니다. 출력 결과 화면에는 4장의 이미지가 표시되는 스페이스가 있습니다만, 서버의 혼잡 때문인지 전부 표시되지 않는 경우가 많았습니다. 자세히 보려면 이미지를 클릭합니다.


잘 보면 세밀한 부분에서 위화감은 있지만, 꽤 높은 품질의 이미지가 생성되었습니다.


비교를 위해 Stability AI의 웹 서비스인 DreamStudio에서 기존 버전의 Stable Diffusion v2.1(버전 2.1)을 사용하여 동일한 프롬프트에서 이미지를 생성해 보겠습니다. 프롬프트를 입력하여 모델을 선택하고 Dream을 클릭합니다.



생성된 이미지는 이런 느낌.



그중 1장을 확대해 보았습니다. 프롬프트를 따라가지만, SDXL 0.9에서 생성된 이미지와 비교하면 디테일에서 노이즈가 낀 인상입니다.



Stable Diffusion v2.1에서 생성한 이미지(왼쪽)와 SDXL 0.9에서 생성한 이미지(오른쪽)를 나란히 비교해 보면 이런 느낌.



SDXL 0.9는 Windows 10/11 및 Linux에서 동작하며, 16GB의 RAM과 최소 8GB의 VRAM을 탑재한 Nvidia GeForce RTX 20 그래픽 카드를 갖춘 표준 PC에서 실행할 수 있습니다. Stability AI API도 곧 공개될 예정이며, 7월 중순에는 버전 1.0의 오픈 릴리스가 예정되어 있다고 합니다.

반응형