본문 바로가기
AI · 인공지능/이미지 생성 AI

「스테이블 디퓨전(Stable Diffusion)」으로 만들고 싶은 이미지의「영문장」후보를 검색하는「clip-retrieval」

by 두우우부 2022. 9. 4.
반응형

문장을 입력하는 것만으로 좋아하는 이미지를 생성해 주는 AI「Stable Diffusion」은, 2022년 8월에 공개되어 이후 큰 주목을 받고 있어, PC에 간단하게 인스톨할 수 있는 GUI어플리케이션도 이전 글에서 소개했습니다. 그러나 Stable Diffusion은 영어 문장으로만 입력해야 하며, 영어가 익숙하지 않은 사람들은 어렵게 느껴질 것입니다. 참고 이미지를 보면서「이미지 생성용 영문장」을 간단하게 검색할 수 있는 시스템「clip-retrieval」를 사용하면 Stable Diffusion에 입력할 영문의 작성이 쉽기 때문에 그 사용법을 정리해 보았습니다.

관련글 : 무료 이미지 생성 AI「스테이블 디퓨전 - NMKD Stable Diffusion GUI」사용법 정리

무료 이미지 생성 AI「스테이블 디퓨전 - NMKD Stable Diffusion GUI」사용법 정리

이미지 생성 AI 「Stable Diffusion」은, 지시에 따라 이미지를 생성해 주는 AI로서 큰 주목을 받고 있습니다. 우선 NMKD Stable Diffusion GUI 윈도우 설치부터 합시다 무료 이미지 생성 AI「스테이블 디퓨전

doooob.tistory.com


clip-retrieval은 이미지를 입력하면 그와 비슷한 이미지를 영문명과 함께 표시해주는 시스템으로, Stable Diffusion에서 생성할 이미지의 참고 이미지를 입력하여 이미지 생성용 영문장의 팁을 얻을 수 있습니다.

clip-retrieval은 로컬에 설치하는 것도 가능합니다만, 이번은 clip-retrieval의 개발자가 공개하고 있는 웹앱「Clip front」를 사용해 보겠습니다. 먼저 아래 링크를 클릭하여 Clip front에 액세스 합니다.

Clip front
https://rom1504.github.io/clip-retrieval/


Clip front에 액세스하면 왼쪽에 메뉴가 표시되고 상단에 영문 검색창이 표시됩니다. 이번에는 이미지를 직접 입력하겠습니다. 화면 오른쪽 상단의 카메라 아이콘을 클릭합니다.


파일 선택 대화 상자가 표시되면 입력할 이미지를 선택합니다.


이번에는 "여성과 개가 크리스마스트리 앞에서 노는 사진"을 선택했습니다.


이미지를 입력하면 몇 초 후에 입력된 이미지와 유사한 이미지가 표시됩니다.


이미지 위에 커서를 올리면 해당 이미지를 생성시킨 영문장이 표시됩니다.

좌측의 메뉴 옵션들을 번역해 보면 아래와 같습니다.

미적 점수라는 것은 심미적(審美的) 점수를 의미합니다.


또한 돋보기 아이콘을 클릭하면...


영문장이 상단 검색창에 입력되고, 그 영문장에 따른 이미지가 다시 검색됩니다. 이번에는 "happy woman in sweater sitting on floor with labrador near christmas tree(크리스마스트리 근처에서 래브라도와 함께 바닥에 앉아 스웨터 차림을 한 행복한 여자)"라는 문장이 표시되었습니다. 검색창에 표시된 영문을 복사하면 Stable Diffusion에서 이미지 생성에 활용할 수 있습니다.


위의 영문장으로 이미지 생성을 실시한 결과, 아래와 같이 출력되었습니다.「생성하고 싶은 이미지의 참고 파일은 있지만, 적절한 영문장을 모른다」라고 하는 사람은 clip-retrieval을 사용해 보시는 것을 추천드립니다.

참고로, 「clip-retrieval」은 개발자가 GitHub에 공개하고 있습니다.

https://github.com/rom1504/clip-retrieval

GitHub - rom1504/clip-retrieval: Easily compute clip embeddings and build a clip retrieval system with them

Easily compute clip embeddings and build a clip retrieval system with them - GitHub - rom1504/clip-retrieval: Easily compute clip embeddings and build a clip retrieval system with them

github.com

반응형