「Stable Diffusion web UI(AUTOMATIC1111판)」은 다른 UI에는 탑재되어 있지 않은 기능들을 담은, 이른바 결정판 「Stable Diffusion UI」라고 할 수 있습니다만, 그만큼 할 수 있는 것이 많기 때문에, 어디를 어떻게 만져야 좋을지 어려운 것도 사실입니다.
요번에는 우선 「Stable Diffusion web UI(AUTOMATIC111판)」중, 텍스트로부터 화상을 생성하는 「txt2img」의 기본적인 사용법을 정리하고 있습니다.
Stable Diffusion web UI(AUTOMATIC1111판)을 사용하기 위한 설정은 아래의 글에서 확인하세요.
스테이블 디퓨전 결정판「Google Colab + Stable Diffusion Web UI AUTOMATIC1111판」설치 정리(GPU 불필요)
◆ 1 : 가장 간단한 사용법
「일단, 뭔가 이미지를 만들고 싶다」라고 하는 경우, 「Prompt」 입력란에 원하는 이미지에 관한 문자열을 입력해 「Generate」를 누르면 됩니다.
「Prompt」를 입력하지 않아도 일단 이미지는 생성됩니다만, 전혀 지침이 없었다는 것이 확 느끼지는 그림이 생성됩니다.
Prompt에 무엇을 넣어야 할지에 관해서는, 아래 사이트들을 참고해 주세요.
이미지 생성 AI로 만들고 싶은 이미지를 찾아가는「KREA」
「스테이블 디퓨전(Stable Diffusion)」으로 만들고 싶은 이미지의「영문장」후보를 검색하는「clip-retrieval」
이미지 생성은 디폴트 설정시 1회에 3초 ~ 10초 정도 소요됩니다.
생성 도중에 멈추고 싶을 때는 「Interrupt(중단)」버튼을 누릅니다.
생성된 이미지는 브라우저에서 "다른 이름으로 이미지를 저장"하지 않고 "Stable Diffusion web UI"를 설치한 폴더 아래의 output에 txt2img-grids, txt2img-images에 나누어 저장됩니다.
txt2img-grids는 한 번에 여러 이미지 생성을 수행했을 때의 이미지 목록을 저장합니다.
txt2img-images는 이전에 생성된 모든 이미지를 저장합니다.
이 txt2img-images에 저장되어 있는 파일은 이름에 생성 시의 프롬프트가 자동으로 삽입되고, 메타데이터로서 시드 값이나 생성 시의 설정이 포함되어 있기 때문에 같은 설정으로 이미지 재생성이 가능합니다.
이미지에 포함된 메타데이터를 다시 사용하려면 'PNG 정보' 탭을 열고 이미지를 드래그 앤 드롭합니다.
그러면 화면 오른쪽에 생성 시 프롬프트, 파라미터, 시드 값이 표시됩니다.
◆ 2:「txt2img」 탭 내의 각 항목은 어떤 의미인가?
Stable Diffusion web UI(AUTOMATIC1111판)의 각 항목에는 팝업 도움말이 준비되어 있어, 마우스 커서를 올리면 어떤 항목인지 표시됩니다만, 내용이 영어이고, 문자열을 복사해서 번역할 수 없으니 아래에 정보를 정리해 봤습니다.
프롬프트 열의 오른쪽에 있는 Roll은 이미지 생성을 위한 프롬프트에 임의의 아티스트 이름을 추가합니다. 한 번 누를 때마다 한 명씩 추가됩니다.
아티스트는, 「Setting」 탭 내의 아래쪽에 있는 카테고리에 체크를 넣으면, 특정 카테고리의 사람을 등장시키는 것이 가능합니다. 예를 들어 amime라면 오토모 카츠히로와 데미즈 포스카 등의 이름이 나왔습니다만, 반드시 애니메이션이나 만화에만 한정되지는 않는 것 같습니다. 또 「c」나 「n」등의 수수께끼의 카테고리도 있습니다.
다음은 Stable Diffusion web UI(AUTOMATIC1111판)의 화면 왼쪽에 있는 이미지 생성 전에 조정하는 부분입니다.
「Sampling Steps」는, 화상 생성에 있어서의 피드백 공정을 몇 회 실시하는가 하는 것. 수를 늘리면 늘릴수록 정교한 그림이 되어 갑니다만, 당연히 늘릴수록 시간이 오래 걸리게 됩니다. 또, 수를 늘린다고 꼭 좋은 그림이 되는 것은 아니라는 점도 어려운 부분입니다. 초기 설정 그대로 20을 입력해도 적당히 완성됩니다만, 늘리고 싶다면 110 정도까지입니다.
「Sampling method」는, 피드백 공정에 있어서 어떠한 알고리즘을 채용하는지를 선택할 수 있습니다. 기본적으로는 「Euler a」로 OK.
아래는 각 알고리즘에 따른 이미지 생성 예시입니다.
"Restore faces"와 "Tiling"은 이 AUTOMATIC 1111 버전의 특징 중 하나입니다. 「Restore faces」는 Generative Facial Prior GAN(GFPGAN)을 이용해 무너지기 쉬운 얼굴의 보정을 강력하게 실시해, 가능한 한 좌우 대칭을 유지해 줍니다. Tiling(타일링)은 생성된 이미지를 타일처럼 정렬합니다.
공식 리포지토리에는 어느 정도의 보정을 할 수 있는지 비교한 이미지가 있습니다. 왼쪽 가장자리가 원본 사진이고 가운데 네 개가 다른 알고리즘이고 오른쪽 가장자리가 GFPGAN입니다.
Stable Diffusion은 이미지 생성을 "Batch(일괄처리 묶음)" 단위로 수행합니다.
일괄 처리를 몇 번 수행하는지가 "Batch count",
한 번의 배치로 몇 장의 이미지를 생성하는지 "Batch size"입니다.
한 번에 생성하는 이미지가 많으면 VRAM 사용량이 늘어나므로 VRAM이 적은 환경이면 오류가 발생하기 쉬워집니다. 따라서 VRAM이 적은 환경이라면 「Batch count」에서 생성하고 싶은 수를 지정하고, 「Batch size」는 1로 해 두면 에러 없이 안정적으로 이미지 생성을 할 수 있습니다.
CFG Scale은 다른 Stable Diffusion의 프런트 엔드와 마찬가지로 프롬프트의 지시에 얼마나 따르는지를 나타내는 값으로, 크게 하면 할수록 지시에 따른 내용이 되지만 그림 자체가 망가지기 쉽습니다. 일반적으로는 7~11이 적당하다고 되어 있습니다.
CFG Scale 조정에 따른 이미지 생성 예시
「Height」와 「Width」는 출력 화상의 사이즈. 원래 모델이 512 × 512에 최적화되어 있기 때문에 가장 고품질의 이미지가 생성되는 것은 512 × 512입니다. 또한 이미지 크기는 그대로 VRAM의 사용량에 반영되기 때문에 「512 × 832처럼 조금 큰 이미지를 만들고 싶다」는 경우, VRAM이 적으면 에러가 발생하면서 생성되지 않는 경우가 있습니다.
「Seed」는 시드치로, 「-1」이라면 매번 랜덤 생성이 됩니다. 「이 이미지는 잘 나왔으니까, 이 구도를 재현하고 싶다」는 경우, 해당 이미지의 시드치를 입력하는 것으로, 같은 구도나 분위기는 유지하면서 다른 패턴의 이미지를 생성할 수 있습니다.
"Script"는 스크립트를 사용할 수 있습니다. 기본값은 "None"입니다. 이것은 별도로 다룰 예정입니다.
생성된 이미지의 하단에는 이미지를 다루는 버튼이 여러 개 표시됩니다. 「Save」라고 하면, 생성된 화상을 정리해 「log/images」안에 CSV 파일과 함께 보존합니다. 생성된 이미지 중 하나를 선택하고 “Send to img2img”를 누르면 “img2img” 탭으로 보내집니다. 마찬가지로 "Send to inpaint"라면 "img2img"탭의 인페인팅 기능으로 보내지므로 이미지의 일부분에 마스킹을 걸 수 있습니다. "Send to extras"라면 "Extras"탭으로 보내집니다.
관련글
AUTOMATIC1111판 「Prompt matrix」및「X/Y plot」사용법 정리
AUTOMATIC1111판 설치방법 정리(GPU 불필요)
AUTOMATIC1111판 img2img 사용법 정리
'AI · 인공지능 > 이미지 생성 AI' 카테고리의 다른 글
「Stable Diffusion」성인용 묘사 세이프티 필터도 해제되어 있는「Mage」리뷰 (0) | 2022.10.29 |
---|---|
「Stable Diffusion web UI(AUTOMATIC1111판)」img2img의 Script 사용법 정리 (0) | 2022.10.26 |
「Stable Diffusion web UI(AUTOMATIC1111판)」img2img 기본 사용법 정리 (1) | 2022.10.24 |
「Stable Diffusion web UI(AUTOMATIC1111판)」의「Prompt matrix」및「X/Y plot」사용법 정리 (0) | 2022.10.23 |
스테이블 디퓨전 결정판「Google Colab + Stable Diffusion Web UI AUTOMATIC1111판」설치 정리(GPU 불필요 (12) | 2022.10.23 |
Adobe가 이미지 생성 AI를 개발중, "이미지 생성 AI의 투명성을 확보하고 크리에이티브를 지원한다"고 발표 (0) | 2022.10.20 |
스테이블 디퓨전의 데일리 액티브 유저가 천만명에 도달, 'DreamStudio' 유저는 150만명 초과 (1) | 2022.10.18 |
「Stable Diffusion web UI(스테이블 디퓨전 웹환경)」Windows 설치 정리 (1) | 2022.10.17 |