본문 바로가기
반응형

스테이블 디퓨전8

스테이블 디퓨전의 제작사 Stability AI가「Stable Cascade」를 발표 2023년 2월 13일, Stability AI가 텍스트로부터 이미지를 생성하는 새로운 모델「Stable Cascade」를 발표했습니다. 이 모델은 비상용 라이센스로 출시되었습니다. 고품질의 이미지를 고속으로 생성하는 이 모델은 3가지 다른 모델(스테이지 A, B, C)로 구성된 파이프라인으로 구축됩니다. 이 3단계의 접근법으로 인하여 일반 소비자용의 저사양 하드웨어에서도 트레이닝과 파인 튜닝이 가능해지고 있습니다. Stable Cascade의 기초 역할을 하는「Würstchen」아키텍처는 이미지의 계층적 압축을 가능하게 하고, 고도로 압축된 잠재 영역을 이용하면서 효율적인 추론과 저비용 트레이닝을 가능하게 합니다. 3단계 모델의 각 스테이지는 다른 파라미터 사이즈를 가지며, 이미지 생성의 정밀도 및 세.. 2024. 2. 22.
[2023년판] Stable Diffusion WebUI로 AI 미소녀 만드는 법「ChilloutMix」 이미지 생성 AI "Stable Diffusion"을 사용하여 화제의 AI 미소녀를 만드는 방법에 대해 정리합니다.Q : 어떤 이미지를 만들 수 있나요? A: 무엇이든 만들 수 있습니다. 기본적으로 불가능은 거의 없습니다. 현존하는 거의 모든 캐릭터의 이미지를 작성할 수 있으며, 구도나 표정, 복장이나 헤어스타일, 성별이나 연령, 인간 이외의 것까지 생성 가능합니다. 완전 초보도 10분이면 환경 설정이 가능하므로, 여러분도 시험해 보세요! 전혀 어렵지 않습니다.내 PC에 로컬 환경을 구축하는 것이 아니기 때문에, 낮은 사양의 PC도 괜찮습니다. (실제로 저는 태블릿 PC인 삼성 갤럭시탭으로 캡처를 진행했습니다.) 소개하기 전에 알아야 할 전문 용어 프롬프트어떤 이미지를 AI로 작성할지 결정하는 지시 텍스.. 2023. 9. 12.
「Stable Diffusion + Multi ControlNet」으로 실사같은 애니메이션을 생성 Stable Diffusion 등의 사전 학습이 끝난 모델에 대해서, 윤곽선이나 깊이, 화상의 영역 구분(세그먼테이션) 정보 등을 추가해 출력을 서포트하는 기술이 「ControlNet」입니다. 이 ControlNet을 사용하면 별도로 불러온 이미지에 찍힌 선화나 사람의 자세 등을 출력에 온전히 반영시킬 수 있습니다. 이 ControlNet을 복수로 사용하는 「Multi ControlNet」으로 실사의 영상을 충실하게 애니메이션화 한 영상이, 온라인 게시판 Reddit에 공개되었습니다. Stable Diffusion과 ControlNet을 함께 사용하면 포즈와 구도를 높은 정밀도로 지정할 수 있습니다. Reddit에서 공개된 영상은 아래에서 볼 수 있습니다. 왼쪽 상단에는 ControlNet에 추가된 실사.. 2023. 4. 13.
이미지 생성 AI를 대폭 강화한 「Stable Diffusion XL」베타판 사용 리뷰 Stable Diffusion을 개발한 AI 연구기업 Stability AI가 기존의 이미지 생성 AI를 대폭 강화한 「Stable Diffusion XL(#SDXL)」을 테스트하고 있는 것으로 밝혀졌습니다. Stability AI의 웹 서비스인 DreamStudio에서 Stable Diffusion XL의 베타 버전 테스트가 가능했기 때문에, 새로운 이미지 생성 모델의 성능이 얼마나 향상되었는지 시험해 보았습니다. 기존의 Stable Diffusion에 포함되어 있던 파라미터 수는 9억이었지만, 「Stable Diffusion XL」의 파라미터 수는 23억에 달한다고 합니다. "Stable Diffusion XL"의 베타 버전은 Stability AI 웹 서비스인 "DreamStudio"에서 사용할 수.. 2023. 4. 5.
「Stable Diffusion」에서 단 1장의 이미지로부터「~ 같은 ○○」를 불과 수십초만에 생성하는 방법 Stable Diffusion 등의 화상 생성 AI는 자신이 생성하고 싶은 이미지를 임의의 이미지와 닮도록 하는「최적화」가 가능합니다. 텔아비브 대학의 컴퓨터 과학자인 리논 갈(Rinon Gal) 씨의 팀이 단 1장의 이미지와 5 ~ 15 스텝의 조정으로 이미지 최적화를 실현하는 방법을 발표했습니다. [2302.12228] Designing an Encoder for Fast Personalization of Text-to-Image Models Designing an Encoder for Fast Personalization of Text-to-Image Models Text-to-image personalization aims to teach a pre-trained diffusion model to.. 2023. 3. 2.
「Stable Diffusion」에서「CFG(classifier-free guidance)」란 도대체 무엇인가? 입력한 프롬프트를 바탕으로 이미지를 생성하는 AI 'Stable Diffusion'은 일반 공개 이후 전 세계 사람들로부터 주목을 받고 있으며 다양한 툴과 응용 방법도 발표되고 있습니다. 그런 Stable Diffusion으로 이미지를 생성할 때의 설정 항목에, 「이미지 생성 시 얼마나 프롬프트를 따르는가」를 결정하는 「CFG(classifier-free guidance) 스케일」이라는 값이 있습니다. CLASSIFIER-FREE DIFFUSION GUIDANCE.pdf The Road to Realistic Full-Body Deepfakes - Metaphysic.ai The Road to Realistic Full-Body Deepfakes - Metaphysic.ai It's nearly five.. 2022. 11. 6.
문장으로 이미지를 생성하는 AI「스테이블 디퓨전(Stable Diffusion)」을 사용해 보았다 런던과 캘리포니아를 거점으로 하는 스타트업 Stability AI가, 마치 아티스트가 그린 것 같은 고품질 이미지를 생성하는 이미지 생성 AI 「Stable Diffusion」을 일반에 공개했습니다. 모델은 Creative ML OpenRAIL-M 라이센스하에 출시되었으며 상용으로 사용하는 것도 허용됩니다. Stability.Ai AI for Humanity. Stability AI is a solution studio dedicated to innovating ideas. By using collective intelligence principles and augmented technology we design and implement feasible solutions to seemingly intra.. 2022. 9. 3.
무료 이미지 생성 AI「스테이블 디퓨전」Windows 설치 가이드(NMKD Stable Diffusion GUI) 입력한 문자열로부터 고정밀도의 화상을 생성할 수 있는 AI Stable Diffusion 은 2022년 8월에 무료로 일반에 공개되어, "기본적으로 생성한 이미지는 상용/비상용 불문하고, 자유롭게 이용할 수 있다."라는 프리한 라이센스로 큰 화제가 되었습니다. 그러나 Stable Diffusion을 로컬 Windows 환경에 도입하여 사용하려면 Python이나 Anaconda 등을 다루는 기술과 지식이 요구되기 때문에 초보자에게는 문턱이 높다고 할 수 있습니다. 그런 Stable Diffusion을 간단히 Windows 환경에 설치 가능한 「NMKD Stable Diffusion GUI」가 공개되었습니다. My easy-to-install Windows GUI for Stable Diffusion is .. 2022. 9. 3.
반응형