30배나 빠른 AI 이미지 생성 기법을 매사추세츠 공과대학이 개발

DALL-E 3나 Stable Diffusion과 같은 인기 이미지 생성 AI의 확산 모델을 간소화하고 생성되는 이미지의 품질을 유지하면서 생성 속도를 최대 30배 가속시키는 기술을 미국 매사추세츠 공과대학(MIT) 의 연구팀이 공개했습니다.

2311.18828] One-step Diffusion with Distribution Matching Distillation
https://arxiv.org/abs/2311.18828

One-step Diffusion with Distribution Matching Distillation

Diffusion models generate high-quality images but require dozens of forward passes. We introduce Distribution Matching Distillation (DMD), a procedure to transform a diffusion model into a one-step image generator with minimal impact on image quality. We e

arxiv.org

AI generates high-quality images 30 times faster in a single step | MIT News | Massachusetts Institute of Technology

AI generates high-quality images 30 times faster in a single step

A new distribution matching distillation (DMD) technique merges GAN principles with diffusion models, achieving 30x faster high-quality image generation in a single computational step and enhancing tools like Stable Diffusion and DALL-E.

news.mit.edu

MIT scientists have just figured out how to make the most popular AI image generators 30 times faster | Live Science

MIT scientists have just figured out how to make the most popular AI image generators 30 times faster

Scientists have built a framework that gives generative AI systems like DALL·E 3 and Stable Diffusion a major boost by condensing them into smaller models — without compromising their quality.

www.livescience.com

이미지 생성 AI의 대부분에서 사용되는 확산 모델은 어떤 이미지인지 설명하는 캡션이나 메타데이터를 붙인 이미지를 트레이닝 데이터로 사용하여 텍스트 프롬프트를 통해 정확하게 이미지를 생성할 수 있도록 훈련되고 있습니다.

이 과정에서 확산 모델은 우선 랜덤 한 이미지를 노이즈로 변환하고 나서 「 역확산 」 이라고 불리는 노이즈 제거 과정을 최대 100 스텝 실시함으로써 선명한 이미지를 생성할 수 있게 된다는 것.

이번 MIT의 연구팀이 발표한 '분포 매칭 증류(DMD : Distribution Matching Distillation)'라는 기법에서는 이 「 역확산 」 단계를 1단계까지 줄임으로써 이미지 생성에 걸리는 시간을 크게 단축하는 데 성공했습니다.

Stable Diffusion v1.5를 사용한 일부 테스트에서는 2590ms가 소요되던 이미지 생성 시간이 약 30분의 1인 90ms로 단축되었습니다.

MIT의 Tianwei Yin 씨는 "우리의 연구는 적대적 생성 네트워크(GAN)의 원리와 확산 모델의 원리를 융합시켜 시각 콘텐츠 생성을 1 스텝으로 실현하는 것으로, 이것은 현행 확산 모델에서 100 스텝의 반복적인 개선이 필요한 것과는 대조적입니다. 이는 속도와 품질이 뛰어난 새로운 생성 모델링 기법이 될 가능성을 갖고 있습니다."라고 코멘트.

DMD에는 이미지를 생성하는 데 필요한 반복 횟수를 줄이는 중요한 두 가지 요소가 있습니다.

첫 번째는 "회귀 손실"이라고 불리며, 학습 과정에서 유사성을 바탕으로 이미지를 정리하여 AI를 가속화합니다.

두 번째는 "분포 매칭 손실"로, 특정 이미지가 생성될 확률을 현실 세계에서의 확률에 대응시키는 것입니다.

이러한 기술을 조합하면 새로운 AI 모델에 의해 생성된 이미지에 이상한 부분이 나타날 가능성이 최소화된다는 것.

이 새로운 접근법은 이미지 생성에 필요한 연산력을 획기적으로 줄이기 때문에 빠르고 효율적인 생성이 요구되는 AI 산업에 큰 이익을 가져다주며 보다 신속한 콘텐츠 생성으로 이어질 것으로 기대됩니다.

MIT의 프레드 듀랜드 씨는 "확산 모델이 탄생한 후, 반복 횟수를 줄이는 방법이 성배처럼 찾아왔습니다. 연산 비용이 극적으로 줄어들고 생산 과정이 가속화될 것으로 기대되어 매우 흥분하고 있습니다."라고 말했습니다.

무려 30배라니...
MIT 연구원 폼 미쳤다!
아직도 무궁무진한 AI 연구의 세계~

저작자표시 비영리 변경금지 (새창열림)

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

OpenAI가 이미지를 읽을 수 있는 AI 「 GPT-4 Turbo with Vision」 을 일반에 공개 개시 (56)	2024.04.11
Hugging Face도 뚫렸다? 신뢰할 수 없는 AI 모델을 실행하면 AI를 통해 시스템에 침입할 수 있음을 경고 (5)	2024.04.09
「Llama 2 70B」와 「Stable Diffusion XL」이 추가된 AI 벤치마크 테스트 「MLPerf Inference v4.0」 발표 (56)	2024.03.29
Databricks가 오픈한 대규모 언어 모델 「 DBRX 」 를 릴리스, GPT-3.5나 CodeLLaMA-70B를 웃도는 성능 (58)	2024.03.29
「조기 사망률」,「다른 도시나 나라로 이사할 것인가」 등 인생을 예측하는 AI 개발 (51)	2024.03.28
대규모 언어 모델의 계산 능력을 증강하는 커스터마이즈 하드웨어를 만드는 스타트업「MatX」 (51)	2024.03.28
OpenAI가 동영상 생성 AI 「 Sora 」의 동영상 샘플을 대량 공개 (52)	2024.03.28
텍스트 지시만으로 작업을 실행하고, 다른 AI에게도 가르칠 수 있는 AI가 개발된다 (58)	2024.03.26

두우우부

30배나 빠른 AI 이미지 생성 기법을 매사추세츠 공과대학이 개발

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

티스토리툴바

30배나 빠른 AI 이미지 생성 기법을 매사추세츠 공과대학이 개발

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

관련글

티스토리툴바