본문 바로가기
AI · 인공지능/AI 뉴스

문자도 정확히 출력할 수 있는 「Stable Diffusion 3」 을 API를 통해 사용이 가능

by 두우우부 2024. 4. 19.
반응형

 

 

고화질 이미지 생성 AI "Stable Diffusion 3"의 API가 2024년 4월 17일에 공개되었습니다. Stable Diffusion 3은 기존의 AI에서는 실패하는 경우가 많았습니다.

Stable Diffusion 3 API 소개 — Stability AI Japan

https://stability.ai/news/stable-diffusion-3-api

 

Stable Diffusion 3 API Now Available — Stability AI

We are pleased to announce the availability of Stable Diffusion 3 and Stable Diffusion 3 Turbo on the Stability AI Developer Platform API. 

stability.ai

 


Stable Diffusion 3는 Stability AI가 개발하는 이미지 생성 AI로 DALL-E 3 및 Midjourney v6과 같은 이미지 생성 AI와 비교하여 프롬프트에 대한 충실성이 높은 것이 인간에 의한 평가에서 확인되고 있습니다. 또한, Stable Diffusion 3은 프롬프트 지시대로 문자를 출력할 수 있는 것을 큰 특징으로 하며, 목적한 문장대로의 외형을 그릴 수 있습니다.

 

Stability AI가 고화질 이미지 생성 AI 「Stable Diffusion 3」를 발표

Stability AI가 이미지 생성 AI 「Stable Diffusion 3」을 2024년 2월 23일에 발표했습니다. Stable Diffusion 3에서는 기존의 이미지 생성 AI에서는 어려웠던 「지정한 문자를 생성하고 위화감 없이 묘사」, 「복

doooob.tistory.com

 


새롭게 Stability AI는 "Stable Diffusion 3"과 "Stable Diffusion 3 Turbo"의 API를 Stability AI Developer Platform에 공개했습니다. API는 크레디트 제도로 100메가 픽셀의 이미지를 1장 생성할 때마다 'Stable Diffusion 3'은 6.5 크레디트, 'Stable Diffusion 3 Turbo'는 4 크레디트를 소비합니다. 각 API에 대한 자세한 내용은 다음 링크에서 확인할 수 있습니다.

Stability AI - Developer Platform
https://platform.stability.ai/docs/api-reference#tag/Generate/paths/~1v2beta~1stable-image~1generate~1sd3/post

 


Stability AI는 Stable Diffusion 3의 샘플도 복수 공개하고 있습니다. 아래 이미지는

 

"A red sofa on top of a white building. Graffiti with the text “the best view in the city"

 

프롬프트의 지시대로 벽면에 낙서가 그려져 있다.

 

 


"A cardboard box with the phrase “they say it's not good to think in here”, the cardboard box is large and sits on a theater stage.('they say it's not good to think in here"

 

"여기서 생각하면 안 된다고 한다”라는 문구가 적힌 판지 상자, 그 판지 상자는 크고 극장 무대 위에 놓여 있다."라는 프롬프트에서 생성한 이미지

 

올바르게 문자를 생성할 수 있습니다. 골판지 상자와 배경이 세부까지 묘사되어 있는 것도 특징적.

 


또한 Stability AI는 앞으로도 Stable Diffusion 3의 개선을 통해 향후 모델 데이터를 공개할 예정입니다.

반응형