고화질 이미지 생성 AI "Stable Diffusion 3"의 API가 2024년 4월 17일에 공개되었습니다. Stable Diffusion 3은 기존의 AI에서는 실패하는 경우가 많았습니다.
Stable Diffusion 3 API 소개 — Stability AI Japan
https://stability.ai/news/stable-diffusion-3-api
Stable Diffusion 3는 Stability AI가 개발하는 이미지 생성 AI로 DALL-E 3 및 Midjourney v6과 같은 이미지 생성 AI와 비교하여 프롬프트에 대한 충실성이 높은 것이 인간에 의한 평가에서 확인되고 있습니다. 또한, Stable Diffusion 3은 프롬프트 지시대로 문자를 출력할 수 있는 것을 큰 특징으로 하며, 목적한 문장대로의 외형을 그릴 수 있습니다.
새롭게 Stability AI는 "Stable Diffusion 3"과 "Stable Diffusion 3 Turbo"의 API를 Stability AI Developer Platform에 공개했습니다. API는 크레디트 제도로 100메가 픽셀의 이미지를 1장 생성할 때마다 'Stable Diffusion 3'은 6.5 크레디트, 'Stable Diffusion 3 Turbo'는 4 크레디트를 소비합니다. 각 API에 대한 자세한 내용은 다음 링크에서 확인할 수 있습니다.
Stability AI - Developer Platform
https://platform.stability.ai/docs/api-reference#tag/Generate/paths/~1v2beta~1stable-image~1generate~1sd3/post
Stability AI는 Stable Diffusion 3의 샘플도 복수 공개하고 있습니다. 아래 이미지는
"A red sofa on top of a white building. Graffiti with the text “the best view in the city"
프롬프트의 지시대로 벽면에 낙서가 그려져 있다.
"A cardboard box with the phrase “they say it's not good to think in here”, the cardboard box is large and sits on a theater stage.('they say it's not good to think in here"
"여기서 생각하면 안 된다고 한다”라는 문구가 적힌 판지 상자, 그 판지 상자는 크고 극장 무대 위에 놓여 있다."라는 프롬프트에서 생성한 이미지
올바르게 문자를 생성할 수 있습니다. 골판지 상자와 배경이 세부까지 묘사되어 있는 것도 특징적.
또한 Stability AI는 앞으로도 Stable Diffusion 3의 개선을 통해 향후 모델 데이터를 공개할 예정입니다.
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
Microsoft가 사진과 음성 파일로 리얼하게 말하는 영상을 만들 수 있는 AI 모델 「VASA-1」공개 (86) | 2024.04.23 |
---|---|
Amazon 기프트 카드 등을 주고 PC 리소스를 빌려 AI 포르노를 생성하려는 시도 (87) | 2024.04.23 |
AI가 만들어낸 커피 블렌드「AI-CONIC」 (87) | 2024.04.23 |
Meta가 무료로 상용 이용도 가능한 차세대 오픈 LLM 「Llama 3」 을 공개 (79) | 2024.04.21 |
무료로 상업적 이용도 가능한 오픈 모델 「Mixtral 8x22B」 가 등장 (8) | 2024.04.19 |
Baidu의 채팅 AI 「Ernie Bot(어니봇)」 이용자가 2억 명을 돌파 (65) | 2024.04.18 |
일상 회화를 녹음하고 요약할 수 있는 펜던트형 AI 가젯 「Pendant」가 등장 (67) | 2024.04.17 |
스탠퍼드 대학의 2024 AI 리포트 「AI Index Report 2024」 (67) | 2024.04.17 |