본문 바로가기
AI · 인공지능/이미지 생성 AI

ChatGPT에 통합되어 채팅하며 이미지를 생성할 수 있는 AI「DALL-E 3」를 OpenAI가 발표

by 두우우부 2023. 9. 22.
반응형



OpenAI가 이미지 생성 AI, 「DALL-E 3」 를 2023년 9월 20일에 발표했습니다.

DALL-E 3는 대규모 언어 모델 GPT를 기반으로 하는 챗봇 AI, ChatGPT와 통합된 것이 특징으로, 2023년 10월에 ChatGPT Plus 및 Enterprise 고객에게 제공될 예정입니다.

DALL·E 3

DALL·E 3

DALL·E 3 understands significantly more nuance and detail than our previous systems, allowing you to easily translate your ideas into exceptionally accurate images.

openai.com

OpenAI’s new AI image generator pushes the limits in detail and prompt fidelity | Ars Technica

OpenAI’s new AI image generator pushes the limits in detail and prompt fidelity

With better response to details and text, DALL-E 3 hopes to make prompt engineering obsolete.

arstechnica.com



DALL-E」는 OpenAI에 의해 2021년에 발표된 이미지 생성 AI로, 「프롬프트」라는 텍스트 입력을 바탕으로 이미지를 출력할 수 있습니다. DALL-E의 언어 처리에는 OpenAI의 대규모 언어 모델인 GPT-3의 파라미터가 사용되고 있습니다.

이번에 발표된 DALL-E 3는 GPT를 기반으로 개발된 채팅봇 AI인 ChatGPT를 기반으로 구축되어 있는 것이 특징입니다. DALL-E 는 유료 플랜으로, ChatGPT Plus의 통합 기능으로 제공되며, ChatGPT에 말을 거는 형태로 이미지 프롬프트를 입력하면 ChatGPT가 이미지를 생성해 줍니다.



OpenAI는 "현재 이미지 생성 AI는 텍스트에서 이미지를 생성할 때 일부 단어나 설명을 무시하는 경향이 있기 때문에 사용자는 프롬프트 엔지니어링을 요구받고 있습니다. DALL-E 3는 제공된 텍스트에 올바르게 대응하는 이미지를 생성하는 능력이 비약적으로 발전했습니다."라고 코멘트.

또한 OpenAI는 DALL-E3에 대해 폭력적인 내용이나 성인용 콘텐츠, 또는 증오가 가득한 콘텐츠를 생성하는 능력을 제한하고 있다고 설명합니다. 그리고, 살아있는 아티스트의 화풍은 요청을 거부하도록 설계되어 있어, 크리에이터는 접수를 통해 이미지 생성 모델의 트레이닝으로부터 자신의 저작권 이미지를 옵트아웃할 수 있도록 되어있다고 합니다.

OpenAI는 DALL-E 3로 생성한 이미지의 예제를 입력 프롬프트와 함께 게시하고 있습니다.

"테라피스트의 의자에 앉아 중앙에 구멍이 뚫린 아보카도가 '자신은 속이 비어있는 것 같다'라고 치료사에게 말하는 일러스트. 수저 치료사는 메모 중."

"리치를 이미지 한 구형 의자의 사진. 바깥쪽은 울퉁불퉁하고 하얗고, 안쪽은 호화롭고 배경은 열대 벽지로 되어있다."



"고양이를 부드럽게 포옹하는 소녀를 묘사한 종이 공예 예술. 소녀와 고양이는 화분 식물에 앉아 있고, 고양이는 만족스럽게 목을 맡기고 소녀는 웃고 있다. 수제 종이꽃과 잎으로 채색되어 있다."



"선명한 노란 바나나 모양의 소파가 아늑한 거실에 놓여 있고, 그 곡선에 다채로운 쿠션이 놓여 있다. 구석에는 창문에서 비치는 햇빛을 향해 뻗은 화분이 놓여 있다."



"장엄한 왕관을 쓴 작은 감자의 왕들이 왕좌에 앉아 있고, 감자의 시민과 감자의 성으로 채워진 광대한 감자 왕국을 다스리고 있다."



"흑발에 은빛 근육을 가진 아시아계 중년 여성이 갈라져 부서지고 깨진 도자기의 바닷속에 복잡하게 묻혀 있는 것처럼 보인다. 도자기는 유광, 무광의 파랑, 녹색, 오렌지, 레드가 조화를 이룬 스플래터 페인트 패턴으로 빛나, 움직임과 평온함이 초현실적으로 병렬하는 가운데 그녀의 춤을 포착하고 있다. 그녀의 피부색은 도자기와 같은 옅은 색조로, 그 모습에 신비한 분위기를 더하고 있다."



"성운의 폭발처럼 그려진 농구 선수의 덩크를 표현한 유화"라는 텍스트로 DALL-E 2(오른쪽)와 DALL-E 3(왼쪽)에서 생성한 이미지.



DALL-E 3는 기사 작성 시점에서 리서치 프리뷰 상태로, 2023년 10월 초순에 ChatGPT Plus 및 Enterprise 고객에게 제공될 예정이며, 2023년 가을 후반에는 Labs Open AI에서도 공개된다는 것. 또한 DALL-E 2와 마찬가지로  DALL-E 3에서 생성한 이미지는 고객이 사용 가능하며, 판매 및 상품화 시 OpenAI의 허가는 필요 없다고 OpenAI는 정하고 있습니다.

반응형