이미지 생성 AI DALL-E 2 와 텍스트 생성 AI GPT-3, 대화형 AI ChatGPT를 개발하는 연구 단체 OpenAI가 텍스트에서 3D 객체를 생성하는 AI Point-E 를 오픈소스 화하여 GitHub에 게시했습니다.
GitHub - openai/point-e: Point cloud diffusion for 3D model synthesis
https://github.com/openai/point-e
[2212.08751] Point-E: A System for Generating 3D Point Clouds from Complex Prompts
Point-E는 주로 "텍스트에서 이미지를 생성하는 모델"과 "이미지에서 점군 데이터를 생성하는 모델"의 두 가지로 구성됩니다. 텍스트에서 이미지를 생성하는 모델은 Stable Diffusion 및 OpenAI가 개발한 DALL-E 2와 같은 이미지 생성 AI와 마찬가지로 라벨이 지정된 이미지의 데이터 세트에서 텍스트와 시각적 개념의 연관성을 해석하는 모델입니다.
그리고, 「이미지로부터 점군(Point Cloud) 데이터를 생성하는 모델」은, 3D 오브젝트와 세트로 되어있는 이미지 데이터 세트로부터, 양쪽의 효과적인 변환을 학습한 모델입니다. 다음은 실제로 이미지(왼쪽)에서 점군 데이터(오른쪽)를 생성한 것입니다.
Point-E가 생성하는 3D 객체는 폴리곤(원래 뜻은 다각형이지만 컴퓨터 그래픽에선 주로 삼각형을 의미)을 결합한 것이 아니라 「공간상의 데이터 점(点)의 이산적인 집합」, 즉 입자를 눌러 담은 것 같은 점군 데이터로 생성됩니다. 따라서 Point-E에는 "점군 데이터를 폴리곤 메쉬(polygon mesh : 여러 개의 폴리곤으로 구성된 하나의 객체)로 변환하는 모델"도 포함되어 있습니다.
점군 모델은 폴리곤 메쉬보다 고속으로 생성할 수 있기 때문에, 3D 오브젝트의 생성이 기존의 600배 이상 고속화 되었다고 합니다. 지금까지 NVIDIA V100에서 몇 시간이나 걸리던 계산이 불과 1~2분 만에 끝나게 되었다는 것이 Point-E의 큰 이점입니다.
다만, 물체의 세세한 형상이나 질감을 파악할 수 없다는 단점이 있어, 형상의 일부가 아무래도 블록 형상이 되거나 왜곡되어 버리기도 한다는 것. 아래는 실제로 점군 데이터 생성에 실패해 버린 예.
Point-E 중 텍스트에서 점군 데이터를 생성하는 부분은 온라인 AI 플랫폼인 Hugging Face에서 체험할 수 있습니다. 다만, 대기 순서가 길기 때문에 데모로 준비되어 있는 키워드의 생성에 상당한 시간을 필요로 합니다.
Point E - a Hugging Face Space by openai
실제로 데모에서 a red motorcycle를 입력하여 생성한 3D 객체를 아래의 트윗에서 볼 수 있습니다.
OpenAI released Point-E, a text-to-3D (point clouds) demo ????
— Omar Sanseviero (@osanseviero)
You can check out an open-source demo for it at https://t.co/ophW1YtCT3????Enjoy! The demo uses the lower-quality but much faster version of the model. pic.twitter.com/sJtlo9ASr6
「Palm Tree(야자나무)」로 생성한 3D 오브젝트는 이런 느낌입니다.
Super fun! pic.twitter.com/9FcOo8996p
— Nikolaj Stausbøl (@_staus)
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
AI를 사용하여 악성 코드를 생성하는 "트로이 목마 퍼즐" (0) | 2023.01.12 |
---|---|
Microsoft가 단 3초의 샘플에서 사람 목소리를 재현할 수 있는 음성 합성 AI 'VALL-E'를 발표 (0) | 2023.01.11 |
"AI를 이용해 그림을 그렸다"며 아티스트가 Reddit 최대의 아트 커뮤니티에서 BAN (0) | 2023.01.11 |
GPT-3 기반 AI 변호사가 대법원에서 변론할 예정 (0) | 2023.01.11 |
이미지가 말을 한다!? 이스라엘의 스타트업 기업이 이미지 자동 생성 · 텍스트 리딩 AI를 발표 (0) | 2022.12.22 |
OpenAI가 개발한 텍스트 생성 AI「GPT-3」가 어떤 처리를 하고 있는지 전문가가 해설 (1) | 2022.12.22 |
문장에 따른 악곡을 생성해 주는 AI「Riffusion」등장,「Stable Diffusion」베이스로 누구나 자유롭게 이용 가능 (0) | 2022.12.22 |
OpenAI가 자연어처리 및 이미지생성 AI의 '임베딩 모델'을 쇄신, 성능대비 코스트가 99.8%나 저렴하게 (0) | 2022.12.22 |