대규모 언어 모델(LLM)이 언어를 구사하는 구조를 이용하여 3D 객체를 생성하는 AI 「MeshGPT」가 등장했습니다.
MeshGPT: Generating Triangle Meshes with Decoder-Only Transformers
https://nihalsid.github.io/mesh-gpt/
[2311.15475] MeshGPT: Generating Triangle Meshes with Decoder-Only Transformers
https://arxiv.org/abs/4351
Generating Triangle Meshes with Decoder-Only Transformers - YouTube
대규모 언어 모델은 언어를 말할 수 있다는 것 외에, 트레이닝에 따라서는 프로그래밍 언어도 말하게 하는 것이 가능합니다.
그래서 연구팀은 모델에 대해 3D 객체의 구성요소인 메쉬를 말할 수 있도록 훈련을 실시했습니다.
구체적인 트레이닝의 기법은 이런 느낌.
우선은 다양한 3D 오브젝트의 데이터를 바탕으로 메쉬의 「어휘」를 배워, 다음에 학습한 어휘에 근거해 Transformer를 트레이닝하고 있습니다.
어휘 학습의 구조는 아래와 같습니다. 신경망이 메쉬의 지오메트리와 토폴로지 정보를 처리할 수 있도록 하고 있습니다.
어휘 학습 후 대규모 언어 모델이 단어와 단어의 연결을 기억하게 하는 것처럼 Transformer가 메쉬와 메쉬의 연결을 기억하게 합니다.
대규모 언어 모델이 문장의 연속을 쓸 수 있는 것처럼 MeshGPT는 모델의 일부를 바탕으로 나머지 부분을 완성시킬 수 있습니다.
MeshGPT는 다른 기법에 비해 정점(頂点: 각을 이룬 두 직선의 꼭짓점)의 수가 너무 많거나 너무 적지 않고 적당히 디테일이 있는 모델을 생성할 수 있다는 것.
제품의 품질을 나타내는 FID 점수가 30포인트 향상되거나 형상 커버리지가 9% 증가하는 등 MeshGPT는 메쉬 생성을 크게 개선할 수 있었다고 합니다.
LLM의 변용성은 어디까지인가...
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
최신 정보에도 대응할 수 있는 GPT, PPLX Online LLMs의 「pplx-7b-online」&「pplx-70b-online」리뷰 (53) | 2023.12.01 |
---|---|
AI와의 공동 창작으로 「블랙 잭」신작을 완성하는「TEZUKA2023 프로젝트」를 주간 소년 챔피언에서 공개 (74) | 2023.12.01 |
ChatGPT에게 단어를 무한 반복시켜 교육에 사용된 방대한 텍스트를 탈취하는 공격 기법이 등장 (1) | 2023.12.01 |
Stable Diffusion을 개발하는 Stability AI가 투자자의 압력을 받아 매각을 검토 중 (1) | 2023.12.01 |
Google DeepMind가 AI 툴을 사용해 220만 종류의 새로운 결정 구조를 발견, 지금까지의 45배 이상 (3) | 2023.12.01 |
월 1400을 버는 AI 모델 「Aitana(아이타나)」가 등장, 저명인으로부터 DM도 받는 인기 모델 (96) | 2023.11.27 |
음성 대응 ChatGPT가 무료로 이용 가능, 개시 직후 서버 다운(현재는 복구 완료) (53) | 2023.11.27 |
AI 아나운서 「iina」, TV 홋카이도의 정보 프로그램에 등장 (1) | 2023.11.27 |