![](https://blog.kakaocdn.net/dn/xqfrY/btsBgaZIeu9/EiDiDWmfWMx33kIQTJjWj1/img.png)
대규모 언어 모델(LLM)이 언어를 구사하는 구조를 이용하여 3D 객체를 생성하는 AI 「MeshGPT」가 등장했습니다.
MeshGPT: Generating Triangle Meshes with Decoder-Only Transformers
https://nihalsid.github.io/mesh-gpt/
MeshGPT: Generating Triangle Meshes with Decoder-Only Transformers
We introduce MeshGPT, a new approach for generating triangle meshes that reflects the compactness typical of artist-created meshes, in contrast to dense triangle meshes extracted by iso-surfacing methods from neural fields. Inspired by recent advances in p
nihalsid.github.io
[2311.15475] MeshGPT: Generating Triangle Meshes with Decoder-Only Transformers
https://arxiv.org/abs/4351
Generating Triangle Meshes with Decoder-Only Transformers - YouTube
대규모 언어 모델은 언어를 말할 수 있다는 것 외에, 트레이닝에 따라서는 프로그래밍 언어도 말하게 하는 것이 가능합니다.
![](https://blog.kakaocdn.net/dn/kKjZ3/btsBb7v9icp/EplgehuxAl0MWCkMkdLohk/img.png)
그래서 연구팀은 모델에 대해 3D 객체의 구성요소인 메쉬를 말할 수 있도록 훈련을 실시했습니다.
![](https://blog.kakaocdn.net/dn/79y6o/btsBfhSlrug/p7EFWzTVK44idKL0B3QMoK/img.png)
구체적인 트레이닝의 기법은 이런 느낌.
우선은 다양한 3D 오브젝트의 데이터를 바탕으로 메쉬의 「어휘」를 배워, 다음에 학습한 어휘에 근거해 Transformer를 트레이닝하고 있습니다.
![](https://blog.kakaocdn.net/dn/bmemvS/btsBaWPHsb8/FcB4gG8A4WcyUDtiQWhvYk/img.png)
어휘 학습의 구조는 아래와 같습니다. 신경망이 메쉬의 지오메트리와 토폴로지 정보를 처리할 수 있도록 하고 있습니다.
![](https://blog.kakaocdn.net/dn/erDLBU/btsBa0xL2ap/bp6QkH9xT3oHs76HXIIeZk/img.png)
어휘 학습 후 대규모 언어 모델이 단어와 단어의 연결을 기억하게 하는 것처럼 Transformer가 메쉬와 메쉬의 연결을 기억하게 합니다.
![](https://blog.kakaocdn.net/dn/pyjMf/btsBbFGHSG9/skAPEm0uJG2c4TkATEmOhk/img.png)
대규모 언어 모델이 문장의 연속을 쓸 수 있는 것처럼 MeshGPT는 모델의 일부를 바탕으로 나머지 부분을 완성시킬 수 있습니다.
![](https://blog.kakaocdn.net/dn/bXqYZG/btsBc0KjT7y/xI1qRkacAz8lDLoPrjDLM1/img.png)
MeshGPT는 다른 기법에 비해 정점(頂点: 각을 이룬 두 직선의 꼭짓점)의 수가 너무 많거나 너무 적지 않고 적당히 디테일이 있는 모델을 생성할 수 있다는 것.
![](https://blog.kakaocdn.net/dn/c3AtdG/btsBaWIT4no/UdphcsYfHAk2s2sUkWDJFk/img.png)
제품의 품질을 나타내는 FID 점수가 30포인트 향상되거나 형상 커버리지가 9% 증가하는 등 MeshGPT는 메쉬 생성을 크게 개선할 수 있었다고 합니다.
![](https://blog.kakaocdn.net/dn/3W8AU/btsBgwO07xa/fONKCnA7VOZ7o18qdLjck0/img.png)
LLM의 변용성은 어디까지인가...
![](https://t1.daumcdn.net/keditor/emoticon/friends2/large/044.png)
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
최신 정보에도 대응할 수 있는 GPT, PPLX Online LLMs의 「pplx-7b-online」&「pplx-70b-online」리뷰 (53) | 2023.12.01 |
---|---|
AI와의 공동 창작으로 「블랙 잭」신작을 완성하는「TEZUKA2023 프로젝트」를 주간 소년 챔피언에서 공개 (74) | 2023.12.01 |
ChatGPT에게 단어를 무한 반복시켜 교육에 사용된 방대한 텍스트를 탈취하는 공격 기법이 등장 (1) | 2023.12.01 |
Stable Diffusion을 개발하는 Stability AI가 투자자의 압력을 받아 매각을 검토 중 (1) | 2023.12.01 |
Google DeepMind가 AI 툴을 사용해 220만 종류의 새로운 결정 구조를 발견, 지금까지의 45배 이상 (3) | 2023.12.01 |
월 1400을 버는 AI 모델 「Aitana(아이타나)」가 등장, 저명인으로부터 DM도 받는 인기 모델 (96) | 2023.11.27 |
음성 대응 ChatGPT가 무료로 이용 가능, 개시 직후 서버 다운(현재는 복구 완료) (53) | 2023.11.27 |
AI 아나운서 「iina」, TV 홋카이도의 정보 프로그램에 등장 (1) | 2023.11.27 |