인간과 구별이 안 되는 자연스러운 문장을 구사하는 AI나 소스 코드를 자동으로 생성하는 AI 등 경이적인 능력을 가진 AI를 많이 개발해 온 OpenAI 가 마인크래프트에서 다이아몬드제 아이템을 10분 이내에 제작할 수 있는 AI를 발표했습니다. 발표된 AI에는 "Video PreTraining(VPT)"라는, 영상을 이용한 기계학습 효율화 방안이 채택되었습니다.
마인크래프트는 돌이나 철 등을 수집하여 아이템을 제작할 수 있습니다. 다이아몬드제 아이템을 만들 때에는 「다이아몬드 광석을 채굴하기 위한 아이템을 크래프트」, 「다이아몬드 광석을 찾아 지하 깊숙이 팔 것」 등의 조작이 필요해, 숙련된 플레이어도 초기 상태에서 다이아몬드제 아이템을 만들기까지 몇 시간이 걸립니다. OpenAI는 인터넷에 존재하는 방대한 수의 마인크래프트 플레이 무비를 AI에게 학습시켜, 단 10분 만에 다이아몬드제 아이템을 크래프트 할 수 있도록 개발했습니다.
AI 학습에는 VPT라고 불리는 기술이 사용되었습니다. 일반적으로 AI 학습에는 인간이 수동으로 라벨을 붙인 대량의 데이터가 사용됩니다. 그러나 이번에는 [어떤 키가 눌렀는가], [마우스를 어떻게 움직였는가] 등의 라벨이 붙은 비교적 단시간의 마인크래프트 플레이 무비를 준비해 AI에 학습시켜 [키, 마우스와 플레이 무비의 대응]을 학습시킨 뒤 라벨을 부여하지 않은 방대한 수의 플레이 무비를 학습시켰습니다.
학습 완료 후의 AI는 미조정 시점에서 [나무를 공격하여 원목을 입수 → 원목을 목재로 가공 → 목재에서 작업대를 공예]라는 플레이가 가능했습니다. 게다가 「수중을 헤엄친다」,「동물을 사냥한다」,「음식을 먹는다」,「점프하면서 소재를 쌓아 올려 위쪽으로 이동한다」 등의 동작도 가능했다고 합니다.
그 후, 최초에 학습시켰던 라벨 붙인 데이터의 재조정을 실시하여 AI의 동작을 최적화해, 다이아몬드제 아이템 제작에 필요한 「철제 곡괭이 만들기」, 「다이아몬드 광석의 발견」 등의 태스크에 보상을 설정해 AI 학습을 진행시켰습니다.
그 결과, 게임 개시로부터 약 10분만에 다이아몬드제 헬멧이나 곡괭이를 만들 수 있는 AI가 완성되었습니다. 마인크래프트로 다이아몬드제 아이템을 만드는 과정은 키보드와 마우스의 조작에 의해 이루어집니다. 이 때문에 OpenAI는 이번 AI 학습에 사용된 노하우가 일반적인 컴퓨터 조작을 담당하는 AI 학습에도 응용될 수 있다고 말하고 있습니다.
또한, AI가 다이아몬드제 아이템을 작성하는 모습은, 아래의 링크에서 영상으로 확인할 수 있습니다.
Learning to Play Minecraft with Video PreTraining (VPT)
github 에서 소스코드도 구경 가능하군요
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
경찰이 '로봇을 사용한 용의자 살해'를 가능하게 하는 것을 목표로 (1) | 2022.11.26 |
---|---|
방대한 과학 지식으로부터 질문에 대답하며 과학 기사나 강의 노트를 만드는 AI「Galactica」를 Meta의 연구자가 일반에 공개 (1) | 2022.11.18 |
뇌에 전극을 찌르지 않아도 '사고'를 실시간으로 읽을 수 있는 AI 기술이 등장 (0) | 2022.10.26 |
DeepMind의 연구자들이「AI가 인류를 멸망시킬 가능성은 높다」는 논문을 발표 (0) | 2022.10.10 |
입김으로 문을 연다? 도쿄 대학, AI와 인공 후각센서를 이용한 생체인증 (0) | 2022.06.19 |
의약품 개발 AI는 화학 무기 개발에 악용 가능한 것으로 밝혀져, 불과 6시간 만에 4만종의 '화학 무기 후보 분자'를 특정 (0) | 2022.03.19 |
1만 6000개의 GPU를 탑재한 세계에서 가장 빠른 AI 슈퍼컴퓨터를 Meta가 구축 중 (0) | 2022.01.25 |
AI가 인간의 얼굴을 좀비로 바꿔주는 무료 사이트 (0) | 2021.12.30 |