본문 바로가기
AI · 인공지능/AI 뉴스

'AI를 사용하여 동물과 커뮤니케이션'을 하려는 시도가 Google의 협력으로 진행 중

by 두우우부 2023. 4. 26.
반응형



최근에는 AI를 이용한 이미지 생성과 고성능 채팅이 주목을 받고 있지만, AI는 예술뿐만 아니라 다양한 과학적 연구에 도움이 될 가능성을 가지고 있습니다. 새롭게, Google의 클라우드 서비스인 Google Cloud가, 기계 학습을 이용해 동물과의 커뮤니케이션을 실현하려고 하는 비영리 단체·Earth Species Project의 대처에 대해 블로그에서 소개했습니다.

Can generative AI lead people to understand animals? | Google Cloud Blog

Can generative AI lead people to understand animals? | Google Cloud Blog

The Earth Species Project is using large language models to develop tools to decipher animal communication.

cloud.google.com



최근에는 AI를 이용하여 동물의 소리를 분석하는 연구가 주목을 받고 있으며, 고래의 노래를 해석해 대화를 시도하는 프로젝트 「CETI(Cetacean Translation Initiative:고래 번역 계획)」가 해양학자나 AI 연구자에 의해 진행되고 있는 것 외에, 새의 소리를 녹음해 AI로 새의 종류를 식별하는 앱도 등장하고 있습니다.

Earth Species Project는 2018년 머신러닝을 이용하여 지구에 서식하는 다양한 동물을 보다 잘 이해하고 커뮤니케이션을 취할 목적으로 설립된 비영리단체입니다. Earth Species Project의 공동 창립자인 Aza Raskin 씨는 "인간의 이해력은 사물을 지각하는 능력에 따라 제한된다. AI가 하는 것은 우리가 지각할 수 있는 범위를 넓히는 일입니다."라고 말합니다.

「정말 인간 이외의 동물도 언어적인 커뮤니케이션을 취하고 있는 것인가?」라는 의문도 있습니다만, 새의 노래는 세대를 넘어 전승되고 있으며, 마치 인간의 신곡 유행가처럼 새로운 노래가 3000km의 거리를 건너가 유행한다는 것도 연구에 의해 밝혀지고 있습니다. 또한, 침팬지의 울음소리를 대량 분석해, 12가지의 다른 울음소리를 조합하여 390가지의 구문을 만들고 있다는 사실도 밝혀냈습니다.



Raskin 씨는 울음소리로 의사 소통하는 고래와 돌고래가 3,400만 년 동안 문화와 노래를 전해왔을 가능성이 있으며, 인간은 거기에서 배울 수 있다고 생각합니다. Earth Species Project는 동물과의 커뮤니케이션을 실현하기 위해 LaMDA와 같은 대규모 언어 모델을 연구에 이용하기 위한 노력을 추진하고 있습니다.

동일한 번역 시스템을 구축하더라도 인간의 언어와 동물의 언어에는 큰 차이가 있습니다. 그것은 인간의 경우는 각각 다른 언어를 사용하는 사람끼리 "이 말이 무엇을 의미하고 있는가"라는 공통의 이해를 구축하고 번역을 진행할 수 있지만, 동물의 언어는 그것이 어렵다는 점입니다. 그러나 수십 년에 걸쳐 축적되어 온 동물의 울음소리에 대한 연구 결과와 AI의 뛰어난 패턴 인식 능력을 이용함으로써 동물의 울음소리를 해독하는 것이 가능해져 가고 있다는 것.

Earth Species Project는 생성 AI의 기초가 된 자연어 모델의 "기계 학습을 통해 단어의 의미 관계를 기하학적 관계로 변환할 수 있으며 단어를 개념 간의 관계로 정의할 수 있다."는 점에서 착상을 얻고 있습니다.

예를 들어, "DOG(개)"라는 단어는 "Man(사람)", "Cat(고양이)", "Wolf(늑대)", "Fur(모피)", "Yelp(쐐기)"라는 단어와 연관되어 있으며 단어 사이의 관계를 시각적 맵으로 나타낼 수 있습니다.



이 단어 간의 관계 패턴은 다른 언어 간에도 유사성이 있으며, spanish(스페인어)이든 english(영어)이든 japanese(일본어)이든, 「개」라는 단어는 맵상의 거의 같은 장소에 표시된다고 합니다. Raskin 씨는 "AI의 구조에 대해 1개만 유념해 둬야 한다면, 그것은 「의미적인 관계를 기하학적 관계로 바꾼다」라는 것입니다. 이것이 핵심 개념입니다."라고 말했습니다.



Google Cloud는 머신러닝 강화에 사용하는 컴퓨팅 리소스를 제공하여 Earth Species Project를 지원하고 있으며, Google의 음성 언어 모델링 팀도 Earth Species Project와 상호 작용하고 있다고 합니다. Raskin 씨는 12개월 ~ 36개월 이내에 제너레이티브 AI에 의한 음성을 이용하여 동물과 커뮤니케이션을 취할 수 있게 될 것으로 추측하고 있습니다. AI는 패턴 인식에 의해 동물의 울음소리에 응답할 수 있기 때문에, 인간에게 무엇을 말하고 있는지 이해할 수 없는 상태에서도 동물과 AI의 커뮤니케이션이 성립될 가능성이 있다는 것입니다.

반응형