미국의 소프트웨어 개발자인 Izzy Miller 씨는, 「친한 친구들의 단톡방」을 통째로 AI로 재현하는 프로젝트를 진행하고, 그 과정 및 결과를 보고했습니다.
Replacing my best friends with an LLM trained on 500,000 group chat messages
https://www.izzy.co/blogs/robo-boys.html
Miller 씨는 대학 시절의 가장 친한 친구 5명과 아이폰 iMessage의 그룹 채팅을 공유하고 있으며, 지난 7년간 활발하게 메시지를 주고받고 있다는 것. 2023년 3월 어느 날, Miller 씨는 대규모 언어 모델로 그룹 채팅을 재현하는 놀이에 착수하기 시작했습니다.
이번 언어 모델을 작성함에 있어 Miller 씨는 5명의 가장 친한 친구 각각에 대응하는 모델을 작성하는 것이 아니라, 그룹 채팅 전체의 대화를 모방하는 하나의 모델을 만드는 방침으로 했습니다. 이 이유에 대해 Miller 씨는 그룹 채팅의 본질을 더 쉽고 저렴하게 파악할 수 있을 것이라 느꼈기 때문이라고 설명합니다.
그룹 채팅에서 추출할 수 있는 활성 메시지는 모두 48만 8,000건에 달했다고 합니다. 이러한 메시지를 언어 모델로 훈련시키기 위해 Miller 씨는 각 메시지를 누가 발언한 것인지를 분류하고 메시지를 일련의 대화 섹션으로 나누어야 했습니다.
Miller 씨는 데이터 분석 서비스인 Hex에서 iMessage에서 메시지를 추출하고, 미세 조정하는 프로젝트를 작성하여 메시지를 언어 모델 교육에 적합한 형식으로 변환했습니다. 덧붙여 Miller 씨가 작성한 Hex 프로젝트는 공개되어 있어 누구라도 사용할 수 있습니다만, Miller 씨는 보안의 관점에서 플랫폼상이 아닌 로컬에 카피하여 작업할 것을 추천하고 있습니다.
그리고 Miller 씨는 스탠퍼드 대학이 Meta의 대규모 언어 모델 "LLaMA"의 7B 모델을 미세 조정한 모델 "Alpaca"를 사용하여 그룹 채팅을 모방하는 언어 모델을 만들었습니다.
트레이닝을 위해 NVIDIA의 A100을 4대 렌탈하고 모델 배포에는 인프라와 구성을 관리하지 않고 로컬 코드를 클라우드에 배포할 수 있는 Modal을 사용했다고 합니다.
GPT-3.5에 필적하는 채팅 AI를 구축 가능한 모델 "Alpaca 7B"를 스탠포드 대학이 공개, 오픈 소스로 저렴하게 재현 가능
실제로 그룹 채팅을 모방한 모델 「robo boys」가 재현한 대화가 아래입니다. 미국의 권리 장전에 대한, 별 것도 아닌 것에 대한 대화를 친구끼리 난폭한 말투로 나누고 있습니다.
Miller씨는 「robo boys」를 친구들에게 보여주려고 했습니다만, 단순히 위와 같은 스크린샷 만으로는 부족했다고 합니다. 그래서 Miller는 실제 iMessage 그룹 채팅을 모방한 인터페이스를 구축하기로 결정했습니다.
Twilio와 같은 서비스를 이용하여 실제로 iMessage의 그룹 채팅을 만드는 방안도 있었지만, 이것은 매우 복잡하고 비쌌습니다. 거기서 Miller 씨는 GitHub에 존재하는 「iMessage의 클론」을 미조정해, 나름대로의 iMessage 클론을 작성했습니다. 덧붙여 Miller 씨가 작성한 클론은 장래의 유지보수에 대해서 아무것도 생각하지 않고, 불과 45분 만에 작성한 것이며, 그 퀄리티에 대해서는 보증할 수 없다고 합니다.
실제로 Miller 씨가 작성한 「robo boys」의 그룹 채팅이 아래.
직접 메시지를 게시할 수도 있습니다.
"Who of our friends you think is actually an extraterrestrial in disguise?(실은 지구외 생명체라고 생각하는 녀석 있어?)"라는 질문에 대하여.
"I think Wyatt may have been an alien in a past life(와이어트는 전생에 외계인 이었을거야)"라고 회신.
게다가 다른 친구가 "I think that's strong take. I've had that thought before.(쌉가능. 전에 그렇게 생각한 적 있지)"라고 대답하고, 한술 더 떠서 "He does look a bit like a grey(생긴게 꼭 그레이(로스웰 UFO 추락 사건 이후로 미국 대중매체에 의해 잘 알려진 이미지의 휴머노이드형 외계인)같다)"라고 답해, 친구끼리의 바보 같은 대화를 재현하고 있습니다.
원래 Miller 씨는 친구들의 재현도를 높이기 위해 임베디드 데이터베이스를 만드는 것도 검토하고 있었지만, 학습시킨 그룹 채팅 메시지에 친구들의 방대한 정보가 포함되어 있었기 때문에, 더 손댈 필요도 없었다는 것.
아래 스크린샷은 '누가 헨리의 맥주를 마셨는가?'라는 친구들 밖에 모르는 과거의 에피소드에 대해 'robo boys'가 대화하고 있는 모습입니다.
Miller 씨는, 「친구끼리의 그룹 채팅을 AI로 재현한다」라는 무의미하고도 복잡한 프로젝트가, AI를 이해하는 데 있어서 딱 좋은 소재라고 생각하고 있습니다. "이것은 인공 지능에 대한 훌륭한 입문이며, 모두가 파멸을 의식하는 거대한 공포의 기술을 가까이에서 느낄 수 있는 방법입니다."라고 Miller 씨는 말했습니다.
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
Stability AI가 오픈 소스로 상용 이용도 가능한 대규모 언어 모델 「StableLM」을 릴리즈 (0) | 2023.04.21 |
---|---|
Meta가 영상 처리 모델 「DINOv2」를 발표, 장래에는 프롬프트로 VR 환경도 만들 가능성 (0) | 2023.04.19 |
무료로 상용 이용도 가능한 완전 오픈소스 대규모 언어 모델 「RedPajama」가 트레이닝 데이터 세트를 공개 (0) | 2023.04.19 |
일론 머스크가 새로운 채팅 AI 'TruthGPT' 개발을 발표, '우주의 본질을 밝히는 것'이 목표 (0) | 2023.04.19 |
페이크 정보부터 전투용 자율주행차까지, 우크라이나 전쟁에 사용된 군용 AI 총정리 (1) | 2023.04.18 |
GPT-4는 라벨링 작업에서 엘리트급 인간만큼 유능, 약 2만 시간 + 6억 이상을 절약 (0) | 2023.04.18 |
이미지 생성 AI로 만든 이미지가 사진 콘테스트에서 우승 (0) | 2023.04.18 |
"AI 훈련에 악곡이 사용되는 것을 막아달라"고 유니버설 뮤직 그룹이 Spotify나 Apple Music에 요구 (0) | 2023.04.17 |