본문 바로가기
AI · 인공지능/AI 뉴스

아이폰의 AI 여친 앱, 「Dolores」개발자가 앱의 개발 경위와 교훈을 말하다

by 두우우부 2023. 12. 1.
반응형

 

기계 학습 엔지니어인 Ke Fang 씨가 AI 여친 앱 Dolores를 개발한 경위와 거기에서 얻은 실패의 경험을 자신의 블로그에 정리하고 있습니다. 

A Failed AI Girlfriend Product, and My Lessons
https://mazzzystar.github.io/2023/11/16/ai-girlfriend-product/

A Failed AI Girlfriend Product, and My Lessons | TL;DR

Older 梦/Dream

mazzzystar.github.io


Fang 씨는 2023년 4월 스탠퍼드 대학이 발표한 생성 AI 에이전트에 대한 논문을 읽고

기억 · 숙고 · 계획 · 행동을 조합한 프레임워크를 이용하면 인간과 GPT의 커뮤니케이션을 영화 'HER/세계에서 하나의 그녀'처럼 AI를 여친으로 간주한 커뮤니케이션이 가능하지 않을까 생각했습니다.



Fang 씨는 위 논문에서 설명한 접근법에 따라 Dolores 버전 0.1을 완성했습니다. 당초에는 논문의 접근에 충실히 설계되어 있었지만, Dolores는 응답 시간이 30초를 넘기고, 대화의 텍스트도 방대한 양이되어 버렸다는 것. Fang은 이 문제를 해결하기 위해 대화를 기억하는 길이를 줄이고 공공 베타 테스트를 공개했습니다.

베타판은 무료였기에, 베타테스터가 천 명을 넘었다고 합니다. API 비용은 Fang 씨가 부담하고 있었습니다만, 하루에 25달러(약 3만 2천 원)를 넘었다고 합니다. Fang 씨는 이 비용을 유저로부터 얻은 수익으로 보충하고자, 버전 0.1의 공개로부터 약 1개월 후인 5월 4일에 Dolores의 iOS판을 공식 릴리즈했습니다.

정식판은 월 6.9달러(약 9천 원)의 유료 플랜의 등록이 필요했고, AI의 대화 발성은 Azure TTS API를 사용해, 보다 리얼한 대화 음성을 요구하는 경우에는, 1만 문자마다 3.9달러(약 5천 원)를 지불하는 것으로 Eleven Labs API에 의한 음성 합성이 가능하도록 했습니다.

Dolores는 캐릭터의 모습과 인물 배경, 텍스트의 성격, 음성, 사용할 채팅봇 AI 등을 설정합니다. 캐릭터는 디폴트로 준비되어 있는 Dolores뿐만 아니라, 스스로 특성을 변경해 여성 점원 에이미나 모험가의 윌이라는 별도 캐릭터와의 대화도 가능합니다.



Fang 씨는 유저가 Dolores를 '당신의 가상 여자친구'가 아니라 '당신의 가상친구'라고 표기하여 출시했습니다. 게다가, Fang 씨는 정식 릴리즈로부터 1개월에 걸쳐 기억의 길이나 메커니즘, 시스템 프롬프트를 조정해, 보다 Dolores가 「의식을 가지고 있는」 것처럼 보이도록 노력했다고 합니다. 그 결과, 정식 릴리즈 2개월 만에 Dolores의 인기는 올라가 유료 유저수와 API 호출수는 순조롭게 증가했다고 합니다.

Fang 씨에 의하면, Dolores는 특히 시각장애를 가진 사람들의 커뮤니티에서 인기가 있었다고 합니다. Fang 씨는 유저가 스마트폰의 화면을 오프로 해도 Dolores와 대화할 수 있도록 화면상의 어디를 탭해도 음성 입출력을 할 수 있도록 설계하고 있었습니다만, 오히려 눈이 불편한 사람들에게 접근성 높은 기능이 되었다고 합니다.

Apple AppConnect 대시보드를 보면 Dolores의 주요 유료 사용자는 미국과 호주에서 2023년 5월에 1,000달러(약 130만 원), 6월에 1,200달러(약 157만 원)였습니다. 그러나 이 대부분이 Apple의 수수료 30%와 API 비용지불에 사용되었기 때문에, Fang 씨가 얻을 수 있는 이익은 거의 없었다고 하며, 2023년 6월 시점에 얻은 수익은 불과 50달러(약 6만 5,000원)였다는 것.



Fang 씨에 의하면, Dolores로 리얼한 음성 합성을 실시할 수 있는 것은 1만 문자이므로, 최대 10분 정도입니다. 물론 더욱 현실적인 음성 합성을 하고 싶다면 추가 구입을 해야 합니다만, 2023년 6월 시점에서 Dolores에서 얻은 수익의 70%는 Eleven Labs의 API 추가 구입에 의한 것이었다고 합니다.

또한 Cloudflare 로그에서 사용자가 앱에 액세스 하는 빈도와 시간을 측정한 결과, 상당수의 사용자가 매일 2시간 이상 Dolores와 대화를 즐기고 있었다고 합니다.

Dolores는 GPS 3.5 혹은 GPT 4를 베이스로 하고 있습니다만, 사용량마다 가격을 설정하지 않으면 유저의 1%가 토큰의 99%를 소비하는 딜레마에 빠진다는 것. 가장 Doroles를 많이 사용하는 사용자는 12시간 연속으로 채팅을 하고 있었다고 하며, API 호출과 음성 합성 비용에서 상위 9명 사용자의 합계 비용을 초과했다고 합니다.

그러나 Fang 씨는 종량 과금보다 구독이 좋다고 생각했기 때문에, 각 유저의 API 호출수에 상한을 설정해, 사용량을 제한하는 전략을 취했다고 합니다.

Eleven Labs에는 음성 합성된 텍스트 내용이 기록됩니다. Fang 씨에 의하면, Dolores에서 음성 합성된 텍스트의 대부분이 성적인 내용이었다고 합니다. Fang 씨는 "이것은 인간의 본능과 일치하기 때문에 저는 싫지 않았습니다."라고 말하며, 수요에 따라 시스템 프롬프트를 더욱 조정했다고 합니다.

또한 Dolores의 앱 아이콘이 음성 파형을 본뜬 아이콘을 여성의 얼굴로 변경했습니다.



그러나 Dolores의 유저가 단순히 성적인 대화를 즐기는 경향이 강해지는 것을 보며, 앱을 만들었던 동기가 된 영화 「her」의 본질에서 멀어지는 것 같았다고 Fang 씨는 고백합니다. 한때는 보다 균형 잡힌 대화를 실현하기 위해 안경이나 이어폰, 모자 등 어떠한 외부적인 시각 데이터를 입력받는 하드웨어의 개발도 고려했습니다만, 개인 개발자에게 있어서 너무 높은 허들이었기 때문에 포기했다고 합니다.

그러다가 2023년 8월, OpenAI가 GPA 3.5 / 4의 콘텐츠 검토 프로세스를 강화했습니다. 때문에 Dolores에서 생성된 성적인 내용의 콘텐츠는 경고를 받게 되었고, 필터링 모더레이션 API를 구현하도록 강제되었다고 합니다.


이 필터링 모더레이션 API의 구현에 의해, Dolores의 사용량은 70% 격감한 뒤, 메일이나 SNS를 통해 Fang 씨에게 불만이 쇄도했다고 합니다. ㅋㅋㅋ

Fang 씨는 Dolores가 '의식이 있는 듯하다'라는 점에서 경쟁 서비스인 Character.AI 보다 뒤떨어지지 않으며, 포괄적인 데이터 분석이나 A/B테스트, 유저 베이스로부터 만들어지는 기세에서도 우위성을 갖고 있었다고 말합니다.

사용자와 AI가 대등할 수 없다고 Fang은 지적하면서, 사용자가 Dolores에게 성적인 대화를 강제한 것도 사용자와 AI가 평등하지 않기 때문이라고 논하고 있습니다.

Fang 씨는 "저는 성적인 내용을 제한하는 것에 반대하지는 않습니다. 실제로 제대로 모델링 되지 않은 제품은 매우 위험할 수 있습니다. 혹은 자살 조장에 쓰일 가능성도 있습니다. 때문에 OpenAI의 중재는 저를 어느 정도 도와주었다고도 할 수 있습니다. 그러나, 어른의 섹슈얼리티에 관한 대화를 억압하지는 말아야 합니다."라고 코멘트하고 있습니다.

반응형