AI기업・Inflection이 개발하고 있는 생성 AI「Pi」는 유저 한 사람에게 최적화된 「퍼스널 AI」입니다. 그런 Pi의 능력을 비약적으로 향상한 기반 모델인「Inflection-2.5」를 Inflection이 발표했습니다.
Inflection-2.5: meet the world's best personal AI
https://inflection.ai/inflection-2-5
Pi는 Android 나 iOS의 스마트폰, 브라우저등을 통해 대화할 수 있는 AI로 한국어에도 대응하고 있습니다.
Inflection에 의하면, Pi는 데일리 액티브 유저수 100만 명, 월간 액티브 유저수 400만 명이 이용하고 있다고 합니다. 또한, 평균 대화 시간은 33분으로, 10명에 1명은 1시간 이상 말을 걸거나, 사용한 유저의 60%는 다음 주에 또 Pi를 사용하고 있다고 하며, 이용자의 만족도 지표에서 경쟁 서비스보다 높은 점수를 내고 있습니다.
Pi의 인기를 지지하고 있는 것이, Pi에 탑재되고 있는 기반 모델인 Inflection-2.5입니다. Inflection-2.5는 트레이닝에 소비된 컴퓨팅량이 GPT-4의 40%, 이전 모델인 Inflection-1에 이르러서는 GPT-4의 4%밖에 안되는데도 멀티태스킹 성능을 측정하는 MMLU(Massive Multi-task Language Understanding)나 대학원 수준의 지식을 요구하는 Google의 벤치마크 GPQA(Baselines and analysis for the Google-proof Q&A)의 최고 수준 데이터 세트 Diamond에서 GPT- 4에 필적하는 점수를 보여주었습니다.
Inflection-2.5는 AI의 수적 처리 능력을 추측하는 데 사용되는 헝가리의 수학 시험(Hungarian Math)이나 북미에서 사용되는 공통 시험 'GRE'의 물리학 문제(Physics GRE)등 STEM 분야에서도 강점을 보여주고 있습니다.
Inflection-2.5는 이과와 수학의 분야뿐만 아니라, 코딩에서도 뛰어난 성적을 거두고 있어, 코딩 벤치마크인 MBPP+와 HumanEval+에서는 Inflection-1로부터 스코어가 대폭 개선되었습니다.
이러한 벤치마크 스코어를 Inflection-1(좌측), Inflection-2.5(가운데), GPT-4(우측)의 막대그래프로 비교하면 다음과 같습니다.
Inflection은 "즉, Inflection-2.5는 Pi의 독특하고 친숙한 성격과 뛰어난 안전 기준을 유지하면서 전체적으로 더욱 유용한 모델이 되었다."라고 코멘트하고 있습니다.
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
AI와 얼굴 인증을 통합한 '인간 사냥 AI 드론'이 불과 몇 시간만에 완성 (58) | 2024.03.13 |
---|---|
실시간으로 팬과 대화하는 'AI 마릴린 먼로'가 탄생 (66) | 2024.03.12 |
중국 CCTV, AI를 활용한 수묵화풍 애니메이션 「천추시송」을 방영 개시 (64) | 2024.03.12 |
AI가 생성한 거근 쥐 이미지의 논문이 게재되어 버린 사건(3일 만에 게재 철회) (66) | 2024.03.11 |
AI 조종으로 각광받는「프롬프트 엔지니어」가 벌써 사라질 위기? (64) | 2024.03.11 |
Midjourney, ChatGPT Plus, DreamStudio, Image Creator는 41%의 비율로 가짜 선거이미지를 생성 (73) | 2024.03.08 |
GPT-4를 뛰어넘는 성능으로 이미지와 문장을 동시에 처리할 수 있는 멀티모달 AI「Claude 3」출시 (71) | 2024.03.06 |
AI에게「스타 트렉의 선장이 되어라」라고 지시하면 더 나은 성능을 발휘하는 것을 발견 (77) | 2024.03.05 |