전 OpenAI 엔지니어가 설립한 AI 스타트업인 Anthropic이 대규모 언어 모델인 「Claude 3」를 발표했습니다.
Introducing the next generation of Claude \ Anthropic
https://www.anthropic.com/news/claude-3-family
Claude 3의 모델은 저렴하고 비용 효율적인 "Haiku", 비용과 성능을 균형 잡힌 "Sonnet", 그리고 고가의 고성능 "Opus"라는 세 가지 변형으로 나뉩니다.
다양한 벤치마크에 있어서 경합과 스코어 비교를 행한 결과입니다. 최상위 모델인 Claude 3 Opus는 모든 벤치마크에서 최고의 점수를 기록했습니다.
사진, 차트, 그래프, 기술도 등의 비전 기능에 대한 벤치마크 결과는 아래 그림과 같습니다. 최상위 모델인 Claude 3 Opus는 GPT-4V를 모든 벤치마크 결과에서 능가합니다.
기존 모델에서는 무해한 프롬프트인데도 실수로 거절해 버리는 것이 문제가 되었습니다만, Claude 3에서는 대폭 개선하고 있습니다.
또한 기존 모델의 약점이었던 '복잡하고 어려운 질문'에 제대로 대답할 확률이 대폭 상승했습니다.
Claude 3의 모델은 20만 토큰까지의 컨텍스트 길이에 대응하고 있으며, 이러한 긴 컨텍스트를 효율적으로 처리하려면 재현율(Recall)이 중요합니다. 최상위 모델인 Claude 3 Opus는 정확도 99%를 넘는 거의 완벽한 재현율을 달성할 수 있었다고 합니다.
100만 토큰당 요금은 Haiku 모델이 입력 0.25달러, 출력 1.25달러. Sonnet 모델이 입력 3달러, 출력 15달러. Opus 모델이 입력 15달러, 출력 75달러입니다. 또, 어느 모델에서도 유즈 케이스에 따라서는 100만 토큰까지 문맥 윈도를 확장하는 것도 가능하다는 것.
Sonnet과 Opus 모델은 이미 Claude API를 통해 일반 제공을 시작했으며 Haiku의 일반 제공은 곧 시작될 예정입니다.
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
AI가 생성한 거근 쥐 이미지의 논문이 게재되어 버린 사건(3일 만에 게재 철회) (66) | 2024.03.11 |
---|---|
GPT-4의 절반 이하의 계산으로 거의 동등한 IQ를 가지는 퍼스널 AI「Pi」와 기반 모델「Inflection-2.5」가 등장 (59) | 2024.03.11 |
AI 조종으로 각광받는「프롬프트 엔지니어」가 벌써 사라질 위기? (64) | 2024.03.11 |
Midjourney, ChatGPT Plus, DreamStudio, Image Creator는 41%의 비율로 가짜 선거이미지를 생성 (73) | 2024.03.08 |
AI에게「스타 트렉의 선장이 되어라」라고 지시하면 더 나은 성능을 발휘하는 것을 발견 (77) | 2024.03.05 |
ChatGPT 등 채팅 AI의 보안 기능을 파괴하는 멀웨어 「Morris II」가 등장 (4) | 2024.03.05 |
Microsoft가 1.58비트 LLM을 출시, 행렬 계산을 더하여 계산 비용을 급감 (72) | 2024.03.04 |
LLM의 동작을 Excel에서 완벽 재현하여 AI 구조를 학습하는 시트가 등장 (71) | 2024.03.04 |