본문 바로가기
AI · 인공지능/AI 뉴스

GPT-4를 뛰어넘는 성능으로 이미지와 문장을 동시에 처리할 수 있는 멀티모달 AI「Claude 3」출시

by 두우우부 2024. 3. 6.
반응형

 
 
전 OpenAI 엔지니어가 설립한 AI 스타트업인 Anthropic이 대규모 언어 모델인 「Claude 3」를 발표했습니다.

Introducing the next generation of Claude \ Anthropic
https://www.anthropic.com/news/claude-3-family

Introducing the next generation of Claude

Today, we're announcing the Claude 3 model family, which sets new industry benchmarks across a wide range of cognitive tasks. The family includes three state-of-the-art models in ascending order of capability: Claude 3 Haiku, Claude 3 Sonnet, and Claude 3

www.anthropic.com



Claude 3의 모델은 저렴하고 비용 효율적인 "Haiku", 비용과 성능을 균형 잡힌 "Sonnet", 그리고 고가의 고성능 "Opus"라는 세 가지 변형으로 나뉩니다.



다양한 벤치마크에 있어서 경합과 스코어 비교를 행한 결과입니다. 최상위 모델인 Claude 3 Opus는 모든 벤치마크에서 최고의 점수를 기록했습니다.



사진, 차트, 그래프, 기술도 등의 비전 기능에 대한 벤치마크 결과는 아래 그림과 같습니다. 최상위 모델인 Claude 3 Opus는 GPT-4V를 모든 벤치마크 결과에서 능가합니다.



기존 모델에서는 무해한 프롬프트인데도 실수로 거절해 버리는 것이 문제가 되었습니다만, Claude 3에서는 대폭 개선하고 있습니다.


또한 기존 모델의 약점이었던 '복잡하고 어려운 질문'에 제대로 대답할 확률이 대폭 상승했습니다.


Claude 3의 모델은 20만 토큰까지의 컨텍스트 길이에 대응하고 있으며, 이러한 긴 컨텍스트를 효율적으로 처리하려면 재현율(Recall)이 중요합니다. 최상위 모델인 Claude 3 Opus는 정확도 99%를 넘는 거의 완벽한 재현율을 달성할 수 있었다고 합니다.


100만 토큰당 요금은 Haiku 모델이 입력 0.25달러, 출력 1.25달러. Sonnet 모델이 입력 3달러, 출력 15달러. Opus 모델이 입력 15달러, 출력 75달러입니다. 또, 어느 모델에서도 유즈 케이스에 따라서는 100만 토큰까지 문맥 윈도를 확장하는 것도 가능하다는 것.

Sonnet과 Opus 모델은 이미 Claude API를 통해 일반 제공을 시작했으며 Haiku의 일반 제공은 곧 시작될 예정입니다.

반응형