Google DeepMind가 멀티모달 AI 「Gemini」를 출시했습니다.
문자 · 음성 · 이미지를 동시에 처리하는 것이 가능하고, 최상위 모델에서는 GPT-4를 넘는 성능을 달성하고 있습니다.
Gemini - Google DeepMind
Introducing Gemini: Google의 most capable AI model yet
Gemini는 "Ultra, Pro, Nano"라는 세 가지 모델로 출시되었습니다.
각 모델은 아래와 같습니다.
· Gemini Ultra
매우 복잡한 작업을 지원하는 가장 크고 유능한 모델, 2024년 이후에나 이용 가능 예정.
· Gemini Pro
다양한 작업에 대응하기 위한 최상의 모델. 발표와 동시에 Google의 채팅 AI인 'Bard'가 Gemini Pro 기반으로 업그레이드되어 이미 사용 중.
· Gemini Nano
장치에서 작업을 위한 가장 효율적인 모델. 발표와 동시에 Pixel 8 Pro에서 사용 중.
이 중 최상위 모델인 "Gemini Ultra"의 성능은 아래 그림과 같습니다. 일반적인 성능을 측정하는 벤치마크 ' MMLU '에서 GPT-4뿐만 아니라 인간 전문가를 뛰어넘는 점수를 내고 있으며, 많은 지표에서 GPT-4를 웃돌았습니다.
Gemini는 멀티 모달 AI로 문자뿐만 아니라 이미지, 영상, 음성을 동시에 처리할 수 있습니다. 멀티모달 관련 벤치마크에서는 모든 지표에서 GPT-4V를 웃돌았습니다.
실제로 Gemini를 사용하여 성능을 확인하는 핸즈 온 무비가 공개되어 있습니다.
Hands-on with Gemini: Interacting with multimodal AI - YouTube
Gemini는 이미 Pro 모델이 Bard에 탑재되어 있으며, Pixel 8 Pro에서 Nano 모델을 사용할 수 있습니다. 개발자를 위한 Gemini API는 2023년 12월 13일부터 제공 예정으로, API 경유로 Gemini Pro에 액세스 할 수 있다는 것. Gemini Ultra에 대해서는 2024년 이후 제공 예정이라고 합니다.
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
무료로 상용 이용도 가능한 대규모 언어 모델 「Mixtral 8x7B」가 등장 (3) | 2023.12.13 |
---|---|
Google이 Gemini Pro와 Palm 2를 탑재한 메모 작성 앱 'NotebookLM'을 실험적으로 출시 (65) | 2023.12.12 |
AI 모델 「Gemini Pro」로 대폭 강화된 Bard를 이용 가능 (4) | 2023.12.08 |
Google의 멀티모달 AI「Gemini」에 기반한 프로그래밍 특화 AI「AlphaCode 2」가 등장(상위 15%의 성능) (63) | 2023.12.08 |
워싱턴 대학과 프린스턴 대학이 LLM에서 사전 학습된 문장을 검출하는 새로운 도구를 발표 (65) | 2023.12.06 |
Amazon의 AI 'Amazon Q'는 심각한 환각으로 AWS 데이터센터의 위치 등의 기밀 데이터를 유출하고 있다는 지적 (2) | 2023.12.06 |
구글 DeepMind가 "AI는 인간처럼 사회 학습으로 기술을 습득할 수 있다"는 것을 입증했다고 주장 (3) | 2023.12.06 |
대규모 언어 모델의 구조를 3D로 시각화하는 사이트 「LLM Visualization」 (4) | 2023.12.05 |