본문 바로가기
AI · 인공지능/AI 뉴스

Google이 고성능이면서 빠른 경량 AI 모델 「Gemini Flash」 를 발표

by 두우우부 2024. 5. 16.
반응형

 

Google이 경량이면서 고성능인 AI 모델  「Gemini Flash」 를 2024년 5월 15일(수)에 개최된  「Google I/O 2024」 에서 발표했습니다. Gemini Flash는 Gemini Pro의 10분의 1 가격으로 사용할 수 있으며, 벤치마크 테스트는 Gemini Pro에 필적하는 성능을 보여주었습니다.

Gemini Flash - Google DeepMind

Gemini Flash

Our lightweight model, optimized for when speed and efficiency matter most, with a context window of up to one million tokens.

deepmind.google


Gemini Flash는 API를 통해 작동하는 Gemini 시리즈 중 가장 가벼운 모델입니다. Gemini Flash는 처리 속도를 강조하여 개발되었으며 개발자 및 엔터프라이즈의 일반적인 용도에서는 평균 대기 시간이 1초 미만입니다. 또한 Gemini Flash의 컨텍스트 창은 100만 토큰으로 "1시간의 동영상", "11시간의 음성", "3만행 이상의 코드"와 같은 방대한 데이터를 처리할 수 있습니다.

Gemini 시리즈의 벤치마크 결과가 아래. Gemini Flash는 Gemini 1.0 Pro 점수를 크게 능가하고 일부 테스트에서는 Gemini 1.5 Pro 점수를 능가합니다.



Gemini Flash는 Gemini API와 Vertex AI에서 사용할 수 있습니다. Gemini API는 무료로 사용할 수 있으며 요금 제한이 완화된 유료 플랜도 제공됩니다. 유료 플랜의 요금은 12만 8000 토큰 이내의 프롬프트의 경우 100만 토큰당 0.35달러로, 12만 8000 토큰을 초과하는 프롬프트의 경우 100만 토큰당 0.70달러 입니다. 두 가격 모두 Gemini Pro의 10분의 1입니다.

Gemini Flash의 유료 플랜은 2024년 5월 30일(목)부터 이용 가능합니다.

또한 Gemini Flash 발표와 동시에 Gemini Pro 업데이트도 발표되었습니다.

반응형