대화형 AI는 때로는 진실이 아닌 일을 진실처럼 말하는 'hallucination(환각)'을 일으킬 수 있습니다.
이에, 방대한 수의 API 중 적절한 호출을 통해 환각을 대폭 줄일 수 있는 언어 모델 「Gorilla」를 미국 캘리포니아 대학 버클리교와 Microsoft Research의 연구팀이 공개했습니다.
Gorilla: Large Language Model Connected with Massive APIs
https://arxiv.org/abs/2305.15334
Gorilla
https://gorilla.cs.berkeley.edu/
대규모 언어 모델은 최근 놀라운 발전을 이루고 있으며, 프로그래밍 코드를 작성하거나 긴 문장을 정확하게 요약하는 등 다양한 작업에서 뛰어난 능력을 발휘하고 있습니다. AI는 외부의 API를 호출해 이용하는 것도 가능합니다만, 지금까지의 AI는 방대한 양의 API 중에서 적절한 것을 선택해, 효과적으로 이용하는 것이 어려웠다는 것.
연구팀은 "이것은 GPT-4와 같은 최첨단 대규모 언어 모델조차도 어려운 과제입니다. 주된 이유는 "정확한 입력 인수를 생성할 수 없다는 것입니다. API 호출의 잘못된 사용법을 「환각」해 버리는 경향이 있는 것입니다."라고 지적합니다.
그래서 연구팀은 API 호출 기술에 있어서 GPT-4의 성능을 능가하도록 조정된, Meta가 개발한 대규모 언어 모델 「LLaMA(Large Language Model Meta AI)」기반의 모델인 「Gorilla」를 출시했습니다.
Gorilla는 문서화된 수많은 API 중에서 적절한 것을 선택하는 검색 기능을 가지고 있으며, 자연어 쿼리에서 의미적으로나 구문적으로 올바르게 API를 호출하고, API 문서의 업데이트 및 버전 변경에 유연하다는 것.
또한, Gorilla는 대규모 언어 모델로 직접 프롬프트를 출력할 때 발생하는 환각도 대폭 감소하고 있다고 합니다.
Gorilla의 API 데이터베이스에는
Torch Hub에 94개,
TensorFlow Hub v2에 626,
Hugging Face에 925개로
총 1645개의 API가 포함되어 있습니다. 이들을 기초로 훈련된 것이 Gorilla입니다.
Gorilla는 "I want to see some cats dancing in celebration!(고양이가 축하하고 춤추는 것을 보고 싶습니다.) 같은 자연 언어로 이루어진 요청에 대해 API 데이터베이스 중에서 적절한 API를 선택할 수 있습니다. 이렇게 하면 고양이가 축하하고 춤추는 이미지를 제대로 출력할 수 있습니다.
아래 이미지는 GPT-4, Claude , Gorilla에게 "Help me find an API to convert the spoken language in a recorded audio to text using Torch Hub(Torch Hub를 사용하여 녹음된 음성을 텍스트로 변환하는 API를 찾는 것을 도와달라).라는 프롬프트를 입력한 결과 GPT-4에서는 환각이 발생하였고, Claude에서는 잘못된 라이브러리를 호출했지만, Gorilla는 적절한 API 호출을 제안했습니다.
Gorilla는 엔드 투 엔드 모델이며, 추가 코팅을 필요로 하지 않고 올바른 API를 호출하도록 조정되고 있다고 하며, Langchain · Toolformer · AutoGPT 등, 다른 툴과 조합해 사용하는 것도 가능하다고 연구팀은 말하고 있습니다.
연구팀의 Shishir Patil 에 따르면, Gorilla는 "대규모 언어 모델의 API 앱 스토어"가 되도록 구축되었으며, 사람들이 API를 Gorilla에 추가할 수도 있다고 합니다.
GitHub - ShishirPatil/gorilla: Gorilla: An API store for LLMs
https://github.com/ShishirPatil/gorilla
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
마인크래프트를 GPT-4로 반복 학습하면서 자동 플레이하는 AI 에이전트 「Voyager」가 등장 (3) | 2023.05.30 |
---|---|
실은 유튜브 쇼츠에 구글 DeepMind의 신형 AI 모델 「Flamingo」가 사용되고 있었다 (7) | 2023.05.30 |
AWS, Azure, Cudo 등이 제공하는 클라우드 GPU는 시간당 몇 달러이며, 어떤 구성인가? (3) | 2023.05.30 |
완전 오프라인으로 동작해 프라이버시를 지켜 주는 채팅 AI 「PrivateGPT」 (4) | 2023.05.29 |
Meta가 100만 토큰 초과의 콘텐츠 생성을 가능하게 하는 차세대 AI 아키텍처 'Megabyte' 발표 (4) | 2023.05.26 |
Microsoft가 차세대 AI 앱 개발을 지원하는 개발자용 대시보드 「Dev Home」 발표 (1) | 2023.05.25 |
Microsoft가 자사 제품에 의한 모든 AI 아트에 워터마크를 넣겠다고 표명 (1) | 2023.05.25 |
Google이 무료로 고퀄의 상품 이미지를 생성할 수 있는 AI 툴 「Product Studio」 발표 (2) | 2023.05.25 |