본문 바로가기
AI · 인공지능/AI 뉴스

GPT-4보다 높은 성능을 발휘할 수 있는 특정 언어 특화형 언어 모델 「InternLM」

by 두우우부 2023. 7. 10.
반응형

고성능 채팅 AI 'ChatGPT'가 큰 주목을 받고 있는 가운데, ChatGPT에 필적하는 성능을 가진 언어 모델들이 잇달아 발표되고 있습니다. 

상하이 AI 연구소를 중심으로 개발한 언어 모델 'InternLM'은 영어와 중국어에 특화되어 훈련하고 있으며, 여러 성능 평가 테스트에서 ChatGPT를 넘는 점수를 기록하고 있습니다.

InternLM
https://internlm.org/



InternLM은 상하이 AI 연구소와 여러 대학 및 기업이 협력하여 개발한 언어 모델로 1조 토큰 이상의 다국어 데이터로 훈련되고 있습니다. InternLM의 주요 특징은 다음과 같습니다.

・여러 언어를 이해하고 표현하는 능력을 갖추고 있으며, 특히 영어와 중국어에서 현저한 퍼포먼스를 발휘한다.
・논리적 추론, 코드 생성 등의 분야에서 뛰어난 성능을 발휘한다.
・다양한 중국어의 성능 평가 테스트에서 ChatGPT를 넘어 GPT-4에 가까운 성능을 발휘한다.




Microsoft의 언어 모델의 성능 평가 테스트 "AGIEval"에서는 InternLM이 ChatGPT를 모든 요소에서 능가합니다. 게다가 「GK-En」, 「GK-history」, 「GK-Cn」에서는 GPT-4를 웃도는 스코어를 기록하고 있습니다.



언어 모델의 중국어 처리 성능을 평가할 수 있는 「C-Eval」의 결과가 아래. InternLM은 "Middle School Biology"를 제외한 대부분의 테스트에서 GPT-4 점수를 웃돌고 있습니다.



InternLM은 ChatGPT와 같은 채팅 형식으로 상호 작용할 수 있으며, 문장의 지시에 따라 코드를 생성할 수도 있습니다.




InternLM의 모델 데이터는 다음 GitHub 리포지토리에 공개되어 있습니다.

GitHub - InternLM/InternLM: InternLM has open-sourced a 7 billion parameter base model, a chat model tailored for practical scenarios and the training system.
https://github.com/InternLM/InternLM

GitHub - InternLM/InternLM: InternLM has open-sourced a 7 billion parameter base model, a chat model tailored for practical scen

InternLM has open-sourced a 7 billion parameter base model, a chat model tailored for practical scenarios and the training system. - GitHub - InternLM/InternLM: InternLM has open-sourced a 7 billio...

github.com

 

반응형