고성능 채팅 AI 'ChatGPT'가 큰 주목을 받고 있는 가운데, ChatGPT에 필적하는 성능을 가진 언어 모델들이 잇달아 발표되고 있습니다.
상하이 AI 연구소를 중심으로 개발한 언어 모델 'InternLM'은 영어와 중국어에 특화되어 훈련하고 있으며, 여러 성능 평가 테스트에서 ChatGPT를 넘는 점수를 기록하고 있습니다.
InternLM
https://internlm.org/
InternLM은 상하이 AI 연구소와 여러 대학 및 기업이 협력하여 개발한 언어 모델로 1조 토큰 이상의 다국어 데이터로 훈련되고 있습니다. InternLM의 주요 특징은 다음과 같습니다.
・여러 언어를 이해하고 표현하는 능력을 갖추고 있으며, 특히 영어와 중국어에서 현저한 퍼포먼스를 발휘한다.
・논리적 추론, 코드 생성 등의 분야에서 뛰어난 성능을 발휘한다.
・다양한 중국어의 성능 평가 테스트에서 ChatGPT를 넘어 GPT-4에 가까운 성능을 발휘한다.
Microsoft의 언어 모델의 성능 평가 테스트 "AGIEval"에서는 InternLM이 ChatGPT를 모든 요소에서 능가합니다. 게다가 「GK-En」, 「GK-history」, 「GK-Cn」에서는 GPT-4를 웃도는 스코어를 기록하고 있습니다.
언어 모델의 중국어 처리 성능을 평가할 수 있는 「C-Eval」의 결과가 아래. InternLM은 "Middle School Biology"를 제외한 대부분의 테스트에서 GPT-4 점수를 웃돌고 있습니다.
InternLM은 ChatGPT와 같은 채팅 형식으로 상호 작용할 수 있으며, 문장의 지시에 따라 코드를 생성할 수도 있습니다.
InternLM의 모델 데이터는 다음 GitHub 리포지토리에 공개되어 있습니다.
GitHub - InternLM/InternLM: InternLM has open-sourced a 7 billion parameter base model, a chat model tailored for practical scenarios and the training system.
https://github.com/InternLM/InternLM
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
AI와 인간의 태그로 예측 정밀도 20% 향상, 삿포로 맥주의 AI 수요 예측 시스템 (9) | 2023.07.11 |
---|---|
AI가 항노화제의 후보 분자를 몇 분 만에 도출 (3) | 2023.07.11 |
거짓 정보 채팅 AI 'PoisonGPT'가 개발된다 (3) | 2023.07.11 |
AI로 생성한 「블랙 잭」신작을 공개 예정, GPT4 와 Stable Diffusion을 활용 (6) | 2023.07.10 |
뇌파로부터 이미지를 생성하는 AI 「DreamDiffusion」이 등장 (3) | 2023.07.10 |
기존 대규모 언어 모델의 제약이었던 「입력량의 한계」를 제거한 「RWKV」란? (2) | 2023.07.10 |
AI 개발 경쟁은 미국 1위, 중국 2위, 싱가포르 급상승 3 위, 한국은 6위 (3) | 2023.07.08 |
OpenAI가 GPT-4를 공개, 누구나 ChatGPT 내에서 코드 실행도 가능 (3) | 2023.07.08 |