수학에 강한 AI 「WizardMath」가 등장, Meta의 'Llama-2'를 강화

수학에 강한 새로운 대규모 언어 모델(LLM) 「WizardMath」가 등장했습니다. 미국 마이크로소프트와
중국과학원 심천 선진기술연구원의 연구자들이 2023년 8월 18일 발표한 논문입니다.

WizardMath: Empowering Mathematical Reasoning for Large Language Models via Reinforced Evol-Instruct
https://arxiv.org/abs/2304.12244

WizardLM: Empowering Large Language Models to Follow Complex Instructions

Training large language models (LLMs) with open-domain instruction following data brings colossal success. However, manually creating such instruction data is very time-consuming and labor-intensive. Moreover, humans may struggle to produce high-complexity

arxiv.org

수학에 강한 AI와 약한 AI

OpenAI가 개발한 대화형 AI(챗봇) 「ChatGPT」를 비롯해 다양한 AI의 중심이 되고 있는 LLM은, 각사가 개발을 진행하고 있지만 수학 문제를 푸는 성능에는 큰 차이가 있습니다.

예를 들어, ChatGPT의 핵심 인 "GPT-4"는 논문에 따르면 어려운 수학적 추론을 포함한 자연 언어 처리(NLP)에 높은 실력을 보여줍니다. 그러나 내부의 세부구조 등은 폐쇄(비공개)되어 있으며, 'Llama-2' 같이 내부 구조까지 공개한 오픈 소스 LLM의 대다수는 수학 관련 최적화가 되어있지 않다고 합니다.

잘 알려진 바와 같이 Microsoft는 GPT-4를 개발한 OpenAI와 제휴, Llama-2를 개발한 Meta와도 협력 관계에 있으며, 이번 WizardMath는 Llama-2의 수학 능력을 GPT-4에 가깝게 하고자 하는 대처입니다.

수학의 지시 데이터를 AI가 만들도록 훈련

이 연구에서 주목한 것은 「Reinforcement Learning from Evol-Instruct Feedback(RLEIF)」라는 새로운 기법입니다.

인간 대신에 LLM에 대량의 지시 데이터를 생성시키는 「Evol-Instruct」를 응용해, 초등 산수부터 고난도 수학까지를 대상으로 한 데이터를 생성시켜, Llama-2의 파인 튜닝에 이용합니다.

그 결과 완성된 WizardMath에 대해 「GSM8k」및 「MATH」의 수학적 추론 벤치마크로 평가했는데, 다른 오픈 소스 LLM을 대폭 웃도는 능력이 나왔다고 합니다. 또 GSM8k에서는 ChatGPT-3.5, Claude Instant-1, Palm-2, Minerva 등의 클로즈드 LLM도 웃돌았고, MATH에서는 Text-davinci-002, Palm-1, GPT-3을 웃돌았습니다.

Microsoft 등은 상세 내용과 모델의 가중치를 GitHub 및 Hugging Face에서 공개하고 있습니다.

https://github.com/nlpxucan/WizardLM/tree/main/WizardMath

https://huggingface.co/WizardLM/WizardMath-13B-V1.0

WizardLM/WizardMath-13B-V1.0 · Hugging Face

This model can be loaded on the Inference API on-demand.

huggingface.co

저작자표시 비영리 변경금지

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

"AI가 생성한 각본은 저작으로 보지 않는다" 할리우드 제작 측이 제안, 각본가 측은 불복 (0)	2023.09.05
ChatGPT가 레시피를 작성하고 Midjourney로 라벨 디자인한「AI맥주」 (0)	2023.09.05
Google Docs에 AI가 문장을 수정하는「Proofread」기능을 정식 도입 (0)	2023.09.05
Google이 AI를 공격하는 6가지 방법을 공개, 개인정보 추출부터 AI를 훔치는 방법까지 (0)	2023.09.05
Meta가 고성능 영상처리모델 「DINOv2」를 상용 이용도 가능하게 변경 (0)	2023.09.01
AI의 인기로 「.ai」도메인을 가진 카리브해의 작은 섬 「앵귈라」가 연간 수백억을 벌고 있다 (0)	2023.09.01
Microsoft가 AI를 공격하는 전문 조직 'AI 레드팀'의 노하우 공개, 타사에도 설립 호소 (0)	2023.09.01
Naver가 독자적인 대규모 언어 모델 「Hyper CLOVA X」를 발표 (1)	2023.09.01

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

두우우부

수학에 강한 AI 「WizardMath」가 등장, Meta의 'Llama-2'를 강화

수학에 강한 AI와 약한 AI

수학의 지시 데이터를 AI가 만들도록 훈련

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

수학에 강한 AI 「WizardMath」가 등장, Meta의 'Llama-2'를 강화

수학에 강한 AI와 약한 AI

수학의 지시 데이터를 AI가 만들도록 훈련

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

관련글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역