본문 바로가기
AI · 인공지능/AI 뉴스

「GPT-4」발표,「초대 iPhone과 동등한 충격」이라는 평가

by 두우우부 2023. 3. 16.
반응형

 

2023년 3월 14일(화)에 OpenAI가「GPT-4」를 정식 발표했습니다. GPT-4는 텍스트뿐만 아니라 화상 입력도 접수하는「멀티 모달 AI」로서 개발되어,「인간용 시험을 푼다」,「의뢰에 따라 프로그램한다」,「이 화상은, 무엇이 재미있는가? 등의 질문에 대답한다」라는 동작을 실현. 게다가 영어 이외의 언어 성능도 매우 고도의 영역에 도달하고 있다는 것입니다.

GPT-4 Research
https://openai.com/research/gpt-4

GPT-4

We’ve created GPT-4, the latest milestone in OpenAI’s effort in scaling up deep learning. GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhi

openai.com

GPT-4 Product
https://openai.com/product/gpt-4

GPT-4

GPT-4 is more creative and collaborative than ever before. It can generate, edit, and iterate with users on creative and technical writing tasks, such as composing songs, writing screenplays, or learning a user’s writing style.

openai.com



OpenAI는 지금까지도 채팅 AI「ChatGPT」등의 고성능 AI를 개발해 왔습니다만, 이번에 발표된 GPT-4의 성능은 기존의 AI를 크게 웃돌고 있습니다. OpenAI와 협력 관계에 있는 Microsoft는 GPT-4를 "초대 iPhone 등장 시와 동등한 충격을 주는 존재"라고 평가하고 있습니다.

GPT-3.5를 베이스로 한 ChatGPT는「사법 시험에서 하위 10%로 합격」하는 성능을 갖고 있었습니다만, GPT-4에서는「사법 시험에서 상위 10%로 합격」하는 놀라운 성능을 발휘한다는 것. OpenAI가 공개한 득점표를 확인하면 'Uniform Bar Exam', 'LSAT'와 같은 사법시험과 'SAT' 등의 학력테스트에서 GPT-4가 GPT-3.5를 크게 웃도는 득점을 기록하고 있습니다. 또한, 이러한 테스트는「테스트용의 특별한 튜닝」을 실시하지 않고 행해졌다고 합니다.



AI의 성능을 평가하는 MMLU 나 HellaSwag 같은 벤치마크에서도 GPT-4는 GPT-3.5를 크게 웃도는 점수를 기록했습니다.



또한 GPT-4는 영어 이외의 언어에서도 높은 성능을 발휘합니다. 각 언어에서의 성능을 나타낸 아래의 그래프(바가 길수록 고성능)를 보면,「GPT-4로 한국어를 처리했을 때의 성능」이「GPT-3.5로 영어를 처리했을 때의 성능」을 웃돌고 있음을 알 수 있습니다.



GPT-4에서는 텍스트뿐만 아니라 이미지를 인식할 수 있습니다. 예를 들어, GPT-4에 아래의 이미지를 보여주면서「이 이미지가 특이한 포인트를 알려주세요」라고 질문하면 「특이한 포인트는,  주행 중의 택시 위에서 다리미질을 하고 있다는 점입니다」라고 정확하게 답변해 줍니다.



GPT-3.5를 탑재한 ChatGPT에서는「소스 코드를 작성해 준다」라는 조작이 가능했습니다. GPT-4에서는 소스 코드 기술 기능이 더 세련되며, 상호 작용하면서 소프트웨어를 완성시킬 수 있습니다. 실제로 GPT-4에 프로그래밍을 의뢰하는 모습은, 아래의 영상으로 확인할 수 있습니다.

GPT-4 Developer Livestream - YouTube



GPT-4에 몇 가지 조건을 제시하면서「Discord로 GPT-4와 대화할 수 있는 BOT을 만들어 주세요」라고 의뢰.



그러면 GPT-4가 코드를 기술해 줍니다.



그러나, GPT-4가 기술한 코드를 실행해 보면 에러가 발생.



GPT-4에 "이런 오류가 발생했습니다."라고 지적합니다.



그러면 에러가 발생한 것을 사과하면서 수정판 코드를 기술해 주었습니다. (ㅋㅋㅋ 개발자네 이거... )



그 후도 몇 번이나「에러가 발생해, GPT-4에 지적」을 반복한 결과,「GPT-4와 대화할 수 있는 BOT」이 완성되었습니다.



GPT-4는 유료 서비스 ChatGPT Plus 회원을 위해 공개되었습니다. 또한 다음 링크에서 API 대기 목록에 등록할 수 있습니다.

GPT-4 API waitlist
https://openai.com/waitlist/gpt-4-api

 

반응형