ChatGPT와 같은 AI의 핵심인 대규모 언어 모델(LLM)에 긴 콘텍스트가 있는 지침을 입력할 때, '처음'과 '마지막'에 중요한 정보를 쓰면 더 나은 답변을 얻을 수 있습니다. 이런 연구 성과를 미국 스탠퍼드 대학의 연구팀이 2023년 7월 6일에 논문으로 발표했습니다.
https://arxiv.org/abs/2307.03172
주로 트랜스포머 기술을 채용한 LLM에, 법률이나 과학에 관한 문서, 대화의 이력, 검색 엔진이나 데이터베이스 등의 정보를 처리시킬 때, 정밀도를 어떻게 높이는가 하는 관점에서 실시한 연구로, AI에 대한 문장의 지시, 소위 「프롬프트」를 최적화하는 기술인 「프롬프트 엔지니어링」에 관한 것이라고도 말할 수 있습니다.
중요한 정보를 지시의 중간에 넣으면 정확도가 크게 저하
연구팀에 의한 조사 결과 LLM에 입력한 지시의 콘텍스트와 관련된 정보를 처음이나 마지막에 배치한 경우 가장 높은 정밀도의 답변을 얻을 수 있는 것으로 나타났습니다. 그러나 관련 정보를 지시의 중간 부분에 넣으면 정확도가 크게 떨어졌습니다.
애당초 장문에 서툴다
또한 논문에서는 LLM은 원래 장문에 서툴다는 특징도 다시 보여주고 있습니다.
입력한 콘텍스트가 길어질수록 처리 성능은 꾸준히 저하되고 있으며, 지시 속에서 콘텍스트와 관련된 정보를 꺼내 응답 생성에 이용하는 데 어려움을 겪고 있는 것으로 나타났습니다.
또한 긴 콘텍스트를 받아들일 수 있도록 확장한 LLM이, 그렇지 않은 모델에 비해 입력 내용의 처리에 반드시 뛰어난 것도 아님이 밝혀졌습니다. 예를 들면 ChatGPT가 채용하는 「GPT-3.5-Turbo」가 처리할 수 있는 길이의 콘텍스트를 확장판인 「GPT-3.5-Turbo (16K)」에 처리시켜도 성능에 차이가 보이지 않았다고 합니다.
GPT-3.5-Turbo(16K)를 외부 제품이나 서비스에서 이용하기 위해 드는 요금은 GPT-3.5-Turbo 보다 약간 높은 만큼, 쓸데없이 드는 돈을 아껴주는 정보입니다.
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
개발자용 대화형 AI「GitHub Copilot Chat」퍼블릭 베타판 등장 (1) | 2023.08.02 |
---|---|
ChatGPT를 흉악한 폭언 머신으로 변모시키는 마법의 문자열 발견 (2) | 2023.08.01 |
대략 250조 규모의 게임업계가 AI의 등장으로 크게 변화하려 한다 (1) | 2023.07.31 |
3명의 AI 전문가가 미국 의회에서 증언, AI 연구의 1인자들의 시각은? (2) | 2023.07.27 |
최근 AI의 핵심 기술인 「트랜스포머」를 낳은 부모가 구글을 퇴사해 스타트업을 설립 (2) | 2023.07.27 |
대만의 TSMC가 AI용 고성능 반도체에 대응하는 첨단 공장을 신설 (2) | 2023.07.27 |
프레임간의 일관성을 유지한 채, 영상에 텍스트를 지정하여 변경하는 기술 「TokenFlow」가 등장 (2) | 2023.07.26 |
ChatGPT의 지능이 급격히 떨어지고 있다는 연구 결과, 간단한 수학 문제 정답률이 98%에서 2%로 악화 (3) | 2023.07.25 |