본문 바로가기
AI · 인공지능/AI 뉴스

Anthropic의 텍스트 생성 AI 「Claude」가 OpenAI GPT-4의 3배 토큰에 대응

by 두우우부 2023. 5. 15.
반응형

 
ChatGPT와 같은 대화형 AI는 고정밀 텍스트를 생성할 수 있지만 입력이 가능한 언어의 최소 단위인 '토큰'에는 한계가 있습니다. OpenAI의 GPT-4는 약 3만 2,000 토큰까지 입력이 가능합니다만, AI 연구 스타트업의 Anthropic이 텍스트 생성 AI 「Claude 」의 토큰을 9,000에서 10만으로 확장한다고 발표했습니다.

Anthropic | Introducing 100K Context Windows
https://www.anthropic.com/index/100k-context-windows

Introducing 100K Context Windows

We’ve expanded Claude’s context window from 9K to 100K tokens, corresponding to around 75,000 words! This means businesses can now submit hundreds of pages of materials for Claude to digest and analyze, and conversations with Claude can go on for hours

www.anthropic.com



ChatGPT나 GPT-4와 같은 전통적인 AI 모델은 수천 개의 토큰을 입력하면 사람의 첫 지시를 잊고 문장 내의 최신 정보로부터 행동을 결정하는 문제가 있습니다. OpenAI 등의 AI개발단체는 이 문제에 대처하기 위해서 개발 및 연구를 실시하고 있습니다만, OpenAI에 의한 대규모 언어 모델 GPT-4에서도 약 3만 2천 토큰이 상한선으로, 책이나 연구 논문의 요약이나 대규모 코딩 등은 아직 어려운 것으로 알려져 있습니다.

AI에 의한 문장 인식을 위한 「토큰」에 대한 이해는 아래에 정리하고 있습니다.

ChatGPT가 어떻게 문장을 인식하는지 한눈에 알 수 있는 'Tokenizer'

ChatGPT가 어떻게 문장을 인식하는지 한눈에 알 수 있는 'Tokenizer'

AI는 문장을 읽고 쓸 때, 「토큰」이라는 단위로 인식을 실시합니다만, 보통의 문장이 토큰으로 어떻게 분해되는지를 한눈에 보여주는 툴, 「Tokenizer 」를 OpenAI가 게시했습니다. OpenAI API https://pla

doooob.tistory.com


만약 입력 가능한 토큰 수가 증가한 경우, 책이나 논문 등의 자료의 요약 등이 가능할 뿐만 아니라, 지금까지 어려웠던, 몇 시간이나 며칠에 걸친 AI와의 건설적 대화가 가능하게 됩니다.

AI 연구 스타트업인 Anthropic은, 텍스트 생성 AI 모델 「Claude」의 최대 토큰 수를 10만 토큰으로 확장해, 약 7만 5천 자의 영어 문장에 대응한다고 발표했습니다. Anthropic은 Claude의 대응 가능 토큰 수 증가에 의해 장문 대응이 가능하게 되었음을 밝히고, 새로운 Claude에서는 수백 페이지에 걸친 자료를 입력하여 분석하는 기능이나, 복수의 문서나 책 등으로부터 정보를 취득하여, 우리는 "지식 통합"이 필요한 질문에 대답할 수 있다고 설명합니다.
 
또한 Anthropic은 장문 대응 Claude에 대한 다양한 유즈 케이스를 소개하고 있으며, "재무보고 및 연구 논문 등의 자료 이해, 요약, 설명", "연간 보고서에 기반한 기업의 전략적 위험과 기회 분석", "법률의 장점과 단점을 평가", "수백 페이지의 개발자용 문서를 읽어 기술적인 질문에 적절히 대답" 등을 들 수 있습니다.

Anthropic이 공개한 Claude의 데모 동영상이 아래입니다. Claude에게 "LangChain(대규모 언어 모델을 이용하여 서비스를 개발하고 싶을 때 편리하게 사용할 수 있는 라이브러리)에 대해 알려주세요."라고 물었을 때, "지식 부족으로 인해 응답할 수 없습니다."라고 대답했습니다. 그러나, LangChain에 대한 PDF 파일을 읽혔을 때, Claude가 LangChain을 이해했음을 알 수 있습니다.



Anthropic은 "평균적으로 사람은 약 5시간에 10만 토큰 분량의 문장을 읽을 수 있다고 합니다만, 그 정보를 이해하고 기억 및 분석하기 위해서는 상당한 시간이 필요합니다. 그러나 Claude는 1분 이내에 이러한 처리를 할 수 있습니다."라고 코멘트.

실제로 F. Scott Fitzgerald의 소설 '위대한 개츠비' 전체를 Claude에 읽어 들여, 한 문장만 고쳐 쓴 후에 Claude에게 "원래 문장과 무엇이 다른가?"라고 물었더니 22초 만에 정답이 돌아왔다고 Anthropic은 보고하고 있습니다.



Claude의 트레이닝에 대하여 Anthropic은, "Claude는 인간이 불법 또는 비윤리적인 활동을 할 수 있는 유해 하거나 차별적인 출력을 일련의 원칙을 사용하여 출력할 수 있는지 판단하는 시스템이 탑재되어 있습니다."라고 말합니다. 전통적인 대화형 AI는 학습 시 인간의 피드백이 필요하지만 Claude는 '세계 인권 선언', 'Apple 개인 정보 보호 정책', DeepMind의 '대화형 AI를 위한 원칙'등의 확립된 일련의 원칙에 따라 Claude 자신의 답변을 비평하고 수정했습니다. 그 결과, Claude에서는 기존의 대화형 AI와 비교해 "유해한, 인종차별적, 성차별적, 불법, 폭력적, 비윤리적인 행동을 장려, 지원하는 답변을 생성하기 어렵다"고 합니다.

Anthropic은 "이 회사의 대화형 AI에 대한 원칙은 일반 상식부터 AI가 자아를 갖지 않도록 철학적인 것까지 모든 범위에 걸쳐 있다"라고 보고 했습니다.

또한 Claude는 현재 미리 보기 단계이며 Claude를 사용하려면 Anthropic에 대한 요청이 필요합니다.

반응형