본문 바로가기
AI · 인공지능/AI 뉴스

NTT의 독자적인 LLM 「tsuzumi」 2024년 3월에 상용 서비스를 제공 예정

by 두우우부 2023. 11. 9.
반응형

 
 
NTT는 2023년 11월 1일, 경량으로 세계 Top 레벨의 일본어 처리 능력을 가진 새로운 대규모 언어 모델「tsuzumi」를 발표했습니다.

(PDF 다운로드) tsuzumi

2024년 3월부터 상용 서비스를 제공할 예정입니다. tsuzumi는 파라미터 수 6억의 초경량판과 70억의 경량판 2종류를 제공하며, 각각 CPU 및 1 GPU에서 고속으로 추론 동작이 가능하므로, 튜닝이나 추론에 드는 비용을 대폭 절감할 수 있습니다. 이 노력을 통해 이 회사는 지속가능성과 경제적 부담 경감을 도모한다고 합니다.

이 회사는 GPT-3와 츠즈미를 비교한 학습 비용과 추론 비용을 예로 들며, 상당한 비용 절감에 성공하고 있음을 보여줍니다.
 



또한 생성 AI용 벤치마크인 Rakuda에서는 GPT-3.5를 비롯해 다른 대규모 언어 모델과 비교해도 높은 승률을 나타내는 성능 평가를 얻었습니다.
 


우리도 어서 한국어 전용의 경량 LLM을 만들어야 할 텐데요...

반응형