반응형
NTT는 2023년 11월 1일, 경량으로 세계 Top 레벨의 일본어 처리 능력을 가진 새로운 대규모 언어 모델「tsuzumi」를 발표했습니다.
(PDF 다운로드) tsuzumi
2024년 3월부터 상용 서비스를 제공할 예정입니다. tsuzumi는 파라미터 수 6억의 초경량판과 70억의 경량판 2종류를 제공하며, 각각 CPU 및 1 GPU에서 고속으로 추론 동작이 가능하므로, 튜닝이나 추론에 드는 비용을 대폭 절감할 수 있습니다. 이 노력을 통해 이 회사는 지속가능성과 경제적 부담 경감을 도모한다고 합니다.
이 회사는 GPT-3와 츠즈미를 비교한 학습 비용과 추론 비용을 예로 들며, 상당한 비용 절감에 성공하고 있음을 보여줍니다.
또한 생성 AI용 벤치마크인 Rakuda에서는 GPT-3.5를 비롯해 다른 대규모 언어 모델과 비교해도 높은 승률을 나타내는 성능 평가를 얻었습니다.
우리도 어서 한국어 전용의 경량 LLM을 만들어야 할 텐데요...
반응형
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
대규모 언어 모델을 LoRA로 저비용에 효율적으로 미세 조정할 수 있는 「Punica」가 등장 (2) | 2023.11.13 |
---|---|
일본 기시다 총리의 가짜 동영상이 확산 (82) | 2023.11.09 |
2026년이면 AI 트레이닝용 데이터가 고갈되는「데이터 부족 문제」란? (50) | 2023.11.09 |
AI에게「그게 최선이야?」, 「전력을 다해」등의 감정적 명령문을 전달하면 퍼포먼스가 향상된다 (0) | 2023.11.09 |
미국 최초의 AI 규제 대통령령 「개발자는 공개 전에 테스트하고 사전에 미국 정부와 공유할 것」 (0) | 2023.11.09 |
소프트뱅크 산하 BOLDLY와 에스토니아 기업 Auve Tech가 개발한 「MiCa」가 자율주행 레벨 4 대응으로 일본의 공도를 주행 (65) | 2023.11.08 |
OpenAI가 코딩 없이 ChatGPT를 '사용자 정의' 할 수 있는「GPTs」를 발표 (57) | 2023.11.08 |
OpenAI가 GPT-4의 업그레이드판 대규모 언어 모델 「GPT-4 Turbo」를 발표 (3) | 2023.11.08 |