LINE 주식회사는 2020년 11월 25일 회사의 모회사인 NAVER와 공동으로 세계 최초로 일본어로 특화된 초 거대 언어 모델의 개발 및 그 처리에 필요한 인프라를 구축할 것이라고 발표했습니다.
초 거대 언어 모델은 방대한 데이터를 학습시킨 범용적인 언어 모델입니다. AI에 따르면 자연적인 문장의 인식과 표현을 가능하게 하는 것으로, 일본어에 특화된 초 거대 언어 모델의 개발은 세계 최초입니다.
기존의 언어 모델은 각각의 목적에 따라 개별적으로 방대한 문장을 학습시킬 필요가 있었습니다. 언어 모델은 특히 채팅 봇으로 활용이 진행되어, Q&A나 대화 등 그 기술이 응용되고 있습니다.
한편, 언어 모델의 연구 개발은 복잡한 문장의 인식과 문맥 인식 등 여전히 기술적인 과제를 안고 있습니다. 그래서 주목되는 것이 범용적인 언어 모델입니다. Google이 발표한 BERT와 미국의 비영리 단체 OpenAI가 발표한 GPT 등이 큰 화제가 되었습니다.
저자인 Rani Horev 씨는 이스라엘 출신으로 이스라엘 국방부의 데이터 과학팀 리더를 역임한 적이 있는 AI 연구원입니다. 그는 Medium에 투고한 기사에서 Google이 2018년 10 월에 발표한 자연 언어 처리 모델 BERT의 특징을 설명하기도 했습니다.
BERT를 설명 : 자연 언어 처리를 위한 최첨단 언어 모델
이러한 다양한 언어 모델은 신문기사나 백과사전, 소설, 코딩 등의 방대한 언어 데이터를 학습시키고 그 위에 소량의 데이터를 사용하여 재학습 함으로써 높은 정밀도의 언어 처리가 실현됩니다.
이로 인해, 다양한 언어 처리(대화, 번역, 입력 보완, 문서 생성, 프로그래밍 코드 등)를 할 수 있게 되어, 여러 유즈 케이스에 쉽게 대응할 수 있을 것으로 기대되고 있습니다.
LINE이 개발하는 범용 언어 모델은 1750 억 이상의 파라미터와 100 억 페이지 이상의 일본어를 학습 데이터로 사용할 예정입니다. 이 초 거대 언어 모델의 실현으로 새로운 대화형 AI 개발 및 검색 서비스의 품질향상 등 LINE 서비스의 활용 외에도 제삼자와의 공동 개발 및 API 외부 제공도 검토하고 있습니다.
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
AI가 적중률 높은 곡을 생성하는 무료 앱, 과거의 히트곡을 대량으로 학습 (0) | 2021.03.04 |
---|---|
내가 그린 일러스트를 AI로 평가받는 paint.wtf 에서 놀아보았다 (0) | 2021.02.15 |
AI가 애완동물의 얼굴 사진에서 질병을 예측, 토이 푸들은 70%의 정확도를 발휘 (0) | 2021.02.15 |
화웨이가 중국 AI 대기업 Megvii와 협력하여 '위구르인 알람'을 개발하고 있었던 것이 기밀 문서에서 발견 (0) | 2020.12.11 |
AI와 로봇을 도입한 기업은 오히려 일자리가 늘어난다는 연구 결과 (0) | 2020.12.04 |
중환자실 치료가 필요한 코로나 환자를 96%의 정확도로 예측하는 AI가 등장 (0) | 2020.12.01 |
단지 AI를 사용하는 것 만으로는 무의미, AI에서 이익을 창출하기 위해서는 '조직이 배우는 것'이 필수라는 조사 결과 (0) | 2020.10.26 |
성구같은 포엠를 자동 생성하는 'AI 예수'가 탄생, Twitter 계정도 개설 (0) | 2020.09.06 |