NVIDIA가 오픈 모델 「Nemotron-4 340B」를 발표, LLM 트레이닝용 합성 데이터 생성에 혁명을 일으킬까

고급 AI 교육에는 고품질의 학습 데이터가 필수적이지만, 이러한 데이터는 빠르게 고갈되고 있다는 것이 문제입니다. NVIDIA 2024년 6월 14일에, 대규모 언어 모델(LLM)의 트레이닝에 사용할 합성 데이터의 생성을 염두에 두고 개발되어, 상용 애플리케이션에도 사용할 수 있는 오픈 소스의 AI 모델 「Nemotron-4 340B」 를 발표했습니다.

NVIDIA Releases Open Synthetic Data Generation Pipeline for Training Large Language Models | NVIDIA Blog

NVIDIA Releases Open Synthetic Data Generation Pipeline for Training Large Language Models

Nemotron-4 340B, a family of models optimized for NVIDIA NeMo and NVIDIA TensorRT-LLM, includes cutting-edge instruct and reward models, and a dataset for generative AI training.

blogs.nvidia.com

Nemotron-4 340B는 합성 데이터 생성 파이프라인으로 사용할 수 있는 Base 모델, Instruct 모델, Reward 모델의 3개로 구성되어 있으며, 오픈 소스 학습 프레임워크인 NVIDIA NeMo에서 동작시키고 고속추론용 툴 NVIDIA TensorRT-LLM 라이브러리와 함께 사용하기 위해 최적화되었습니다.

또한, Nemotron-4 340B는 오픈 모델이면서 9조의 토큰과 4000의 콘텍스트 윈도를 자랑해, 50개가 넘는 자연 언어와 40개 이상의 프로그래밍 언어에 대응하고 있기 때문에, 퍼포먼스로 Meta의 Flama3-70B 그리고 Anthropic의 Claude 3 Sonnet을 뛰어넘어 GPT-4에 필적할 것이라고 IT계 뉴스 사이트인 VentureBeat가 평가했습니다.

다음은 Nemotron-4 340B를 사용한 합성 데이터 생성 파이프라인입니다. 첫째, Nemotron-4 340B Instruct 모델은 다양하고 실전적인 합성 데이터를 생성합니다. 그리고 이를 평가 모델인 Nemotron-4 340B Reward가 '유용성', '정확성', '일관성', '복잡성', '중복성' 등 5가지 속성으로 평가하여 반복 개선 및 정확성 검증을 실시합니다.

Nemotron-4 340B Reward는 보상 모델 순위에서 1위를 차지합니다.

Nemotron-4 340B는 이미 Hugging Face에서 공개되어 있으며, NVIDIA의 공식 사이트(ai.nvidia.com)에서도 곧 액세스 할 수 있게 된다고 합니다.

https://huggingface.co/collections/nvidia/nemotron-4-340b-666b7ebaf1b3867caf2f1911

Nemotron 4 340B - a nvidia Collection

Nemotron-4: open models for Synthetic Data Generation (SDG). Includes Base, Instruct, and Reward models.

huggingface.co

LMSYS Org의 Chatbot Arena에서 Nemotron-4 340B를 만져본 사용자 의견에서 압도적으로 호평을 받았으며, 특히 높은 성능과 전문 지식을 칭찬하는 의견이 많았습니다.

저작자표시 비영리 변경금지 (새창열림)

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

자연스러운 일본인 이미지 생성 기능 「JAPAN AI」 (1)	2024.06.17
「Cat as a service」 로 여러가지 고양이를 소환해 보았다 (0)	2024.06.17
Stable Diffusion 3 Medium이 오픈 릴리스 (1)	2024.06.17
셔츠 단추에 부착된 초소형 카메라 AI 디바이스로 컨닝한 학생이 체포된다 (3)	2024.06.17
인간급 범용 인공지능을 개발한 연구자에게 총액 100만 달러의 상금을 수여하는 콘테스트 「ARC Prize」 개최 (1)	2024.06.13
AI미녀 콘테스트 「Miss AI」 의 Top 10 결과 발표 (2)	2024.06.12
iPhone을 사용하면 데이터가 OpenAI에 넘어가 버린다? (1)	2024.06.11
AI가 생성한 공포 유튜브 쇼츠, 「군마 여행의 추억」 (3)	2024.06.10

두우우부

NVIDIA가 오픈 모델 「Nemotron-4 340B」를 발표, LLM 트레이닝용 합성 데이터 생성에 혁명을 일으킬까

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

티스토리툴바

NVIDIA가 오픈 모델 「Nemotron-4 340B」를 발표, LLM 트레이닝용 합성 데이터 생성에 혁명을 일으킬까

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글

관련글

티스토리툴바