Stable Diffusion의 개발사인 Stability AI가 오픈 소스 챗봇 AI 'StableVicuna'의 출시를 발표했습니다. StableVicuna는 Meta가 개발한 대규모 언어 모델인 LAMA 13B를 기반으로 하는 챗봇 AI 'Vicuna-13B'를 더욱 조정하여 훈련한 챗봇 AI입니다.
Stability AI releases StableVicuna, the AI World's First Open Source RLHF LLM Chatbot — Stability AI
https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot
StableVicuna는 "프롬프트의 파인 튜닝"과 "인간의 피드백에 의한 강화 학습(RLHF)"이라는 두 가지 접근법을 취하고 있습니다. 기존에는 프롬프트의 파인 튜닝이 복잡한 작업이었기 때문에, RLHF는 행해지지 않는 것이 대부분이었습니다. 그러나 최근에는 채팅봇을 위한 RLHF용 데이터 세트가 오픈 소스로 제공되었기 때문에 StableVicuna를 실현할 수 있었다고 합니다.
StableVicuna는 인간이 생성하고 인간이 주석을 단 대화 데이터 세트의 OpenAssistant Conversations Dataset(OASST1), GPT-3.5 터보에서 생성된 43만 건 이상의 프롬프트와 응답 데이터 세트인 GPT4All Prompt Generations, OpenAI의 text-davinci-003 엔진에 의해 생성된 Alpaca에 의해 파인 튜닝을 실시하고 있습니다. 또한 trlx를 사용하여 OASST1 · Anthropic HH-RLHF · Stanford Human Preferences 에서 강화 학습과 RLHF 훈련을 실시하고 있습니다.
StableVicuna가 할 수 있는 일로, Stability AI사는 "기본적인 수학을 다룰 수 있다", "코드를 쓸 수 있다", "문법을 수정해 준다"라는 3가지를 들고 있습니다. 현시점에서 StableVicuna의 채팅 인터페이스는 공개되지 않고 있으며, 곧 공개할 예정이라고 Stability AI는 말하고 있습니다.
또한, StableVicuna는 AI용 리포지토리인 HuggingFace에 호스팅 되지만, 공개된 것은 어디까지나 가중치 차이뿐이며 실제로 로컬 환경에서 StableVicuna를 체험하려면 LLAMA의 오리지널 모델에 액세스 할 수 있어야 합니다.
CarperAI/stable-vicuna-13b-delta · Hugging Face
https://huggingface.co/CarperAI/stable-vicuna-13b-delta
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
뇌에 침을 찌르지 않고도 인간의 생각을 출력할 수 있는 AI가 개발된다 (0) | 2023.05.02 |
---|---|
이미지 생성 AI에 의한 작품의 무허가 사용을 주장한 사진가가 반대로 손해배상 청구에 (0) | 2023.05.02 |
AI로 작곡한 'AI음악'이 유행중, Discord상에는 2만 명이 넘는 인기 서버도 (0) | 2023.05.02 |
AI가 핵무기를 발사하는 것을 막는 법안이 미국에서 제출됨 (0) | 2023.05.02 |
'바이든 대통령이 재선된 후의 디스토피아'를 AI로 그린 네거티브 영상을 공화당이 공개 (0) | 2023.04.27 |
'Stable Diffusion'이 사용하는 무료 데이터 세트 'LAION'의 구축을 이끈 것은 1명의 교사였다 (0) | 2023.04.26 |
ChatGPT의 대항마로 오픈소스 대화형 채팅 AI 「HuggingChat」출시 (0) | 2023.04.26 |
적외선 카메라만 있으면 AI 머신러닝으로 비밀번호를 훔칠 수 있다는 논문 발표 (0) | 2023.04.26 |