Meta와 Google DeepMind의 전 직원이 창업한 AI 개발 스타트업 Mistral AI가 코딩용 AI 모델「Codestral Mamba」를 발표했습니다. 오픈 소스 라이센스로 릴리즈하여, 상용 이용도 가능합니다.
Codestral Mamba | Mistral AI | Frontier AI in your hands
https://mistral.ai/news/codestral-mamba/
Mistral AI는 2024년 5월 최초의 코딩용 생성 AI 모델로서 'Codestral'을 출시했지만, Codestral은 상용이용이 금지되어 있었습니다.
이번에 출시된 Codestral Mamba는 기존 모델에서 널리 사용되고 있는 Transformer 아키텍처가 아니라 「Mamba 아키텍처」가 채용되고 있어, 시퀀스 길이에 대해서 처리 시간이 선형으로, 긴 시퀀스에 대해서도 고속으로 처리 할 수 있거나 시퀀스 길이에 제한이 없거나 하는 등의 특징이 있다는 것.
벤치마크 결과는 아래 그림과 같습니다. Codestral Mamba는 파라미터 수가 70억(7B)으로, 동등 사이즈의 모델 중에서는 최상위 클래스의 성능을 발휘하고 있습니다. 220억(22B) 파라미터의 Codestral 모델에 전체 성능에서 지고 있지만 일부 지표에서는 웃도는 등, Mamba 아키텍처의 잠재력을 보여주었습니다.
Mistral AI의 팀은 Codestral Mamba의 컨텍스트 내 검색 기능을 25만 6000 토큰까지 테스트하고 있어, 로컬로 동작하는 코드 어시스턴트로서 뛰어난 성능을 발휘할 수 있을 것을 기대하고 있다고 합니다.
Codestral Mamba 모델은 Hugging Face 에서 다운로드 할 수 있으며 Mistral의 공식 라이브러리인 Mistral Inference에서 사용할 수 있습니다.
코딩 ai 가 오픈소스에 상업이용도 가능하게 풀려버리면
우리 개발자들은 뭐 먹고 살라고 ㅠㅠ
그만 멈춰~!
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
EA가 AI를 사용해 불과 3개월 만에 1만 1천 명분의 대학 미식축구 선수를 스캔하여 게임에 구현하는 데 성공 (1) | 2024.07.30 |
---|---|
1조의 텍스트 토큰, 34억개의 이미지, PDF, ArXiv의 논문 등을 포함한 오픈 소스 데이터 세트 MINT-1T (1) | 2024.07.26 |
Stability AI가 1개의 동영상에서 다른 8개 앵글의 동영상을 생성하는 AI 모델 「Stable Video 4D」 를 발표 (1) | 2024.07.26 |
코드 생성 · 수학 · 추론 능력이 대폭 향상된 「Mistral Large 2」 출시 (1) | 2024.07.26 |
OpenAI가 「정확하고 알기 쉬운 문장을 출력하는 AI」의 개발 방법을 공개 (0) | 2024.07.19 |
Microsoft가 엑셀을 이해하는 언어 모델 「SpreadsheetLLM」을 발표, Excel도 AI가 다루는 시대 (0) | 2024.07.19 |
세계 제일의 AI 미인, Miss AI의 결과 발표 (1) | 2024.07.15 |
영화의 전편 모두를 생성 AI로 제작하는 옴니버스 영화 (0) | 2024.07.11 |