본문 바로가기
AI · 인공지능/AI 뉴스

Mistral AI가 코드 생성 특화형 AI 「Codestral Mamba」 를 오픈 소스 라이센스로 출시

by 두우우부 2024. 7. 22.
반응형

 

Meta와 Google DeepMind의 전 직원이 창업한 AI 개발 스타트업 Mistral AI가 코딩용 AI 모델「Codestral Mamba」를 발표했습니다. 오픈 소스 라이센스로 릴리즈하여, 상용 이용도 가능합니다.

Codestral Mamba | Mistral AI | Frontier AI in your hands
https://mistral.ai/news/codestral-mamba/

Codestral Mamba

As a tribute to Cleopatra, whose glorious destiny ended in tragic snake circumstances, we are proud to release Codestral Mamba, a Mamba2 language model specialised in code generation, available under an Apache 2.0 license.

mistral.ai


Mistral AI는 2024년 5월 최초의 코딩용 생성 AI 모델로서 'Codestral'을 출시했지만, Codestral은 상용이용이 금지되어 있었습니다.

이번에 출시된 Codestral Mamba는 기존 모델에서 널리 사용되고 있는 Transformer 아키텍처가 아니라 「Mamba 아키텍처」가 채용되고 있어, 시퀀스 길이에 대해서 처리 시간이 선형으로, 긴 시퀀스에 대해서도 고속으로 처리 할 수 있거나 시퀀스 길이에 제한이 없거나 하는 등의 특징이 있다는 것.

벤치마크 결과는 아래 그림과 같습니다. Codestral Mamba는 파라미터 수가 70억(7B)으로, 동등 사이즈의 모델 중에서는 최상위 클래스의 성능을 발휘하고 있습니다. 220억(22B) 파라미터의 Codestral 모델에 전체 성능에서 지고 있지만 일부 지표에서는 웃도는 등, Mamba 아키텍처의 잠재력을 보여주었습니다.


Mistral AI의 팀은 Codestral Mamba의 컨텍스트 내 검색 기능을 25만 6000 토큰까지 테스트하고 있어, 로컬로 동작하는 코드 어시스턴트로서 뛰어난 성능을 발휘할 수 있을 것을 기대하고 있다고 합니다.

Codestral Mamba 모델은 Hugging Face 에서 다운로드 할 수 있으며 Mistral의 공식 라이브러리인 Mistral Inference에서 사용할 수 있습니다.


코딩 ai 가 오픈소스에 상업이용도 가능하게 풀려버리면
우리 개발자들은 뭐 먹고 살라고 ㅠㅠ
그만 멈춰~!

반응형