Llama 3 및 Mistral-7B와 같은 오픈 소스 대규모 언어 모델(LLM)을 지원하고 WebGPU를 사용하여 브라우저에서 완벽하게 작동하는 채팅 봇 "Secret Llama"가 공개되었습니다.
Secret Llama
https://secretllama.com/
GitHub - abi/secret-llama: Fully private LLM chatbot that runs entirely with a browser with no server needed. Supports Mistral and LLama 3.
https://github.com/abi/secret-llama
Secret Llama의 데모 사이트에 액세스 하면 이런 느낌.
왼쪽 상단에서 모델을 선택할 수 있습니다.
선택 가능한 모델은 Mistral-7B, Llama 3, TinyLlama, Phi1.5의 4종류.
중앙의 입력창에 질문을 입력합니다.
처음 입력하면 먼저 모델을 로드합니다. 이번에는 가장 가볍고 빠른 TinyLlama를 선택해 보았습니다.
모든 로드가 종료되었으나. 제가 삼성 갤럭시탭 S8에서 액세스 하고 있기 때문에, GPU가 구려서 그런지 오류가 발생합니다.
아무리 모델이 경량이라고 해도, 태블릿 PC에서 LLM을 움직이는 것은 힘든 모양입니다.
제가 가진 다른 PC도 노트북뿐인데, 결과는 비슷했습니다. 단순히 hello만 쳐봐도 헛소리를 지껄입니다.
최소한 NVIDIA GeForce GPU 정도는 달려있어야 실행이 가능해 보입니다.
Secret Llama는 채팅 내용이 PC에서 유출되지 않고 완전히 개인 브라우저에서 실행되기 때문에 서버 설치도 필요 없습니다.
모델을 로드한 후에는 오프라인에서도 동작해, 사용하기 쉬운 인터페이스가 되고 있습니다. 추론 엔진에는 Web-LLM을 사용하고 있다는 것.
또한, Secret Llama는 WebGPU를 사용하는 사양상, 기본적으로 WebGPU가 활성화되어 있는 Google Chrome 또는 Microsoft Edge에서의 사용을 권장합니다.
Mozilla Firefox의 경우 수동으로 WebGPU를 활성화해야 하며 Safari의 경우 "실험적인 WebKit 기능"설정에서 WebGPU를 활성화해야 합니다.
또한 Secret Llama는 React 코드를 직접 수정하여 컴파일하고 사용하는 것도 가능합니다.
로컬에서만 돈다는 점이랑 입맛에 맞게 수정할 수 있다는 것은 참 매력적이네요~
https://github.com/abi/secret-llama
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
OpenAI가 "AI 생성 이미지인지 여부를 구별하는 도구"를 개발 중 (2) | 2024.05.09 |
---|---|
Microsoft가 인터넷에 연결할 수 없고 해킹 위험을 줄일 수 있는 첩보용 생성 AI 출시 (2) | 2024.05.09 |
IBM이 자사제 AI 「Granite」 의 코드 생성 모델을 오픈 소스화 (2) | 2024.05.09 |
Meta가 광고주용 생성 AI 도구의 강화를 발표 (2) | 2024.05.09 |
대규모 언어 모델로 로봇 교육을 가속화하는 기술, DrEureka를 NVIDIA 연구팀이 개발 (2) | 2024.05.08 |
Z 세대는 인플루언서가 실제 인간인지 여부를 거의 신경 쓰지 않는다 (3) | 2024.05.07 |
스토리성이 있는 만화를 자동 생성하는 AI 모델 「StoryDiffusion」 (3) | 2024.05.07 |
Forebes가 선택한 「2024년의 주목할 만한 AI 관련 기업 50사」 발표 (85) | 2024.04.30 |