본문 바로가기
반응형

AI · 인공지능974

대규모 언어 모델을 단일 파일로 배포 실행하는 「 llamafile 」 의 처리 능력이 10배 고속화 대규모 언어 모델(LLM)을 불과 4GB 정도의 실행 파일 1개로 간편하게 배포 및 실행할 수 있도록 한 패키지 「 llamafile v0.7 」 가 공개되었습니다. 이 버전에서는 CPU와 GPU 둘 다 계산 성능 및 정밀도가 향상되어, 명령 세트 아키텍처 「AVX-512」의 서포트에 의해, AMD의 「 Zen4 」 아키텍쳐 채용 CPU등에서 프롬프트 처리 시간이 10배 고속화된다고 합니다. Release llamafile v0.7 · Mozilla-Ocho/llamafile · GitHub https://github.com/Mozilla-Ocho/llamafile/releases/tag/0.7 Release llamafile v0.7 · Mozilla-Ocho/llamafilellamafile lets.. 2024. 4. 3.
제대로 체크하면 「781년」 걸리는 AI용 데이터 세트 「LAION-5B」 를 논하는 「Models All The Way Down」 Stable Diffusion을 비롯한 주요 이미지 생성 AI 교육에는 50억 장 이상의 이미지와 텍스트 세트인 "LAION-5B"가 사용되고 있습니다. 주 5일 일하는 풀타임 노동자가 1초씩 이미지를 육안으로 확인해도 781년 걸린다는 데이터 세트의 방대함 및 그 문제점을 정리한 사이트 "Models All The Way Down"이 공개되었습니다. Models All The Way Down https://knowingmachines.org/models-all-the-way 위의 URL에 액세스 하여 스크롤하면 배경에 다양한 이미지와 거기에 연결된 텍스트 데이터가 나타납니다. 이것은 LAION-5B에 수록되어 있는 데이터 세트입니다. LAION-5B의 공식 페이지에는 「 바로 사용할 제품의 작성에 이용.. 2024. 4. 2.
한국의 2024년 2월 칩 생산량은 AI 수요로 인해 전년 대비 65.3% 증가 한국의 2024년 2월 칩 생산량이 전년 대비 65.3% 증가하여 2009년 이후 최고의 숫자를 기록한 것으로 보고되었습니다. 해외 미디어인 Bloomberg는 이 요인에 대해 "AI 관련 메모리 수요 증가로 인한 것"이라고 분석하고 있습니다. 한국 Chip Production Rises by Most in 14 Years With Strong Semiconductor Demand - Bloomberg https://www.bloomberg.com/news/articles/2024-03-29/south-korea-s-semiconductor-output-rises-by-most-in-14-years 블룸버그 보고에서는 한국 기업에 의한 월별 칩 출하수는 2024년 1월 전년 동기 대비 62.7% 증가를 .. 2024. 4. 2.
「Llama 2 70B」와 「Stable Diffusion XL」이 추가된 AI 벤치마크 테스트 「MLPerf Inference v4.0」 발표 신경망의 성능 평가를 실시하는 업계 컨소시엄의 MLCommons는 다양한 시나리오에서 하드웨어의 AI 처리 성능을 측정할 수 있는 벤치마크 테스트 'MLPerf Inference'를 설계하고 있습니다. 최신 「MLPerf Inference v4.0」 에서는 퍼포먼스 지표로서 새롭게 Meta의 대규모 언어 모델 「Llama 2 70B」 와 이미지 생성 AI인 「Stable Diffusion XL」이 추가되었습니다. New MLPerf Inference Benchmark Results Highlight The Rapid Growth of Generative AI Models - MLCommons New MLPerf Inference Benchmark Results Highlight The Rapid Grow.. 2024. 3. 29.
Databricks가 오픈한 대규모 언어 모델 「 DBRX 」 를 릴리스, GPT-3.5나 CodeLLaMA-70B를 웃도는 성능 데이터 분석 툴 등을 제공하는 기업인 Databricks가, 2024년 3월 27일에 오픈한 범용 대규모 언어 모델(LLM)인 「 DBRX 」 를 발표했습니다. 오픈 라이센스로 배포되며 월간 활성 사용자가 7억 명 이하인 기업은 무료로 상용 이용도 가능하다고 합니다. Introducing DBRX: A New State-of-the-Art Open LLM | Databricks Introducing DBRX: A New State-of-the-Art Open LLM | Databricks www.databricks.com DBRX는 트랜스포머 디코더를 사용하는 LLM으로 "mixture-of-experts(MoE)" 아키텍처가 채용되고 있습니다. 파라미터의 총수는 1320억으로 되어 있지만, 모든 입력에.. 2024. 3. 29.
30배나 빠른 AI 이미지 생성 기법을 매사추세츠 공과대학이 개발 DALL-E 3나 Stable Diffusion과 같은 인기 이미지 생성 AI의 확산 모델을 간소화하고 생성되는 이미지의 품질을 유지하면서 생성 속도를 최대 30배 가속시키는 기술을 미국 매사추세츠 공과대학(MIT) 의 연구팀이 공개했습니다. 2311.18828] One-step Diffusion with Distribution Matching Distillation https://arxiv.org/abs/2311.18828 One-step Diffusion with Distribution Matching DistillationDiffusion models generate high-quality images but require dozens of forward passes. We introduce Dis.. 2024. 3. 28.
「조기 사망률」,「다른 도시나 나라로 이사할 것인가」 등 인생을 예측하는 AI 개발 수입이나 직업, 거주지 등 다방면에 걸친 600만 명 이상의 데이터를 바탕으로 알고리즘을 훈련하고, 인간의 조기 사망률이나 성격 등을 예측할 수 있는 AI life2vec를 덴마크 공과대학(DTU) 연구팀이 개발 했습니다. Using sequences of life-events to predict human lives | Nature Computational Science https://www.nature.com/articles/s43588-023-00573-5 life2vec - Official Model and Paper Page https://life2vec.dk/ Scientists invent doom calculator that can predict when you'll DIE and how .. 2024. 3. 28.
대규모 언어 모델의 계산 능력을 증강하는 커스터마이즈 하드웨어를 만드는 스타트업「MatX」 「 대형 AI 모델에 특화되어, 성능을 향상」 하는 것을 목표로 하드웨어를 설계하는 스타트업 「 MatX 」 를, 예전 Google의 엔지니어였던 라이너 포프 씨와 마이크 건터 씨 등이 창업했습니다. MatX | MatX: high throughput chips for LLMs https://matx.com/ MatX | MatX: high throughput chips for LLMsMatX designs hardware tailored for the world’s best AI models: We dedicate every transistor to maximizing performance for large models. Other products put large models and small mod.. 2024. 3. 28.
OpenAI가 동영상 생성 AI 「 Sora 」의 동영상 샘플을 대량 공개 ChatGPT로 잘 알려진 OpenAI는 텍스트를 입력하는 것만으로 고화질의 동영상을 생성할 수 있는 AI 「 Sora 」 의 개발도 진행하고 있습니다. 새롭게, Sora를 사용해 작성된 동영상 샘플이 대량으로 공개되었습니다. Sora: First Impressions https://openai.com/blog/sora-first-impressions Sora: first impressionsWe have gained valuable feedback from the creative community, helping us to improve our model.openai.com Sora는 텍스트를 입력하기만 하면 최대 1분 동안 동영상을 생성할 수 있는 AI입니다. Sora는 동영상 생성 시 물리법칙을 시.. 2024. 3. 28.
텍스트 지시만으로 작업을 실행하고, 다른 AI에게도 가르칠 수 있는 AI가 개발된다 인간과 다른 동물을 분리하는 인지 기능 중 하나는"구두 및 서면 지시"에 따라 다양한 작업을 수행할 수 있다는 것입니다. 이번에 새롭게 스위스 제네바의 연구팀은 텍스트 지침에 따라 작업을 배우고 실행할 수 있고, "형제 AI"도 가르칠 수 있는 AI를 개발하였습니다. Scientists create AI models that can talk to each other and pass on skills with limited human input | Live Science https://www.livescience.com/technology/artificial-intelligence/scientists-create-ai-models-that-can-talk-to-each-other-and-pass-on Sc.. 2024. 3. 26.
반응형