본문 바로가기
반응형

AI · 인공지능963

ChatGPT 등 수많은 고성능 AI를 낳은 구조 「Attention」 에 대한 상세한 해설 영상 다양한 수학적 주제를 영상으로 해설하는 사이트 「3Blue1Brown」 에서, ChatGPT로 대표되는 AI를 형성하고 있는 「Transformer」 구조의 심장부인 「Attention」 에 대해 해설하고 있습니다. 3Blue1Brown - Visualizing Attention, a Transformer's Heart | Chapter 6, Deep Learning 3Blue1Brown - Visualizing Attention, a Transformer's Heart | Chapter 6, Deep Learning Demystifying attention, the key mechanism inside transformers and LLMs. www.3blue1brown.com AI의 몸체라고도 할 수.. 2024. 4. 17.
일상 회화를 녹음하고 요약할 수 있는 펜던트형 AI 가젯 「Pendant」가 등장 온라인 회의 등의 대화 내용을 녹음하고 AI로 요약할 수 있는 앱 'Limitless'가 2024년 4월 15일(월)에 등장했습니다. 아울러 Limitless의 기능을 일상 대화에까지 확장하는 펜던트형 가젯 「Pendant」 도 발표되고 있습니다. Limitless https://www.limitless.ai/ Limitless Go beyond your mind’s limitations: Personalized AI powered by what you’ve seen, said, and heard. www.limitless.ai Pendant FAQ | Limitless https://help.limitless.ai/en/articles/9124757-pendant-faq Introducing Limit.. 2024. 4. 17.
스탠퍼드 대학의 2024 AI 리포트 「AI Index Report 2024」 최신 AI 연구개발의 현 상황을 정리한 「AI Index Report 2024」 를 스탠퍼드 대학이 공개했습니다. AI Index Report 2024 – Artificial Intelligence Index https://aiindex.stanford.edu/report/ 스탠퍼드 대학은 AI의 능력과 연구 상황 등을 정리한 AI Index Report를 2017년부터 매년 공개하고 있습니다. 2024년 4월 15일에 공개된 AI Index Report 2024에는 2023년까지의 AI에 관한 방대한 데이터를 분석한 결과가 게재되어 있으며, 페이지 수는 502페이지에 달합니다. 보고서의 요점은 다음과 같습니다. ◆ 01:AI는 복수의 과제에서 인간을 이기지만, 모든 과제를 이기는 것은 아니다. ◆ 02.. 2024. 4. 17.
Google이 AI로 무한 길이의 텍스트 처리 능력을 제공하는 기술 발표 Google의 연구원이 대규모 언어 모델(LLM)이 무한한 길이의 텍스트를 처리하게 하는 방법이라는 Infini-attention 에 관한 논문을 발표했습니다. [2404.07143] Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention https://arxiv.org/abs/2404.07143 Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention This work introduces an efficient method to scale Transformer-based Large Language Model.. 2024. 4. 16.
일론 머스크의 xAI가 이미지를 이해할 수 있는 멀티모달 AI 「Grok-1.5」 를 발표 일론 머스크 씨가 설립한 AI 기업 'xAI'가 멀티 모달 AI 모델 'Grok-1.5'를 발표했습니다. Grok-1.5는 화상의 이해가 가능하고, 「순서도를 인식해 코드 작성」, 「영양 성분 표시를 보고 칼로리를 계산」 하는 등의 조작이 가능합니다. Grok-1.5 Vision Preview https://x.ai/blog/grok-1.5v Grok-1.5 Vision Preview April 12, 2024 Grok-1.5 Vision Preview April 12, 2024 Connecting the digital and physical worlds with our first multimodal model. x.ai Grok-1.5는 하나의 모델로 "문장 생성"과 "이미지 인식"에 대응하는 멀티 모.. 2024. 4. 16.
GPU와 AI를 활용해 기존 칩 제조 공장보다 비용은 100분의 1, 크기는 10분의 1, 제조 시간은 5분의 1로 단축 산업용 AI 기업인 Nanotronics는 NVIDIA제 GPU와 AI를 활용해 기존 칩 제조 공장보다 비용을 100분의 1, 크기를 10분의 1, 제조 시간을 5분의 1로 단축할 수 있는 새로운 모듈식 플랜트 「CubeFabs」 를 제안하고 있습니다. Nanotronics promises modular, shippable chip fab facilities powered by Nvidia GPUs and AI | Tom's Hardware Nanotronics promises modular, shippable chip fab facilities powered by Nvidia GPUs and AI Not to be confused for a semiconductor fab, these facilitie.. 2024. 4. 16.
2025~2026년에는 AI 모델 학습 비용이 14조 원에 달해 인류를 위협하는 AI가 등장? AI 개발에는 GPU와 AI 가속기로 구성된 대규모 컴퓨팅 자원이 필요합니다. AI기업 Anthropic의 다리오 아모데이 CEO는 AI 모델의 학습비용이 향후 수년간 약 100억 달러(약 14조 원)에 달할 것으로 추측하고 있습니다. Transcript: Ezra Klein Interviews Dario Amodei - The New York Times Transcript: Ezra Klein Interviews Dario Amodei The April 12, 2024, episode of “The Ezra Klein Show.” www.nytimes.com 대규모 언어 모델 및 멀티 모달 AI 모델을 학습하려면 많은 양의 GPU와 AI 가속기가 필요합니다. NVIDIA나 AMD, Intel 등의 반도.. 2024. 4. 16.
OpenAI의 Sora에 사용된 기술 간단 리뷰 4줄 요약 OpenAI가 초 고품질의 비디오 생성 모델 Sora 출시 이미지 생성 모델 Diffusion-Transformer 사용 동영상을 3차원 이미지로 취급하여 이미지 모델을 확장 캡션은 DALL • E3과 마찬가지로 캡션 생성 모델로 생성 OpenAI 소라 Sora는 OpenAI가 올해 2월에 발표한 동영상 생성 모델입니다. 먼저 이 모델의 출력 예를 살펴보겠습니다. https://cdn.openai.com/sora/videos/big-sur.mp4 각 프레임의 이미지가 매우 아름답게 생성됩니다. 또한, 기존의 동영상 생성에서는 시간이 지났을 때에 찍혀 있는 오브젝트를 유지하는 것이 어렵고, 사라지거나 나타나거나, 갑자기 왜곡하는 것이 많았던 것에 비해, Sora에서는 한 번 사라졌다가 다시 나타.. 2024. 4. 14.
Apple이 스마트폰 화면을 인식할 수 있는 멀티모달 LLM 「Ferret-UI」 를 발표 Apple의 연구원이 스마트폰 앱의 UI를 이해하기 위해 설계한 멀티모달 대규모 언어 모델(MLLM)인 「Ferret-UI」 를 개발했다는 논문을 출판 전 논문 리포지토리인 arXiv에 공개했습니다. [2404.05719] Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMs https://arxiv.org/abs/2404.05719 Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMsRecent advancements in multimodal large language models (MLLMs) have been noteworthy, yet, these general-domain.. 2024. 4. 12.
무료로 1개월에 1200곡까지 AI 작곡이 가능한 「Udio」 퍼블릭 베타판이 공개 브라우저상에서 자동작곡 AI를 이용할 수 있는 서비스 「Udio」 의 퍼블릭 베타판이 2024년 4월 10일에 공개되었습니다. 무료로 1개월에 최대 1200곡까지 생성 가능하다고 하여, 실제로 Udio를 사용해 보았습니다. Udio | Make your music https://www.udio.com/ Udio | Make your musicDiscover, create, and share music with the world.www.udio.com Udio에 액세스 하면 이런 느낌입니다. 오른쪽 상단의 "Sign In"을 클릭 Udio의 이용 등록은 Google 계정 · Discord 계정 · X(구 Twitter) 계정으로 가능합니다. 이번에는 Google 계정으로 이용 등록하기 위해 "Sign in.. 2024. 4. 12.
반응형