본문 바로가기
반응형

AI · 인공지능835

GPT-4o의 중국어 토큰은 포르노와 스팸으로 오염됨 OpenAI의 최신 AI 모델 "GPT-4o"가 발표되었습니다. 텍스트나 음성, 카메라 입력을 인간 수준의 속도로 처리 가능한 높은 성능으로 보도되고 있습니다만, 한편, 중국어 유저로부터는, 트레이닝에 큰 문제를 안고 있어, 토큰 데이터가 오염되어 있다고 지적했습니다. OpenAI 's GPT-4o has a Chinese Porn and Spam Problem - WinBuzzer https://winbuzzer.com/2024/05/18/gpt-4os-chinese-tokens-raise-concerns-over-data-quality-xcxwbn/ 문제를 지적한 것은 프린스턴 대학의 박사과정 학생으로 대규모 언어 모델의 추론 효율을 연구하고 있는 蔡天楽 씨입니다. AI는 입력된 문장을 '토큰'이라는.. 2024. 5. 21.
스탠퍼드대 연구 그룹이 GPU를 고속으로 동작시키는 AI용 도메인 고유 언어 「ThunderKittens」 출시 스탠퍼드 대학의 크리스토퍼 레 교수가 이끄는 연구팀이 GPU를 최대한 활용하여 일정 시간당 연산량을 극대화하기 위한 도메인 고유 언어(DSL : 도메인 특화 언어라고도 하며, 특정 태스크용으로 설계된 컴퓨터 언어) 「ThunderKittens」 를 출시했습니다. ThunderKittens: A Simple Embedded DSL for AI kernels · Hazy Research ThunderKittens: A Simple Embedded DSL for AI kernelsgood abstractions are good.hazyresearch.stanford.edu 이 연구팀은 NVIDIA H100을 사용하여 GPU 사용률을 극대화하기 위해 노력했습니다. H100은 Tensor 코어를 사용하는 반정밀 .. 2024. 5. 17.
OpenAI가 「GPT-4o(옴니: omni)」 를 발표 OpenAI가 2024년 5월 14일(화)에 AI 모델 「GPT-4o」 를 발표했습니다. GPT-4o는 단일 모델로 텍스트, 음성, 시각 입력을 매우 고속으로 처리 가능하며, 실시간으로 대화하면서 "계산 문제 해결", "이미지 생성", "주위 영상에서 상황을 판단"하는 작업을 실행할 수 있습니다. Hello GPT-4o | OpenAI https://openai.com/index/hello-gpt-4o/ GPT-4o는 텍스트, 음성, 시각 입력을 빠르게 처리할 수 있는 멀티모달 AI 모델입니다. GPT-4o의 응답 시간은 평균 320ms이며 음성 입력은 232ms 정도로 사람과 동등한 속도로 응답할 수 있습니다. 또한 GPT-4o의 "o"는 "모든", "전체의"등을 의미하는 "omni"를 줄여서 표시한 .. 2024. 5. 17.
Google이 오픈 소스 비주얼 언어 모델 'PaliGemma' 공개 Google이 2024년 5월 15일에 비주얼 언어 모델(VLM)인 'PaliGemma'와 대규모 언어 모델(LLM)인 'Gemma 2'를 발표했습니다. PaliGemma는 이미 출시되었으며 쉽게 사용할 수 있는 데모도 공개되었습니다. Introducing PaliGemma, Gemma 2, and an Upgraded Responsible AI Toolkit - Google Developers Blog Introducing PaliGemma, Gemma 2, and an Upgraded Responsible AI ToolkitAt Google, we believe in the power of collaboration and open research to drive innovation, and we're.. 2024. 5. 16.
Google이 영상과 음성을 이해하고 질문에 답하는 AI 에이전트 「Project Astra」 를 발표 Google이 현지 시간인 2024년 5월 14일에 개최한 개발자 이벤트 「Google I/O」 에서, 영상이나 음성을 이해해 실시간으로 질문에 대답해 주는 AI 에이전트 「Project Astra(Astra)」 를 발표했습니다. 실제로, 유저가 스마트폰과 스마트 글라스 카메라로 촬영하고 Astra에 이거 이것 질문하는 데모 영상도 공개되어 있습니다. Google Gemini updates: Flash 1.5, Gemma 2 and Project Astra Gemini breaks new ground with a faster model, longer context, AI agents and moreWe’re sharing updates across our Gemini family of models and.. 2024. 5. 16.
Google이 학습 진화 AI 모델 「LearnLM」 을 발표 Google이 2024년 5월 15일에 개최한 연차 개발자용 회의 'Google I/O 2024'에서 교육 연구에 근거해 학습용으로 미조정된 새로운 AI 모델 'LearnLM'을 발표했습니다. LearnLM의 기반이 되는 것은 Google의 채팅 AI인 Gemini 입니다. How Google's LearnLM generative AI models support teachers and learners How generative AI expands curiosity and understanding with LearnLMLearnLM is our new Gemini\u002Dbased family of models for better learning and teaching experiences.blog.go.. 2024. 5. 16.
Google이 고성능이면서 빠른 경량 AI 모델 「Gemini Flash」 를 발표 Google이 경량이면서 고성능인 AI 모델 「Gemini Flash」 를 2024년 5월 15일(수)에 개최된 「Google I/O 2024」 에서 발표했습니다. Gemini Flash는 Gemini Pro의 10분의 1 가격으로 사용할 수 있으며, 벤치마크 테스트는 Gemini Pro에 필적하는 성능을 보여주었습니다. Gemini Flash - Google DeepMind Gemini FlashOur lightweight model, optimized for when speed and efficiency matter most, with a context window of up to one million tokens.deepmind.google Gemini Flash는 API를 통해 작동하는 Gemin.. 2024. 5. 16.
Google의 AI 사진・영상 검색 기능 「Ask Photos」도입 Google 포토에 AI 'Gemini'가 통합되어 사용자가 질문을 던지면 과거에 촬영한 사진과 동영상을 쉽게 검색할 수 있게 될 것이라고 합니다. Ask Photos: New AI feature coming to Google Photos Ask Photos: A new way to search your photos with GeminiAsk Photos equips you with Google’s most capable AI, Gemini, to find exactly what you are looking for in your gallery.blog.google Gemini를 통합한 콘텐츠 검색 기능 'Ask Photos'를 사용하면 사용자는 '내가 방문한 국립공원의 베스트샷을 보여주세요' 등의 질문을.. 2024. 5. 16.
Google이 자동으로 1분 초과 동영상을 생성할 수 있는 AI 「Veo」 를 발표 입력 텍스트에 따라 고해상도 동영상을 출력하는 생성 AI 'Veo'를 Google이 'Google I/O 2024' 에서 발표했습니다. Google I/O 2024: Introducing Veo and Imagen 3 generative AI tools New generative media models and tools, built with and for creatorsWe introduced Veo for video generation, Imagen 3 for image generation, and released demos recordings from our AI music collaborations.blog.google 이 발표는 기조연설의 약 33 분 53초였습니다. Google DeepMind의.. 2024. 5. 16.
Google이 음악 생성 AI 툴 「Music AI Sandbox」발표 Google은 현지 시간 2024년 5월 14일에 개최된 개발자 이벤트 'Google I/O'에서 간단한 프롬프트로 루프 음원을 만들거나, 멜로디의 장르를 변경하거나, 복잡한 텍스트로 멜로디를 제안할 수 있는 AI 툴 「Music AI Sandbox」 를 발표했습니다. 복수의 뮤지션이 Music AI Sandbox를 사용하는 모습이나, Music AI Sandbox로 작성한 데모 음원도 공개되고 있습니다. Google I/O 발표의 일환으로 Google DeepMind는 "우리는 YouTube와 협력하여 음악 제작 방법을 변화시키는 AI 도구 'Music AI Sandbox'를 구축해 왔습니다. 설계 및 테스트를 위해 , 우리는 뮤지션, 작곡가, 음악 프로듀서와 긴밀하게 협력해 왔습니다."라고 코멘트. .. 2024. 5. 16.
반응형