본문 바로가기
반응형

분류 전체보기1836

GPT-4o의 중국어 토큰은 포르노와 스팸으로 오염됨 OpenAI의 최신 AI 모델 "GPT-4o"가 발표되었습니다. 텍스트나 음성, 카메라 입력을 인간 수준의 속도로 처리 가능한 높은 성능으로 보도되고 있습니다만, 한편, 중국어 유저로부터는, 트레이닝에 큰 문제를 안고 있어, 토큰 데이터가 오염되어 있다고 지적했습니다. OpenAI 's GPT-4o has a Chinese Porn and Spam Problem - WinBuzzer https://winbuzzer.com/2024/05/18/gpt-4os-chinese-tokens-raise-concerns-over-data-quality-xcxwbn/ 문제를 지적한 것은 프린스턴 대학의 박사과정 학생으로 대규모 언어 모델의 추론 효율을 연구하고 있는 蔡天楽 씨입니다. AI는 입력된 문장을 '토큰'이라는.. 2024. 5. 21.
여름의 가이라쿠엔 이번 절경은 이바라키현의 「가이라쿠엔(偕楽園)」입니다. 「카이라쿠엔」은 「백성과 함께 즐기는 유원지」로서 미토(水戸) 제9대 번주 도쿠가와 나리아키(徳川斉昭) 공이 스스로 창설한 것이라고 합니다. 오카야마의 '고라쿠엔', 가나자와의 '겐로쿠엔'과 함께 '일본의 3대 명원(日本三名園)'의 하나로 꼽히고 있습니다. 무료 주차장에 차를 두고 입장료도 무료인 가이라쿠엔 '남문'에서 원내로... 요번에는 사진이 별로 없어서 큰일이네요 ^^; 원내를 걷다 보면 물이 솟아나고 있는 「토교쿠센(吐玉泉)」이 있습니다. 그리고, 나리아키 공 스스로 그 위치를 결정했다고 하는「코우분테이(好文亭 2024. 5. 20.
스탠퍼드대 연구 그룹이 GPU를 고속으로 동작시키는 AI용 도메인 고유 언어 「ThunderKittens」 출시 스탠퍼드 대학의 크리스토퍼 레 교수가 이끄는 연구팀이 GPU를 최대한 활용하여 일정 시간당 연산량을 극대화하기 위한 도메인 고유 언어(DSL : 도메인 특화 언어라고도 하며, 특정 태스크용으로 설계된 컴퓨터 언어) 「ThunderKittens」 를 출시했습니다. ThunderKittens: A Simple Embedded DSL for AI kernels · Hazy Research ThunderKittens: A Simple Embedded DSL for AI kernelsgood abstractions are good.hazyresearch.stanford.edu 이 연구팀은 NVIDIA H100을 사용하여 GPU 사용률을 극대화하기 위해 노력했습니다. H100은 Tensor 코어를 사용하는 반정밀 .. 2024. 5. 17.
얼굴로 마우스 커서를 조작하는 「Project Gameface」 가 오픈 소스화 Google이 I/O 2023에서 발표한, 눈썹이나 입의 움직임 등으로 마우스 커서를 컨트롤할 수 있는 오픈 소스 프로젝트 'Project Gameface'가 Android에서도 사용할 수 있게 될 것으로 발표되었습니다. Project Gameface launches on Android - Google Developers Blog https://developers.googleblog.com/en/project-gameface-launches-on-android/ Project Gameface launches on AndroidAt I/O 2023, we launched Project Gameface, an open-source, hands-free gaming ‘mouse’ enabling people .. 2024. 5. 17.
OpenAI가 「GPT-4o(옴니: omni)」 를 발표 OpenAI가 2024년 5월 14일(화)에 AI 모델 「GPT-4o」 를 발표했습니다. GPT-4o는 단일 모델로 텍스트, 음성, 시각 입력을 매우 고속으로 처리 가능하며, 실시간으로 대화하면서 "계산 문제 해결", "이미지 생성", "주위 영상에서 상황을 판단"하는 작업을 실행할 수 있습니다. Hello GPT-4o | OpenAI https://openai.com/index/hello-gpt-4o/ GPT-4o는 텍스트, 음성, 시각 입력을 빠르게 처리할 수 있는 멀티모달 AI 모델입니다. GPT-4o의 응답 시간은 평균 320ms이며 음성 입력은 232ms 정도로 사람과 동등한 속도로 응답할 수 있습니다. 또한 GPT-4o의 "o"는 "모든", "전체의"등을 의미하는 "omni"를 줄여서 표시한 .. 2024. 5. 17.
Google이 오픈 소스 비주얼 언어 모델 'PaliGemma' 공개 Google이 2024년 5월 15일에 비주얼 언어 모델(VLM)인 'PaliGemma'와 대규모 언어 모델(LLM)인 'Gemma 2'를 발표했습니다. PaliGemma는 이미 출시되었으며 쉽게 사용할 수 있는 데모도 공개되었습니다. Introducing PaliGemma, Gemma 2, and an Upgraded Responsible AI Toolkit - Google Developers Blog Introducing PaliGemma, Gemma 2, and an Upgraded Responsible AI ToolkitAt Google, we believe in the power of collaboration and open research to drive innovation, and we're.. 2024. 5. 16.
Google이 영상과 음성을 이해하고 질문에 답하는 AI 에이전트 「Project Astra」 를 발표 Google이 현지 시간인 2024년 5월 14일에 개최한 개발자 이벤트 「Google I/O」 에서, 영상이나 음성을 이해해 실시간으로 질문에 대답해 주는 AI 에이전트 「Project Astra(Astra)」 를 발표했습니다. 실제로, 유저가 스마트폰과 스마트 글라스 카메라로 촬영하고 Astra에 이거 이것 질문하는 데모 영상도 공개되어 있습니다. Google Gemini updates: Flash 1.5, Gemma 2 and Project Astra Gemini breaks new ground with a faster model, longer context, AI agents and moreWe’re sharing updates across our Gemini family of models and.. 2024. 5. 16.
Google이 학습 진화 AI 모델 「LearnLM」 을 발표 Google이 2024년 5월 15일에 개최한 연차 개발자용 회의 'Google I/O 2024'에서 교육 연구에 근거해 학습용으로 미조정된 새로운 AI 모델 'LearnLM'을 발표했습니다. LearnLM의 기반이 되는 것은 Google의 채팅 AI인 Gemini 입니다. How Google's LearnLM generative AI models support teachers and learners How generative AI expands curiosity and understanding with LearnLMLearnLM is our new Gemini\u002Dbased family of models for better learning and teaching experiences.blog.go.. 2024. 5. 16.
Google이 고성능이면서 빠른 경량 AI 모델 「Gemini Flash」 를 발표 Google이 경량이면서 고성능인 AI 모델 「Gemini Flash」 를 2024년 5월 15일(수)에 개최된 「Google I/O 2024」 에서 발표했습니다. Gemini Flash는 Gemini Pro의 10분의 1 가격으로 사용할 수 있으며, 벤치마크 테스트는 Gemini Pro에 필적하는 성능을 보여주었습니다. Gemini Flash - Google DeepMind Gemini FlashOur lightweight model, optimized for when speed and efficiency matter most, with a context window of up to one million tokens.deepmind.google Gemini Flash는 API를 통해 작동하는 Gemin.. 2024. 5. 16.
Google의 AI 사진・영상 검색 기능 「Ask Photos」도입 Google 포토에 AI 'Gemini'가 통합되어 사용자가 질문을 던지면 과거에 촬영한 사진과 동영상을 쉽게 검색할 수 있게 될 것이라고 합니다. Ask Photos: New AI feature coming to Google Photos Ask Photos: A new way to search your photos with GeminiAsk Photos equips you with Google’s most capable AI, Gemini, to find exactly what you are looking for in your gallery.blog.google Gemini를 통합한 콘텐츠 검색 기능 'Ask Photos'를 사용하면 사용자는 '내가 방문한 국립공원의 베스트샷을 보여주세요' 등의 질문을.. 2024. 5. 16.
반응형