본문 바로가기
반응형

전체 글1721

Google이 오픈 소스 비주얼 언어 모델 'PaliGemma' 공개 Google이 2024년 5월 15일에 비주얼 언어 모델(VLM)인 'PaliGemma'와 대규모 언어 모델(LLM)인 'Gemma 2'를 발표했습니다. PaliGemma는 이미 출시되었으며 쉽게 사용할 수 있는 데모도 공개되었습니다. Introducing PaliGemma, Gemma 2, and an Upgraded Responsible AI Toolkit - Google Developers Blog Introducing PaliGemma, Gemma 2, and an Upgraded Responsible AI ToolkitAt Google, we believe in the power of collaboration and open research to drive innovation, and we're.. 2024. 5. 16.
Google이 영상과 음성을 이해하고 질문에 답하는 AI 에이전트 「Project Astra」 를 발표 Google이 현지 시간인 2024년 5월 14일에 개최한 개발자 이벤트 「Google I/O」 에서, 영상이나 음성을 이해해 실시간으로 질문에 대답해 주는 AI 에이전트 「Project Astra(Astra)」 를 발표했습니다. 실제로, 유저가 스마트폰과 스마트 글라스 카메라로 촬영하고 Astra에 이거 이것 질문하는 데모 영상도 공개되어 있습니다. Google Gemini updates: Flash 1.5, Gemma 2 and Project Astra Gemini breaks new ground with a faster model, longer context, AI agents and moreWe’re sharing updates across our Gemini family of models and.. 2024. 5. 16.
Google이 학습 진화 AI 모델 「LearnLM」 을 발표 Google이 2024년 5월 15일에 개최한 연차 개발자용 회의 'Google I/O 2024'에서 교육 연구에 근거해 학습용으로 미조정된 새로운 AI 모델 'LearnLM'을 발표했습니다. LearnLM의 기반이 되는 것은 Google의 채팅 AI인 Gemini 입니다. How Google's LearnLM generative AI models support teachers and learners How generative AI expands curiosity and understanding with LearnLMLearnLM is our new Gemini\u002Dbased family of models for better learning and teaching experiences.blog.go.. 2024. 5. 16.
Google이 고성능이면서 빠른 경량 AI 모델 「Gemini Flash」 를 발표 Google이 경량이면서 고성능인 AI 모델 「Gemini Flash」 를 2024년 5월 15일(수)에 개최된 「Google I/O 2024」 에서 발표했습니다. Gemini Flash는 Gemini Pro의 10분의 1 가격으로 사용할 수 있으며, 벤치마크 테스트는 Gemini Pro에 필적하는 성능을 보여주었습니다. Gemini Flash - Google DeepMind Gemini FlashOur lightweight model, optimized for when speed and efficiency matter most, with a context window of up to one million tokens.deepmind.google Gemini Flash는 API를 통해 작동하는 Gemin.. 2024. 5. 16.
Google의 AI 사진・영상 검색 기능 「Ask Photos」도입 Google 포토에 AI 'Gemini'가 통합되어 사용자가 질문을 던지면 과거에 촬영한 사진과 동영상을 쉽게 검색할 수 있게 될 것이라고 합니다. Ask Photos: New AI feature coming to Google Photos Ask Photos: A new way to search your photos with GeminiAsk Photos equips you with Google’s most capable AI, Gemini, to find exactly what you are looking for in your gallery.blog.google Gemini를 통합한 콘텐츠 검색 기능 'Ask Photos'를 사용하면 사용자는 '내가 방문한 국립공원의 베스트샷을 보여주세요' 등의 질문을.. 2024. 5. 16.
Google이 자동으로 1분 초과 동영상을 생성할 수 있는 AI 「Veo」 를 발표 입력 텍스트에 따라 고해상도 동영상을 출력하는 생성 AI 'Veo'를 Google이 'Google I/O 2024' 에서 발표했습니다. Google I/O 2024: Introducing Veo and Imagen 3 generative AI tools New generative media models and tools, built with and for creatorsWe introduced Veo for video generation, Imagen 3 for image generation, and released demos recordings from our AI music collaborations.blog.google 이 발표는 기조연설의 약 33 분 53초였습니다. Google DeepMind의.. 2024. 5. 16.
Google이 음악 생성 AI 툴 「Music AI Sandbox」발표 Google은 현지 시간 2024년 5월 14일에 개최된 개발자 이벤트 'Google I/O'에서 간단한 프롬프트로 루프 음원을 만들거나, 멜로디의 장르를 변경하거나, 복잡한 텍스트로 멜로디를 제안할 수 있는 AI 툴 「Music AI Sandbox」 를 발표했습니다. 복수의 뮤지션이 Music AI Sandbox를 사용하는 모습이나, Music AI Sandbox로 작성한 데모 음원도 공개되고 있습니다. Google I/O 발표의 일환으로 Google DeepMind는 "우리는 YouTube와 협력하여 음악 제작 방법을 변화시키는 AI 도구 'Music AI Sandbox'를 구축해 왔습니다. 설계 및 테스트를 위해 , 우리는 뮤지션, 작곡가, 음악 프로듀서와 긴밀하게 협력해 왔습니다."라고 코멘트. .. 2024. 5. 16.
도다이지 남대문 이번 절경은 나라현의 「도다이지(東大寺)」입니다. 나라 공원에서 참배길을 걸어갑니다. 「화엄종대본산 도다이지(華厳宗大本山 東大寺)」라고 하는군요. 물론, 세계 유산 「고도 나라의 문화재」의 구성 유산입니다. 그리고 서서히 보이는 거대한 문은 '일본 3 대문'으로 꼽히는 「남대문(南大門)」입니다. ↑ 다른 두 가지는 닛코 도쇼구의 양명문과 호류지의 남대문입니다. 인왕상은 이런 느낌입니다. 좌우 반대일지도... '남대문'에서 더 나아가면 「나카몬(中門)」으로, 이 앞에서부터는 유료 지역입니다. 그러나, 문의 틈새로 안의「대불전(大仏殿)」을 촬영했습니다.↑ 여기서 차로 되돌아갑니다. 유료 주차장에 안 세워두고, 도로 옆에 둬 가지고 ^^;; 그건 그렇고, 주변에는 사슴과 외국인 투성이입니다. 본토의 일본어는 .. 2024. 5. 14.
AI로 고양이를 행복하게? 영국 노팅엄 대학의 연구 「Cat Royale」 이 다수의 국제상을 수상 영국 노팅엄 대학의 연구팀은 고양이와 AI 로봇이 공존하는 환경을 디자인하고, 고양이의 행복에 어떤 영향을 미치는지 탐구하는 실험 'Cat Royale(캣로얄)'의 성과를 발표했습니다. 이 연구가 평가받아 복수의 국제상을 수상했습니다. 이 연구는 Blast Theory와 노팅엄 대학의 Mixed Reality Lab이 공동으로 개발한 프로젝트로, 고양이들이 AI에 의해 제어되는 환경 내에서 자유롭게 생활할 수 있는 '고양이의 유토피아'를 실현하려는 노력입니다. Cat Royale은 브리즈번의 World Science Festival과 런던의 Science Gallery에 전시되어 AI가 창출하는 유토피아에 대해 관객에게 신뢰와 자율이라는 깊은 문제를 묻는 기회를 제공합니다. 이 연구에서는 3마리의 고양이.. 2024. 5. 13.
1 입방 밀리미터의 뇌 조각을 하버드 대학과 구글 연구원이 나노미터 단위로 3D 매핑하는 데 성공 하버드 대학의 신경과학자인 제프 리흐트만 씨의 연구팀이 뇌 샘플을 두께 34 나노미터로 자르고 전자현미경을 사용하여 구축한 3D맵을 공개했습니다. 3D 매핑된 것은 뇌의 1 입방 밀리미터분으로, 그 데이터 사이즈는 무려 1.4페타바이트(1400 테라바이트)에 이릅니다. Released Data | H01 Release https://h01-release.storage.googleapis.com/data.html 이번에 3D 매핑된 것은 인간의 대뇌피질의 일부로, 학습 및 문제해결, 감각신호의 처리에 관여하는 뇌의 부분입니다. 체적은 불과 약 1 입방 밀리미터로, 이 맵에는 약 5만 7000 개의 세포와 1억 5000만 개의 시냅스가 포함되어 있어, 그 데이터 사이즈는 약 1.4 페타바이트입니다. 리히트먼.. 2024. 5. 13.
반응형