본문 바로가기
반응형

분류 전체보기1836

AI로 생성한 영상에서 흔한 「화면 깜박임」을 개선하는 「CoDeF」 AI로 생성된 동영상을 보면 연속적인 움직임 속에서 컨텍스트를 무시하도록 객체가 갑자기 다른 물건으로 바뀌거나, 대충 그린 그림처럼 영상이 흔들리거나 뭉개지는 경우가 종종 있습니다. 이러한 문제를 개선하는 Content Deformation Field(CoDeF: 콘텐츠 변형 필드)가 공개되었습니다. CoDeF 소개 : Content Deformation Fields for Temporally Consistent Video Processing https://qiuyu96.github.io/CoDeF/ CoDeFWe present the content deformation field (CoDeF) as a new type of video representation, which consists of a ca.. 2023. 8. 23.
영상과 텍스트로 프레임 일관성을 유지하며 실용성 높은 동영상을 생성하는 AI「StableVideo」 생성 AI에 의해 만들어진 동영상에 그려지는 객체나 배경은, 그 모양을 격렬하게 바꾸거나 색이 바뀌거나 하기 때문에 실용성 면에서 부족하다고 할 수 있습니다. 중국 저장대학과 마이크로소프트의 연구팀이 발표한 「StableVideo」는 텍스트 구동 확산 모델에 시간 개념을 도입하는 것으로, 안정적이고도 실용성 높은 영상을 생성하는 것이 가능해졌습니다. rese1f.github.io/StableVideo/ https://rese1f.github.io/StableVideo/Wenhao Chai2, Xun Guo2✉, Gaoang Wang1 Yan Lu2, Abstract Diffusion-based methods can generate realistic images and videos, but they str.. 2023. 8. 23.
Google이 「대규모 시각 모델(LVM)」 에 대해 해설, 데모도 공개 Google이 대규모 언어 모델(LLM)에 「시각」을 부여한 「대규모 시각 모델(LVM)」 데모를 공개함과 동시에, LVM의 구조에 대한 해설 기사를 올렸습니다. Multimodal generative AI search | Google Cloud Blog Multimodal generative AI search | Google Cloud BlogAdding vision capabilities to LLMs.cloud.google.com LVM 데모는 「https://ai- demos.dev/」에 게시되었습니다. 이 사이트에는 여러 데모가 함께 공개되어 있는데요, 우선 'MERCARI TEXT-TO-IMAGE'를 클릭하여 LVM 데모를 표시합니다. 이 데모는 그 이름에도 MERCARI라고 적혀있듯이, 메르.. 2023. 8. 23.
알리바바 클라우드가 대규모 언어 모델 「퉁이치엔원(Tongyi Qianwen)」을 오픈소스로 공개 알리바바 클라우드는 2023년 8월 3일, 70억 파라미터의 대규모 언어 모델「통의천문(Tongyi Qianwen : 퉁위치엔원)」을 바탕으로 한 기반 모델 「Qwen-7B」와 대화형 AI용 모델 「Qwen - 7B- Chat」의 오픈소스 코드를 공개했습니다. 이 코드는, 알리바바 클라우드가 운영하는 개발자용 AI 모델 커뮤니티 「마탑(ModelScope)」과 「Hugging Face」에서 무료로 이용 가능하며, 상용 이용도 인정되고 있습니다. 이는 중국 IT 대기업으로서는 첫 시도로, 화제를 부르고 있습니다. Qwen-7B는 웹 텍스트, 서적, 코드 등을 포함한 2조 2,000억 토큰으로 학습하며, 일반 분야에서 전문 분야까지 다루고 있습니다. 중국어와 영어 어휘를 기반으로 하는 다른 오픈 소스 모델에.. 2023. 8. 23.
미 정부가 「AI 사이버 챌린지」를 개시, 상금 총액은 2천만 달러 미국 바이든 정권은 인터넷과 중요 인프라를 운영하기 위한 코드 등 미국의 가장 중요한 소프트웨어 보호를 목적으로 2년간 'AI 사이버 챌린지(AIxCC)' 경기를 시작한다고 발표했습니다. Biden-Harris Administration Launches Artificial Intelligence Cyber Challenge to Protect America’s Critical Software | The WhitSeveral leading AI companies – Anthropic, Google, Microsoft, and OpenAI – to partner with DARPA in major competition to make software more secure The Biden-Harris Admi.. 2023. 8. 23.
도쿄대학 마츠오 연구실에서 대규모 언어 모델 「Weblab-10B」를 오픈소스로 공개 딥러닝 연구로 알려진 도쿄대학의 마츠오 유타카 교수의 연구실이 오픈소스 대규모 언어 모델「Weblab-10B」를 2023년 8월 18일 자로 공개했습니다. 100억 파라미터 사이즈로 일본어/영어 2개 국어에 대응합니다. 사전 학습이 끝난 모델, 파인 튜닝(미세조정)이 끝난 모델을 각각 AI 플랫폼 「Hugging Face」에서 이용 가능합니다. 최근의 LLM의 주류는 인터넷으로부터 수집한 대량의 텍스트 데이터를 학습에 이용하지만, 대부분은 영어를 비롯한 주요 언어로 구성되어 있어, 일본어 텍스트 데이터를 대량 수집하는 것은 현재로서는 한계가 있습니다. 그래서 마츠오 연구실은 일본어뿐만 아니라 영어의 데이터 세트도 학습에 이용함으로써 데이터량을 확장하고, 언어 사이의 지식 전이를 실시하여 일본어의 정밀도를.. 2023. 8. 22.
애플은 수 년 전부터 생성 AI를 연구하고 있었다 미국 Apple의 Tim Cook CEO는 2023년 8월 3일 CNBC와의 인터뷰에서 회사가 생성 AI 및 기타 모델에 대한 연구를 오랫동안 진행해 왔다고 말했습니다. https://www.cnbc.com/2023/08/03/apple-earnings-live-updates.html Apple beats soft expectations driven by 8% services growth: Live updatesThe June period is typically Apple's slowest quarter of the year.www.cnbc.com CNBC에 따르면 애플의 2023년도 3분기 보고에서 크게 부족한 테마 중 하나가 바로 AI입니다. 다른 기업들이 'ChatGPT'와 같은 AI 서비스와 이와.. 2023. 8. 22.
OpenAI가 전 인스타그램 개발자들의 기업「Global Illumination」을 인수, AI 크리에이티브 툴을 취급 대화형 AI인 'ChatGPT' 등의 개발을 다루는 미국 기업 OpenAI는 미국의 글로벌 일루미네이션(Global Illumination)을 인수했다고 발표했습니다. 글로벌 일루미네이션은 미국 Meta 산하의 사진 SNS인 'Instagram'의 전 개발자들이 소속된 기업입니다. 글로벌 일루미네이션은 뉴욕에 거점을 두고 AI를 활용하여 창조적인 툴과 인프라, 디지털 체험을 구축하고 있다고 합니다. 이 회사에 소속된 Thomas Dimson 씨, Taylor Gordon 씨, Joey Flynn 씨 등은 이전에 Instagram 외에 Facebook의 초기 제품을 설계 · 구축해 YouTube, Google, Pixar Studios, Riot Games 등의 사업에도 접해왔습니다. 또한 글로벌 일루미네.. 2023. 8. 22.
AI 탤런트를 투표로 직접 변화시키는 NFT를 「fandao 마켓」에서 서비스 개시 SNAFTY는 8월 8일 NFT 마켓플레이스 'fandao 마켓'에서 생성 AI를 활용한 AI 탤런트 NFT를 출시하기 시작했습니다. 이 AI 탤런트는 인플루언서의 SNS 투고 경향을 학습하고 실존하는 인물처럼 콘텐츠를 자동으로 생성합니다. 또한 NFT 홀더는 AI 탤런트의 헤어스타일이나 취미 등을 투표로 결정할 수 있습니다. 이 NFT 시장 내에서는 팬 커뮤니티의 활동이나 AI 매니저의 지원이 AI 탤런트의 일상에 영향을 주는 기능도 추가될 예정입니다. 또한, 한층 더 버라이어티 한 AI 아이돌이 순차적으로 데뷔할 예정으로, 장래에는 감정을 가진 음성 대화 기능도 도입될 예정입니다. 기업과의 컬래버레이션이나 오디션도 진행 중이며, 인기 AI 탤런트는 광고 모델이나 아티스트 데뷔도 고려하고 있습니다. 또.. 2023. 8. 22.
전 구글의 AI 연구원 톱 2명이 도쿄에 스타트업 「Sakana AI」를 설립하고 차세대 기술에 도전 AI 혁신과 관련된 논문 'Attention Is All You Need'의 공동 저자이면서 Google을 마지막으로 떠난 Llion Jones 씨와 Google 일본법인의 AI 연구부문 책임자였던 David Ha 씨가 2023년 8월 17일, 도쿄에 새로운 스타트업 「Sakana AI」를 설립한다고 발표했습니다. 텍스트나 이미지, 코드 등의 생성 AI 개발을 예정하고 있습니다. Jones 씨 가 공저한 논문은 대규모 언어 모델(LLM)의 중요한 요소가 되어, ChatGPT 등의 AI 제품을 지지하는 기술이 되고 있습니다. 또한, Ha 씨는, Stable Diffusion을 낳은 영국 Stability AI의 전 연구 책임자입니다. 새 회사의 'Sakana'라는 명칭은 물고기를 의미하는 '魚(さかな : .. 2023. 8. 22.
반응형