본문 바로가기

AI · 인공지능/이미지 생성 AI143

Google이 초 고품질의 동영상 생성 AI 「Lumiere」를 발표 Google의 연구팀이 동영상 생성 AI 「Lumiere」를 2024년 1월 24일(수)에 발표했습니다. Lumiere https://lumiere-video.github.io/ Lumiere - Google ResearchSpace-Time Text-to-Video diffusion model by Google Research.lumiere-video.github.io Lumiere에서는 프레임끼리 자연스럽게 연결된 위화감이 적은 동영상을 생성 가능하며, 텍스트나 이미지를 입력하여 동영상을 생성할 수 있으며, 동영상의 일부를 지정하여 다른 동영상으로 바꾸거나 사진의 일부만 움직이는 조작도 가능합니다. 텍스트나 이미지를 입력하여 동영상을 생성할 수 있는 AI가 많이 존재하고 있습니다만, 이러한 AI의 대.. 2024. 1. 26.
TikTok의 모회사 ByteDance가 텍스트로 고품질 동영상을 생성하는 AI「MagicVideo-V2」발표 TikTok의 모회사인 ByteDance의 연구팀이 텍스트에 충실하게 고품질 동영상을 생성하는 AI, MagicVideo-V2를 발표했습니다. 인간의 성능 평가에서 MagicVideo-V2가 텍스트로 동영상을 생성하는 다른 최첨단 AI보다 우수하다는 결과를 얻었습니다. [2401.04468] MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation https://arxiv.org/abs/2401.04468 MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation https://magicvideov2.github.io/ MagicVideo-V2: Multi-Stage High-Aesthetic Video Gen.. 2024. 1. 22.
초당 100장 이상의 화상을 생성할 수 있는 고속 화상 생성 파이프라인 「StreamDiffusion」이 등장 소스로부터의 데이터 입력, 기계 학습 모델에의 데이터 출력, 학습 패턴의 조정이라는 일련의 처리 구조인「파이프 라인」을 리얼타임 이미지 생성을 위해서 최적화된 「StreamDiffusion 」이 등장했습니다. [2312.12491] StreamDiffusion: A Pipeline-level Solution for Real-time Interactive Generation https://arxiv.org/abs/2312.12491 StreamDiffusion: A Pipeline-level Solution for Real-time Interactive GenerationWe introduce StreamDiffusion, a real-time diffusion pipeline designed for in.. 2023. 12. 26.
간단한 텍스트로부터 사실적인 동영상을 생성하는 확산 모델 「W.A.L.T」가 등장 스탠퍼드 대학과 Google 연구팀이 텍스트로 사실적인 동영상을 생성하는 확산 모델인 「W.A.L.T」를 발표했습니다. 실제로 「W.A.L.T」를 사용하여 생성한 동영상도 다수 공개되어 있습니다. WALT(pdf 다운로드) https://walt-video-diffusion.github.io/assets/WALT.pdf Photorealistic Video Generation with Diffusion Models https://walt-video-diffusion.github.io/ Photorealistic Video Generation with Diffusion ModelsWe present W.A.L.T, a transformer-based approach for photorealistic vid.. 2023. 12. 13.
Meta가 이미지 생성 AI「Imagine」을 무료로 사용할 수 있는 웹 앱을 출시 Meta가 이미지 생성 AI 'Imagine'을 무료로 사용할 수 있는 웹 앱 「Imagine With Meta AI」를 공개했습니다. Imagine With Meta AI는 무료로 이용 가능하며, 문장(프롬프트)을 입력하는 것만으로 이미지를 4장 생성할 수 있다는 것. What's New Across Our AI Experiences | Meta What’s New Across Our AI Experiences | MetaWe're adding new features to Meta AI and testing more than 20 new ways generative AI can improve your experiences across Facebook, Instagram, Messenger and Wha.. 2023. 12. 8.
Amazon이 프롬프트형 이미지 생성 AI "Titan Image Generator"의 미리보기 버전을 출시 2023년 11월 27일부터 12월 1일에 걸쳐 미국 라스베이거스에서 개최되는 AWS 컨퍼런스 이벤트 'AWS re:Invent'에서 Amazon이 이미지 생성 AI 'Titan Image Generator'의 미리보기 버전을 발표했습니다. Amazon Titan Image Generator, Multimodal Embeddings, and Text models are now available in Amazon Bedrock | AWS News Blog Amazon Titan Image Generator, Multimodal Embeddings, and Text models are now available in Amazon Bedrock | Amazon Web ServicesToday, we’re int.. 2023. 12. 1.
드디어 Windows의 「그림판」에도 AI가 탑재되어 이미지 생성이 가능 Windows의 표준 그림 그리기 앱인 "그림판"에 이미지 생성 기능을 추가하는 업데이트가 실시되었습니다. 이미지 생성 기능은 OpenAI가 개발한 이미지 생성 AI "DALL-E"를 사용하여 실현되고 있습니다. 페인트 코크리에이터를 사용하여 AI 아트 생성 - Microsoft 지원 https://support.microsoft.com/ko-kr/windows/107a2b3a-62ea-41f5-a638-7bc6e6ea718f 그림판 공동 작성기를 사용하여 AI 아트 생성 - Microsoft 지원구독 혜택을 살펴보고, 교육 과정을 찾아보고, 디바이스를 보호하는 방법 등을 알아봅니다. 커뮤니티를 통해 질문하고 답변하고, 피드백을 제공하고, 풍부한 지식을 갖춘 전문가의 의견을 들을 support.micro.. 2023. 12. 1.
AI가 1장의 사진으로부터 고해상도 3DCG 모델을 생성해주는「Human-SGD」 사진에서 3DCG 모델을 만들려면 피사체를 여러 방향에서 다수 촬영해야 합니다. 쿠웨이트 대학, Meta, 메릴랜드 대학의 연구원이 단 한 장의 사진에서 고해상도 CG 모델을 생성하는 "Human-SGD"를 발표했습니다. [2311.09221] Single-Image 3D Human Digitization with Shape-Guided Diffusion https://arxiv.org/abs/2311.09221 Single-Image 3D Human Digitization with Shape-Guided DiffusionWe present an approach to generate a 360-degree view of a person with a consistent, high-resolution app.. 2023. 11. 27.
텍스트나 이미지로부터 동영상을 생성하는 AI 「Stable Video Diffusion」을 Stability AI가 공개 이미지 생성 AI 「Stable Diffusion」을 개발하는 Stability AI가 텍스트나 화상으로부터 고해상도의 동영상을 생성할 수 있는 잠재 동영상 확산 모델 「Stable Video Diffusion 」을 공개했습니다. Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets — Stability AI Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets — Stability AIWe present Stable Video Diffusion — a latent video diffusion model for high-reso.. 2023. 11. 23.
Meta가 문장으로부터 위화감 없는 동영상을 생성하는 AI 「Emu Video」를 발표 Meta가 문장으로 동영상을 생성할 수 있는 AI 「Emu Video」와, 문장으로 지시해 이미지를 편집할 수 있는 AI 「Emu Edit」를 2023년 11월 16일(목)에 발표했습니다(예시를 모은 데모 사이트도 준비되어 있습니다). Emu Video and Emu Edit: Our latest generative AI research milestones https://ai.meta.com/blog/emu-text-to-video-generation-image-editing-research/ Emu Video | Meta https://emu-video.metademolab.com/ Emu VideoFactorizing Text-to-Video Generation by Explicit Image Con.. 2023. 11. 21.