본문 바로가기
반응형

영상생성 AI3

간단한 텍스트로부터 사실적인 동영상을 생성하는 확산 모델 「W.A.L.T」가 등장 스탠퍼드 대학과 Google 연구팀이 텍스트로 사실적인 동영상을 생성하는 확산 모델인 「W.A.L.T」를 발표했습니다. 실제로 「W.A.L.T」를 사용하여 생성한 동영상도 다수 공개되어 있습니다. WALT(pdf 다운로드) https://walt-video-diffusion.github.io/assets/WALT.pdf Photorealistic Video Generation with Diffusion Models https://walt-video-diffusion.github.io/ Photorealistic Video Generation with Diffusion ModelsWe present W.A.L.T, a transformer-based approach for photorealistic vid.. 2023. 12. 13.
영상과 텍스트로 프레임 일관성을 유지하며 실용성 높은 동영상을 생성하는 AI「StableVideo」 생성 AI에 의해 만들어진 동영상에 그려지는 객체나 배경은, 그 모양을 격렬하게 바꾸거나 색이 바뀌거나 하기 때문에 실용성 면에서 부족하다고 할 수 있습니다. 중국 저장대학과 마이크로소프트의 연구팀이 발표한 「StableVideo」는 텍스트 구동 확산 모델에 시간 개념을 도입하는 것으로, 안정적이고도 실용성 높은 영상을 생성하는 것이 가능해졌습니다. rese1f.github.io/StableVideo/ https://rese1f.github.io/StableVideo/Wenhao Chai2, Xun Guo2✉, Gaoang Wang1 Yan Lu2, Abstract Diffusion-based methods can generate realistic images and videos, but they str.. 2023. 8. 23.
NVIDIA가 텍스트로 고해상도 영상을 생성하는 AI 모델  「VideoLDM」 발표 NVIDIA가 미국의 코넬 대학과 공동으로 개발한 AI 모델 "Video Latent Diffusion Model(VideoLDM)"을 발표했습니다. VideoLDM은 텍스트로 입력한 설명에 따라 최대 2048 x 1280픽셀 해상도, 24fps 동영상을 최대 4.7초까지 생성할 수 있습니다. Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models https://research.nvidia.com/labs/toronto-ai/VideoLDM/ NVIDIA Introduces AI That Generates High-resolution Videos Based On Text Descriptions - Tech News .. 2023. 4. 21.
반응형