반응형 영상생성 AI2 간단한 텍스트로부터 사실적인 동영상을 생성하는 확산 모델 「W.A.L.T」가 등장 스탠퍼드 대학과 Google 연구팀이 텍스트로 사실적인 동영상을 생성하는 확산 모델인 「W.A.L.T」를 발표했습니다. 실제로 「W.A.L.T」를 사용하여 생성한 동영상도 다수 공개되어 있습니다. WALT(pdf 다운로드) https://walt-video-diffusion.github.io/assets/WALT.pdf Photorealistic Video Generation with Diffusion Models https://walt-video-diffusion.github.io/ Photorealistic Video Generation with Diffusion ModelsWe present W.A.L.T, a transformer-based approach for photorealistic vid.. 2023. 12. 13. NVIDIA가 텍스트로 고해상도 영상을 생성하는 AI 모델 「VideoLDM」 발표 NVIDIA가 미국의 코넬 대학과 공동으로 개발한 AI 모델 "Video Latent Diffusion Model(VideoLDM)"을 발표했습니다. VideoLDM은 텍스트로 입력한 설명에 따라 최대 2048 x 1280픽셀 해상도, 24fps 동영상을 최대 4.7초까지 생성할 수 있습니다. Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models https://research.nvidia.com/labs/toronto-ai/VideoLDM/ NVIDIA Introduces AI That Generates High-resolution Videos Based On Text Descriptions - Tech News .. 2023. 4. 21. 이전 1 다음 반응형