Adobe가 영상의 업스케일이 가능한 AI 「VideoGigaGAN」 을 발표했습니다. VideoGigaGAN은 기존의 영상 업스케일 AI와 비교하여 깔끔한 묘사가 가능하며, 프레임 간의 깜박임도 억제되고 있습니다.
VideoGigaGAN
https://videogigagan.github.io/
VideoGigaGAN
Video super-resolution (VSR) approaches have shown impressive temporal consistency in upsampled videos. However, these approaches tend to generate blurrier results than their image counterparts as they are limited in their generative capability. This raise
videogigagan.github.io
Adobe는 VideoGigaGAN의 성능을 보여주는 예로 128×128픽셀의 영상을 종횡 8배의 1024×1024픽셀로 업스케일한 데모를 공개하고 있습니다.

오리지널 영상(왼쪽)과 업 스케일 후의 영상(오른쪽)을 비교한 것이 이하. 상당히 고화질로 업스케일되고 있는 것을 알 수 있습니다.

폭포의 영상을 업스케일하면 이런 느낌. 업 스케일 후의 영상(오른쪽)은 오리지널 영상(왼쪽)과 비교해 물이나 식물이 깨끗하게 묘사되었습니다.

Adobe에 의하면, VideoGigaGAN은 기존의 영상 업 스케일 AI와 비교해 디테일의 재현성이 뛰어나고, 깜빡임도 억제할 수 있다고 합니다. Adobe는 BasicVSR(좌상), BasicVSR++(우상), TTVSR(좌하) 등 영상 업스케일 AI와 VideoGigaGAN(우하)의 처리 결과를 비교하여 VideoGigaGAN의 성능을 어필하고 있습니다.

덧붙여 VideoGigaGAN의 기술적인 상세는 아래에서 확인할 수 있습니다.
[2404.12388] VideoGigaGAN: Towards Detail-rich Video Super-Resolution
https://arxiv.org/abs/2404.12388

'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
Google DeepMind가 동영상에 딱 맞는 음악을 생성하는「video-to-audio(V2A)」발표 (3) | 2024.06.19 |
---|---|
GPT-4o가 AI 벤치마크 ARC-AGI에서 50%의 점수에 도달, 지금까지 최고 기록인 34%를 대폭 업데이트 (2) | 2024.06.19 |
무료로 상용 이용도 가능한 SQL, 코딩 생성 등에 최적화된 LLM 「Snowflake Arctic」 (93) | 2024.04.29 |
Apple이 iPhone 및 iPad에서 로컬로 작동하는 오픈소스 언어모델 「OpenELM」 출시 (93) | 2024.04.26 |
AI는 실제 인간의 얼굴보다 리얼해 보이는 얼굴을 만든다는 '하이퍼 리얼리즘' 의 문제점이란? (81) | 2024.04.25 |
영화의 배경 기술은 수작업에서 디지털로 어떻게 진화해 왔는가, 또한 AI 시대에는 어떻게 되어 갈 것인가? (81) | 2024.04.25 |
Microsoft가 비용 효율적인 작은 언어 모델 「Phi-3」 을 출시, 오픈 모델에서 상용 이용 가능 (82) | 2024.04.25 |
Google이 개발한 이미지 분류 태스크가 가능한 기계 학습 모델 「Vision Transformers」 의 구조란? (81) | 2024.04.24 |