반응형
2023년 5월 11일(목)에 개최된 「Google I/O 2023」 의 기조 강연에서, 영상의 더빙을 자동 생성하면서 입의 움직임도 자동 변화시키는 AI 기술 「Universal Translator」가 발표되었습니다.
Google I/O 2023
https://io.google/2023/intl/ko/
Universal Translator에 대한 발표는 아래 영상의 1시간 14분 38초부터 확인할 수 있습니다.
Google Keynote (Google I/O '23) - YouTube
Universal Translator는 동영상의 음성을 인식하고, 그 목소리를 유지하면서 다른 언어로 번역하는 AI입니다. Google은 Universal Translator를 사용하여 대학의 온라인 강의를 자동 더빙하는 데모를 보여줍니다.
원본 영상은 영어로 강의가 진행됩니다.
원본 영상과 같은 음색을 유지하면서 다른 언어로 강의가 진행됩니다. 또한, 음성에 맞추어 입의 움직임도 자동으로 변화하고 있습니다.
Universal Translator는 「번역」, 「억양의 조정」, 「화자의 목소리를 재현한 음성의 생성」, 「입의 움직임 조정」의 단계를 거쳐서 실현된다고 합니다.
Universal Translator의 자동더빙 기능은 매우 강력하지만 딥페이크 제작 등에 악용될 가능성이 큽니다. 따라서 Google은 Universal Translator를 인증된 파트너에게만 제공할 예정이라고 합니다.
반응형
'AI · 인공지능 > AI 뉴스' 카테고리의 다른 글
구글이 프로그래밍을 도와주는 AI 「Studio Bot」출시 (2) | 2023.05.12 |
---|---|
AI가 설계하고 구글이 공개한 무료 온라인 카드 대전 게임 「I/O FLIP」플레이 후기 (4) | 2023.05.12 |
구글 픽셀에 AI에 의한 강력한 사진 편집툴 「Magic Editor」가 탑재될 예정 (3) | 2023.05.12 |
드디어 구글 검색, Workspace, 지도에 제네레이티브 AI 탑재, 무엇이 바뀌나? (2) | 2023.05.12 |
구글이 텍스트기반 음악 작곡 AI 'MusicLM' 공개, 데이터 세트의 윤리적 과제도 클리어 (2) | 2023.05.11 |
AI로 생성한 수만개의 곡을 음악 스트리밍 서비스 Spotify가 삭제 (9) | 2023.05.11 |
오픈 소스 LLM 개발 프로젝트 「RedPajama」가 최초의 모델 「RedPajama-INCITE」릴리즈, 무료로 상용 이용도 가능 (7) | 2023.05.11 |
ChatGPT로 가짜 열차 사고 뉴스를 만든 용의자를 중국 경찰이 체포 (2) | 2023.05.11 |