본문 바로가기
반응형

AI · 인공지능/이미지 생성 AI146

우키요에 생성 AI 「Evo-Ukiyoe」와 우키요에 컬러화 AI 「Evo-Nishikie」가 등장 일본의 AI 기업인 Sakana AI가 일본을 대표하는 미술 중 하나인 우키요에를 생성하는 AI 모델 'Evo-Ukiyoe'와 우키요에를 채색하는 AI 모델 'Evo-Nishikie'를 발표했습니다. 일본의 아름다움을 배운 AI : 우키요에풍 이미지 생성 모델 Evo-Ukiyoe와 우키요에 컬러화 모델 Evo-Nishikie를 공개 https://sakana.ai/evo-ukiyoe/ Sakana AIWe are creating a new kind of foundation model based on nature-inspired intelligence.sakana.ai 우키요에는 고흐 등 수많은 거장에게 영향을 준 것으로도 알려져 있습니다. 그러나 기존의 이미지 생성 모델은 우키요에를 중점으로 둔 학습이 .. 2024. 7. 25.
일러스트를 입력하면 제작 과정을 타임랩스 촬영한 것 같이 출력해주는 AI 「Paints-Undo」 일러스트를 입력하는 것만으로 그 일러스트의 제작 플로우를 타임랩스 촬영한 것 같은 영상을 출력할 수 있는 AI 「Paints-Undo」 가 개발되었습니다. 개발자는 ControlNet 의 저자로 알려진 llyasviel 입니다. PaintsUndo: A Base Model of Drawing Behaviors in Digital Paintings PaintsUndo: A Base Model of Drawing Behaviors in Digital PaintingsPaintsUndo: A Base Model of Drawing Behaviors in Digital Paintings PaintsUndo Authors Unless stated otherwise, all video results contains.. 2024. 7. 11.
여러 장의 2D 이미지에서 3D 공간을 재현하는 「Toon3D」 몇 장의 만화 · 애니메이션 이미지로부터 「그럴듯한 3D구조」 를 재현하는 툴 「Toon3D」 가 공개되었습니다. Toon3D https://toon3d.studio/ 인간은 2D 이미지에서 3D 세계를 인식할 수 있지만 기계는 불가능합니다. Toon3D는 여러 장의 이미지를 기반으로 이미지에 그려지지 않은 공간을 보완하는 도구입니다. 다음은 샘플 영상입니다. 이 샘플에 사용된 이미지입니다. 또 다른 1장입니다. 이 두 장의 이미지를 바탕으로 Toon3D는 공간을 재현했습니다. 재현된 장면은 흐릿합니다. 데모에서는 2장의 이미지가 사용되었습니다만, 본래는 3장 이상의 이미지를 사용할 필요가 있다고 합니다. 또 하나의 샘플 영상입니다. 손으로 그린 그림도 Toon3D로 재구성할 수 있습니다. Toon3D는.. 2024. 5. 21.
구글이 한 장의 사진과 음성으로 리얼한 동영상을 생성하는 AI 「VLOGGER」발표 Google 연구팀이, 사진 1장과 음성을 입력하여 「음성에 맞추어 몸짓을 섞어 말하는 리얼한 동영상」 을 생성할 수 있는 AI 프레임워크 「VLOGGER」 를 발표했습니다. VLOGGER https://enriccorona.github.io/vlogger/ VLOGGER We propose VLOGGER, a method for text and audio-driven talking human video generation from a single input image of a person, which builds on the success of recent generative diffusion models. Our method consists of 1) a stochastic human-to-3d-mo.. 2024. 3. 20.
그래픽카드 변경 없이도 이미지 생성 속도를 높여주는「Stable Diffusion WebUI Forge」설치 과정 「Stable Diffusion WebUI Forge」는 ControlNet의 개발자인 Lvmin Zhang 씨가 개발한 유저 인터페이스로, 널리 사용되고 있는 「Stable Diffusion web UI(AUTOMATIC1111판)」대비 이미지를 고속으로 생성할 수 있다고 합니다. GitHub - lllyasviel/stable-diffusion-webui-forge https://github.com/lllyasviel/stable-diffusion-webui-forge GitHub - lllyasviel/stable-diffusion-webui-forgeContribute to lllyasviel/stable-diffusion-webui-forge development by creating an ac.. 2024. 3. 8.
배경이 투명한 이미지를 쉽게 생성할 수 있는 이미지 생성 AI「Layer Diffusion」리뷰 ControlNet 개발자로 알려진 Lvmin Zhang이 배경이 투명한 이미지를 생성할 수 있는 「Layer Diffusion」을 개발했습니다. 이미 Layer Diffusion을 간단하게 사용할 수 있는 툴이 공개되어 있으므로, 실제로 PC에 인스톨하여 배경 없는 이미지를 생성해 보겠습니다. [2402.17113] Transparent Image Layer Diffusion using Latent Transparency https://arxiv.org/abs/2402.17113 2024. 3. 7.
Stability AI가 이미지에서 3D 모델을 생성할 수 있는「TripoSR」을 발표 2024년 3월 5일, 이미지 생성 AI「Stable Diffusion」등의 개발을 실시하는 Stablity AI가, 3D 모델 생성 AI 툴 「Tripo AI」를 개발하는 Tripo와 제휴해, 화상을 입력하는 것만으로 고품질의 3D 모델을 생성할 수 있는 AI 툴「TripoSR」을 발표했습니다. TripoSR 소개 : 단일 이미지에서 고속 3D 객체 생성 — Stability AI https://stability.ai/news/triposr-3d-generation Introducing TripoSR: Fast 3D Object Generation from Single Images — Stability AIWe have partnered with Tripo AI to develop TripoSR, a .. 2024. 3. 6.
사진이나 일러스트가 노래하도록 하거나 말하게 하는 AI 시스템 「EMO」가 등장 중국의 기술 기업 Alibaba의 인텔리전트 컴퓨팅 연구소의 팀이 사진과 이미지를 애니메이션 화하여 리얼하게 말하거나 노래를 부르는 것처럼 움직이는 영상을 생성할 수 있는 AI 시스템 「Emote Portrait Alive(EMO)」를 발표했습니다. EMO https://humanaigc.github.io/emote-portrait-alive/ EMOEMO: Emote Portrait Alive - Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditionshumanaigc.github.io Alibaba's new AI system 'EMO' creates realistic talking and s.. 2024. 3. 4.
Stable Diffusion XL이 「SDXL-Lightning」의 데모를 공개 ByteDance가 개발한 고속 이미지 생성 모델「SDXL-Lightning」의 데모 앱이 AI 엔지니어 알렉스 볼코프 씨에 의해 작성되었습니다. 데모 앱에는 「fal.ai」가 호스팅 하는 이미지 생성 AI 고속 처리 API가 사용되고 있으며, 「Groq」가 제공하는 대규모 언어 모델 「Mixtral」의 고속 실행 API를 결합하여 간단한 문장만 입력하여도 이미지 생성 AI에 최적화된 프롬프트를 고속으로 생성하여 빠르게 고품질의 이미지를 생성할 수 있도록 하고 있습니다. ThursdAI Feb 22nd - Groq near instant LLM calls, SDXL Lightning near instant SDXL, Google gives us GEMMA open weights and refuses to.. 2024. 2. 28.
Stability AI가 고화질 이미지 생성 AI 「Stable Diffusion 3」를 발표 Stability AI가 이미지 생성 AI 「Stable Diffusion 3」을 2024년 2월 23일에 발표했습니다. Stable Diffusion 3에서는 기존의 이미지 생성 AI에서는 어려웠던 「지정한 문자를 생성하고 위화감 없이 묘사」, 「복수의 피사체를 고화질로 묘사」라는 조작이 가능해졌습니다. Stable Diffusion 3 — Stability AI https://stability.ai/news/stable-diffusion-3 Stable Diffusion 3 — Stability AIAnnouncing Stable Diffusion 3 in early preview, our most capable text-to-image model with greatly improved perform.. 2024. 2. 26.
반응형