본문 바로가기
반응형

AI · 인공지능/이미지 생성 AI146

스테이블 디퓨전의 제작사 Stability AI가「Stable Cascade」를 발표 2023년 2월 13일, Stability AI가 텍스트로부터 이미지를 생성하는 새로운 모델「Stable Cascade」를 발표했습니다. 이 모델은 비상용 라이센스로 출시되었습니다. 고품질의 이미지를 고속으로 생성하는 이 모델은 3가지 다른 모델(스테이지 A, B, C)로 구성된 파이프라인으로 구축됩니다. 이 3단계의 접근법으로 인하여 일반 소비자용의 저사양 하드웨어에서도 트레이닝과 파인 튜닝이 가능해지고 있습니다. Stable Cascade의 기초 역할을 하는「Würstchen」아키텍처는 이미지의 계층적 압축을 가능하게 하고, 고도로 압축된 잠재 영역을 이용하면서 효율적인 추론과 저비용 트레이닝을 가능하게 합니다. 3단계 모델의 각 스테이지는 다른 파라미터 사이즈를 가지며, 이미지 생성의 정밀도 및 세.. 2024. 2. 22.
Google이 스마트폰을 사용해 0.5초만에 이미지를 생성하는「MobileDiffusion」을 발표 텍스트를 기반으로 이미지를 생성하는 몇 가지 AI 모델이 있지만 고품질 이미지를 생성하는 주요 모델은 수십억 개의 매개 변수를 처리하므로 기본적으로 고사양의 단말이 필요합니다. 2024년 1월 31일 구글 엔지니어들이 「MobileDiffusion」이라는 어프로치를 발표하고 스마트폰과 같은 모바일 기기에서도 효율적으로 이미지를 생성하는 법을 소개했습니다. MobileDiffusion: Rapid text-to-image generation on-device – Google Research Blog MobileDiffusion: Rapid text-to-image generation on-device Posted by Yang Zhao, Senior Software Engineer, and Tingbo H.. 2024. 2. 2.
고해상도 이미지를 0.5초 만에 생성하는 오픈 소스 AI 이미지 생성 모델 「PixArt-δ」가 등장 Huawei Noah's Ark Lab과 대련이공대학(중국), Hugging Face 등의 연구원들이 텍스트에서 이미지를 생성하는 프레임워크「PixArt-δ(델타)」를 발표했습니다. [2401.05252] PIXART-δ: Fast and Controllable Image Generation with Latent Consistency Models https://arxiv.org/abs/2401.05252 Meet PIXART-δ: The Next-Generation AI Framework in Text-to-Image Synthesis with Unparalleled Speed and Quality - QAT Global Meet PIXART-δ: The Next-Generation AI Framewor.. 2024. 1. 30.
Google이 초 고품질의 동영상 생성 AI 「Lumiere」를 발표 Google의 연구팀이 동영상 생성 AI 「Lumiere」를 2024년 1월 24일(수)에 발표했습니다. Lumiere https://lumiere-video.github.io/ Lumiere - Google ResearchSpace-Time Text-to-Video diffusion model by Google Research.lumiere-video.github.io Lumiere에서는 프레임끼리 자연스럽게 연결된 위화감이 적은 동영상을 생성 가능하며, 텍스트나 이미지를 입력하여 동영상을 생성할 수 있으며, 동영상의 일부를 지정하여 다른 동영상으로 바꾸거나 사진의 일부만 움직이는 조작도 가능합니다. 텍스트나 이미지를 입력하여 동영상을 생성할 수 있는 AI가 많이 존재하고 있습니다만, 이러한 AI의 대.. 2024. 1. 26.
TikTok의 모회사 ByteDance가 텍스트로 고품질 동영상을 생성하는 AI「MagicVideo-V2」발표 TikTok의 모회사인 ByteDance의 연구팀이 텍스트에 충실하게 고품질 동영상을 생성하는 AI, MagicVideo-V2를 발표했습니다. 인간의 성능 평가에서 MagicVideo-V2가 텍스트로 동영상을 생성하는 다른 최첨단 AI보다 우수하다는 결과를 얻었습니다. [2401.04468] MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation https://arxiv.org/abs/2401.04468 MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation https://magicvideov2.github.io/ MagicVideo-V2: Multi-Stage High-Aesthetic Video Gen.. 2024. 1. 22.
초당 100장 이상의 화상을 생성할 수 있는 고속 화상 생성 파이프라인 「StreamDiffusion」이 등장 소스로부터의 데이터 입력, 기계 학습 모델에의 데이터 출력, 학습 패턴의 조정이라는 일련의 처리 구조인「파이프 라인」을 리얼타임 이미지 생성을 위해서 최적화된 「StreamDiffusion 」이 등장했습니다. [2312.12491] StreamDiffusion: A Pipeline-level Solution for Real-time Interactive Generation https://arxiv.org/abs/2312.12491 StreamDiffusion: A Pipeline-level Solution for Real-time Interactive GenerationWe introduce StreamDiffusion, a real-time diffusion pipeline designed for in.. 2023. 12. 26.
간단한 텍스트로부터 사실적인 동영상을 생성하는 확산 모델 「W.A.L.T」가 등장 스탠퍼드 대학과 Google 연구팀이 텍스트로 사실적인 동영상을 생성하는 확산 모델인 「W.A.L.T」를 발표했습니다. 실제로 「W.A.L.T」를 사용하여 생성한 동영상도 다수 공개되어 있습니다. WALT(pdf 다운로드) https://walt-video-diffusion.github.io/assets/WALT.pdf Photorealistic Video Generation with Diffusion Models https://walt-video-diffusion.github.io/ Photorealistic Video Generation with Diffusion ModelsWe present W.A.L.T, a transformer-based approach for photorealistic vid.. 2023. 12. 13.
Meta가 이미지 생성 AI「Imagine」을 무료로 사용할 수 있는 웹 앱을 출시 Meta가 이미지 생성 AI 'Imagine'을 무료로 사용할 수 있는 웹 앱 「Imagine With Meta AI」를 공개했습니다. Imagine With Meta AI는 무료로 이용 가능하며, 문장(프롬프트)을 입력하는 것만으로 이미지를 4장 생성할 수 있다는 것. What's New Across Our AI Experiences | Meta What’s New Across Our AI Experiences | MetaWe're adding new features to Meta AI and testing more than 20 new ways generative AI can improve your experiences across Facebook, Instagram, Messenger and Wha.. 2023. 12. 8.
Amazon이 프롬프트형 이미지 생성 AI "Titan Image Generator"의 미리보기 버전을 출시 2023년 11월 27일부터 12월 1일에 걸쳐 미국 라스베이거스에서 개최되는 AWS 컨퍼런스 이벤트 'AWS re:Invent'에서 Amazon이 이미지 생성 AI 'Titan Image Generator'의 미리보기 버전을 발표했습니다. Amazon Titan Image Generator, Multimodal Embeddings, and Text models are now available in Amazon Bedrock | AWS News Blog Amazon Titan Image Generator, Multimodal Embeddings, and Text models are now available in Amazon Bedrock | Amazon Web ServicesToday, we’re int.. 2023. 12. 1.
드디어 Windows의 「그림판」에도 AI가 탑재되어 이미지 생성이 가능 Windows의 표준 그림 그리기 앱인 "그림판"에 이미지 생성 기능을 추가하는 업데이트가 실시되었습니다. 이미지 생성 기능은 OpenAI가 개발한 이미지 생성 AI "DALL-E"를 사용하여 실현되고 있습니다. 페인트 코크리에이터를 사용하여 AI 아트 생성 - Microsoft 지원 https://support.microsoft.com/ko-kr/windows/107a2b3a-62ea-41f5-a638-7bc6e6ea718f 그림판 공동 작성기를 사용하여 AI 아트 생성 - Microsoft 지원구독 혜택을 살펴보고, 교육 과정을 찾아보고, 디바이스를 보호하는 방법 등을 알아봅니다. 커뮤니티를 통해 질문하고 답변하고, 피드백을 제공하고, 풍부한 지식을 갖춘 전문가의 의견을 들을 support.micro.. 2023. 12. 1.
반응형