본문 바로가기
반응형

전체 글1836

「Stable Diffusion」에서「CFG(classifier-free guidance)」란 도대체 무엇인가? 입력한 프롬프트를 바탕으로 이미지를 생성하는 AI 'Stable Diffusion'은 일반 공개 이후 전 세계 사람들로부터 주목을 받고 있으며 다양한 툴과 응용 방법도 발표되고 있습니다. 그런 Stable Diffusion으로 이미지를 생성할 때의 설정 항목에, 「이미지 생성 시 얼마나 프롬프트를 따르는가」를 결정하는 「CFG(classifier-free guidance) 스케일」이라는 값이 있습니다. CLASSIFIER-FREE DIFFUSION GUIDANCE.pdf The Road to Realistic Full-Body Deepfakes - Metaphysic.ai The Road to Realistic Full-Body Deepfakes - Metaphysic.ai It's nearly five.. 2022. 11. 6.
[알기쉬운 AI - 34] 설명 가능한 AI(XAI : Explainable AI) 1 - AI의 예측에 근거는 필요한가? 설명 가능한 AI( Explainable AI, 이후 XAI )라는 단어를 들어 보신 적 있습니까? XAI는 AI 예측의 근거를 예측과 함께 출력하는 AI입니다. 특히 최근 주목을 받고 있는 심층 학습이 대두된 후 XAI의 중요성이 주목받고 있습니다. 이는 심층 학습 알고리즘의 예측 근거가 인간에게는 이해하기 어렵기 때문입니다. 심층 학습 알고리즘은 그 정확도가 기존보다 압도적으로 좋으며, 동시에 예측의 근거가 손실되는 문제가 있습니다. 즉, 예측 정밀도와 그 예측 근거는 트레이드오프 관계에 있다는 것입니다. 여기서는 XAI의 기본 사고방식과 왜 XAI가 필요한지 사례를 들어보겠습니다. ◎ LIME을 사용한 판정 근거의 제시 예 LIME에 대해서는 아래를 참고하세요 [1주차] 대리분석(LIME) LIME.. 2022. 11. 6.
기자(Giza)의 피라미드 속을 자유롭게 둘러볼 수 있는 3D 가상투어「Inside the Great Pyramid」 이집트에 있는 기자의 거대 피라미드는 고대 이집트 제4 왕조 쿠푸왕의 무덤이며, 건축로부터 4,000년 이상 경과된 현시점에서도, 장대한 외관이나 복잡한 내부 구조가 많은 사람들을 끌고 있습니다. 그런 기자의 대 피라미드 내부를 3D 스캔으로 재현해, 자유롭게 관광할 수 있는 웹 서비스 「Inside the Great Pyramid」가 등장하였으므로, 실제 3D로 재현된 피라미드 내부를 돌아다녀 보았습니다. Inside the Great Pyramid | Giza Project Inside the Great Pyramid | Giza Project This is the interior three chambers of Khufu Pyramid, also known as the Great Pyramid, o.. 2022. 10. 29.
「Stable Diffusion」성인용 묘사 세이프티 필터도 해제되어 있는「Mage」리뷰 고정밀 이미지 생성 AI Stable Diffusion을 브라우저에서 쉽게 사용할 수 있는 웹 서비스 "Mage"가 등장했습니다. Mage는 브라우저에서 직접 액세스 하여 무료로 Stable Diffusion을 사용할 수 있을 뿐만 아니라, 생성되는 이미지에 포함하고 싶지 않은 요소를 지정하는 네거티브 프롬프트의 설정도 가능하며, 성인용 묘사를 규제하는 세이프티 필터도 해제되어 있다고 하여, 실제로 사용성을 확인해 보았습니다. Mage 🧙 | Free, Fast, Unfiltered Stable Diffusion https://www.mage.space/ Mage: Free, Fast, Unfiltered Stable Diffusion. Generate Anything You Can Imagine! Ma.. 2022. 10. 29.
세계 인터넷상의 모든 트래픽을 전달할 수 있는 기술이 등장 레이저광을 무수한 주파수로 나누어 각각에 데이터를 태우는 기술에 의해, 전 세계의 인터넷에서 통신되고 있는 트래픽의 2배에 상당하는 초당 1.8 페타 비트의 어마어마한 데이터 전송을 가능하게 하는 기술이 발표되었습니다. New data transmission New data transmission record Using only a single light source, scientists have set a world record by transmitting 1.8 petabits per second. Their data transmission method uses significantly less power and can help reduce the Internet’s climate footprint... 2022. 10. 26.
「Stable Diffusion web UI(AUTOMATIC1111판)」img2img의 Script 사용법 정리 이번에는 「AUTOMATIC1111판」에서「img2img」기능 중 나머지 Script부분을 살펴보겠습니다. 관련 글 : 「Stable Diffusion web UI(AUTOMATIC1111판)」img2img의 기본 사용법 정리 「Stable Diffusion web UI(AUTOMATIC1111판)」img2img 사용법 정리 이번에는 「AUTOMATIC1111판」의 「img2img」기능을 사용하는 방법을 정리해 보았습니다. 「AUTOMATIC1111판」을 설치하는 방법은 아래에 정리되어 있습니다. 스테이블 디퓨전 결정판「Google Colab + Stable D doooob.tistory.com ◆ 아웃 페인팅 아웃 페인팅이란, 자연 언어에 의한 설명문을 더하는 것으로, 같은 스타일의 비주얼 요소를 추가.. 2022. 10. 26.
뇌에 전극을 찌르지 않아도 '사고'를 실시간으로 읽을 수 있는 AI 기술이 등장 기능적 자기공명영상(fMRI) 이라는 수법으로 뇌를 스캔하여 AI로 해석함으로써 사람의 사고를 정확하게 읽을 수 있다는 논문이 발표되었습니다. 이 기술로 인하여 질병이나 부상으로 말하거나 몸을 움직일 수 없는 사람들의 커뮤니케이션을 지원하는 기술이 크게 진전될 것으로 기대되고 있습니다. Semantic reconstruction of continuous language from non-invasive brain recordings | bioRxiv Researchers Report Decoding Thoughts from fMRI Data A method appears to be the first to noninvasively reconstruct language from brain activity. w.. 2022. 10. 26.
「Stable Diffusion web UI(AUTOMATIC1111판)」img2img 기본 사용법 정리 이번에는 「AUTOMATIC1111판」의 「img2img」기능을 사용하는 방법을 정리해 보았습니다. 「AUTOMATIC1111판」을 설치하는 방법은 아래에 정리되어 있습니다. 스테이블 디퓨전 결정판「Google Colab + Stable Diffusion Web UI AUTOMATIC1111판」설치 정리(GPU 불필요) 스테이블 디퓨전 결정판「Google Colab + Stable Diffusion Web UI AUTOMATIC1111판」설치 정리(GPU 불필요) 이미지 생성 AI 「Stable Diffusion」을 간단하게 이용하기 위한 환경 중 하나인 「Stable Diffusion web UI」의 개발 기여자 중 한 명인 AUTOMATIC1111씨가 「기능 총집판 Stable Diffusion we.. 2022. 10. 24.
「Stable Diffusion web UI(AUTOMATIC1111판)」의「Prompt matrix」및「X/Y plot」사용법 정리 Stable Diffusion web UI(AUTOMATIC1111판)에서 특히 이미지 생성에 도움이 되는 기능인 「Prompt matrix」와 「X/Y plot」을 실제로 사용해 보았습니다. Stable Diffusion web UI(AUTOMATIC1111판)을 기동 하면, 왼쪽 하단에 'Script'라는 셀렉트박스가 있습니다. 스크립트의 풀다운에서 Prompt matrix 를 선택합니다. Prompt matrix는, 이미지 생성 시 입력하는 문자열에 통상은 「,」로 키워드를 단락 짓는 부분을 「|」로 단락 짓는 것으로 총 조합해 화상을 생성할 수 있는 기능입니다. 예를 들면, 보통 'a busy city street in a modern city, illustration ,cinematic ligh.. 2022. 10. 23.
「Stable Diffusion web UI(AUTOMATIC1111판)」의 기본적인 사용법 「Stable Diffusion web UI(AUTOMATIC1111판)」은 다른 UI에는 탑재되어 있지 않은 기능들을 담은, 이른바 결정판 「Stable Diffusion UI」라고 할 수 있습니다만, 그만큼 할 수 있는 것이 많기 때문에, 어디를 어떻게 만져야 좋을지 어려운 것도 사실입니다. 요번에는 우선 「Stable Diffusion web UI(AUTOMATIC111판)」중, 텍스트로부터 화상을 생성하는 「txt2img」의 기본적인 사용법을 정리하고 있습니다. Stable Diffusion web UI(AUTOMATIC1111판)을 사용하기 위한 설정은 아래의 글에서 확인하세요. 스테이블 디퓨전 결정판「Google Colab + Stable Diffusion Web UI AUTOMATIC1111.. 2022. 10. 23.
반응형