스테이블 디퓨전 확장 모델 ControlNet

스테이블 디퓨전에는 checkpoint 항목에 들어가는 주모델 이외에도 lora, vae 등 보조모델이 존재한다. 여기에 2023년에 ControlNet이라는 확장 모델을 추가했다. 여기에서는 ControlNet 확장 모델을 Stable Diffusion web UI에서 extension을 활용해서 간편하게 사용하는 방법을 살펴본다. Stable Diffusion과 ControlNet 우선 스테이블 디퓨전과 컨트롤넷은 별개의 기술이다. 즉, 개발자가 다른 엄연한 독립된 기술이라는 점이다. 우선 스테이블 디퓨전은 2022년 8월에 독일의 뮌헨 … 더 읽기

Stable Diffusion web UI 가이드

오픈소스로 배포한 Stable Diffusion을 컴퓨터 사양과 무관하게 실행하는 Stable Diffusion web UI 가이드를 정리한다. Stable Diffusion web UI에서 반드시 알아야 할 용어부터 실제 AI 이미지를 생성할 때 필요한 설정까지 스테이블 디퓨전 사용법을 살펴본다. Stable Diffusion web UI 구조  Stable Diffusion web UI는 100% 무료로 사용할 수 있으면서도  AI 이미지 생성 학습 모델들을 빠르게 추가해서 체험할 … 더 읽기

스테이블 디퓨전 최소 설치 & 빠른 실행

Stable Diffusion을 누구나 무료로 사용할 수 있는 오픈소스로 공개한 후에 스테이블 디퓨전을 설치하거나 실행할 수 있는 다양한 방식이 등장하고 있다. 스테이블 디퓨전의 대명사처럼 불리는 Stable Diffusion web UI를 최소 용량으로 설치하고 빠르게 실행하는 방법을 소개한다. Stable Diffusion web UI 설치 및 실행  텍스트를 입력하면 AI가 자동으로 이미지를 생성하는 Stable Diffusion이 2022년 8월에 오픈소스로 공개하면서 이를 … 더 읽기

AI 음성 사이트 TOP3

텍스트를 소리로 변환하는 AI 음성 사이트를 소개한다. 현재 AI 음성 사이트의 양대 산맥으로 vrew와 typecast가 널리 알려져 있다. 이외에 국내에는 생소하지만 이미 외국에서는 유명한 narakeet를 추가로 살펴본다. AI 음성 사이트 국내에서는 브루와 타입캐스트가 AI 목소리 생성 사이트로 인기를 끌고 있다. 둘 다 국내기업이 제작한 AI 음성 사이트이다 보니 한국어에 특화되어 있고 또한 사용하기 편하다는 장점 … 더 읽기

Vrew 활용한 AI 음성에 따라 입이 움직이는 AI 아바타

최근 AI를 활용한 챗봇 서비스인 ChatGPT, 이미지 생성 서비스인 Stable Diffusion 등이 세간의 이목을 집중하면서 AI 음성 사이트인 Vrew가 다시 한번 부각하고 있다. AI 음성 사이트 중 사용자가 많은 Vrew를 활용한 AI 목소리에 따라 입 모양이 움직이는 AI 아바타를 제작하는 방법을 소개한다. AI 음성 사이트 텍스트를 음성으로 변환하는 AI 음성 기술이 먼저 공개됐지만, 지금은 OpenAI에서 선보인 … 더 읽기

AI(인공지능) 그림 사이트 3대장

OpenAI에서 출시한 DALL-E를 시작으로 스테이블 디퓨전, 플레이그라운드 AI 등 인공지능이 그림을 생성하는 사이트가 등장하고 있다. 이에 현재 가장 많은 사람들이 사용하는 AI 그림 사이트 3대장인 DALL-E2, Stable Diffusion Web UI, Playground AI를 소개한다. AI 이미지 생성 사이트 TOP3 뜬 구름만 같던 AI를 인공지능이 텍스트만으로 그림을 그려주는 기술이 공개된 이후부터 일반인들이 실제로 AI를 체험하기 시작했다. 그 … 더 읽기

스테이블 디퓨전 모델 다운로드

인공지능으로 그림을 생성하는 프로그램 중 스테이블 디퓨전에 모델을 다운로드하고 설치하는 방법을 소개한다. 현재 가장 인기 있는 모델로 꼽히는 동양적인 실사화 이미지로 인기를 끄는 학습 모델로 ChilloutMIX를 비롯하여 서양풍의 Deliberate, 애니메이션 화풍의 OrangeMix 모델을 다운로드하고 Stable Diffusion Web UI에 적용하는 방법을 살펴본다. 스테이블 디퓨전 모델 설치하기 텍스트를 입력하면 이미지를 생성하는 인공지능 그림 생성 프로그램인 스테이블 디퓨전은 … 더 읽기

말하는 3D 아바타 만드는 AI 스튜디오

국내 인공지능 영상합성 스타트업인 딥브레인AI에서 텍스트만 입력하면 3D 아바타가 말하는 영상을 제작하는 AI 스튜디오(AI STUDIOS)를 소개한다. 국내 기업이 출시한 영상 합성 및 편집 플랫폼이므로 한국어를 비롯하여 영어, 중국어, 일본어 등 다양한 국적과 언어를 말하는 AI 모델을 지원한다. 3D 아바타로 비디오 만들기 딥브레인AI에서 제공하는 인공지능 영상합성 플랫폼인 AI 스튜디오는 특별한 설치 작업 없이 홈페이지에 접속해서 바로 … 더 읽기

GPT1에서 GPT4까지 역사

OpenAI에서 최초의 GPT인 GPT1을 2018년에 발표한 이후에 2023년 3월에 GPT4를 발표했다. 일반인들에게는 GPT3를 기반으로 한 ChatGPT부터 실질적으로 인공지능을 체험할 수 있는 계기가 됐다. 이에 GPT1부터 GPT4까지 역사를 간략하게 살펴본다. GPT 변천사 GPT(Generative Pre-trained Transformer)는 인공지능 분야 중에서 자연어 처리(NLP)를 수행하는 모델이다. GPT는 대규모 텍스트 데이터를 사용하여 사전 학습되며 이를 기반으로 일반적인 언어 이해 능력을 갖춘다. … 더 읽기

미술대회 1등 차지한 미드저니

DALL-E와 유사하게 영어로 텍스트를 입력하거나 기존 이미지 파일을 넣으면 인공지능이 이미지를 생성하는 미드저니(Midjourney)로부터 제작한 스페이스 오페라 극장이 콜로라도 주립박람회 미술대회 디지털 아트 부문에서 1등을 차지한 바 있다.  AI 그림도 창작물인가? 인공지능 프로그램인 미드저니가 생성한 스페이스 오페라 극장이 미국 콜로라도 주의 한 미술대회에서 1위를 차지하면서, 인공지능이 생성한 그림을 예술 창작물로 볼 수 있는가라는 논쟁이 있었다. 물론 … 더 읽기

error: Content is protected !!