본문 바로가기

전체 글

(162)
Stable Diffusion web UI 가이드 오픈소스로 배포한 Stable Diffusion을 컴퓨터 사양과 무관하게 실행하는 Stable Diffusion web UI 가이드를 정리한다. Stable Diffusion web UI에서 반드시 알아야 할 용어부터 실제 AI 이미지를 생성할 때 필요한 설정까지 스테이블 디퓨전 사용법을 살펴본다. Stable Diffusion web UI 가이드 Stable Diffusion web UI 구조 Stable Diffusion web UI는 100% 무료로 사용할 수 있으면서도 AI 이미지 생성 학습 모델들을 빠르게 추가해서 체험할 수 있다는 강점을 지니고 있다. 오프소스인 Stable Diffusion을 토대로 수많은 개발자들이 추가로 진화한 AI 기술을 더하면서 Stable Diffusion web U..
스테이블 디퓨전 최소 설치 & 빠른 실행 Stable Diffusion을 누구나 무료로 사용할 수 있는 오픈소스로 공개한 후에 스테이블 디퓨전을 설치하거나 실행할 수 있는 다양한 방식이 등장하고 있다. 스테이블 디퓨전의 대명사처럼 불리는 Stable Diffusion web UI를 최소 용량으로 설치하고 빠르게 실행하는 방법을 소개한다. Stable Diffusion web UI 설치 및 실행 스테이블 디퓨전 설치 순서 텍스트를 입력하면 AI가 자동으로 이미지를 생성하는 Stable Diffusion이 2022년 8월에 오픈소스로 공개하면서 이를 활용해서 무료로 스테이블 디퓨전을 실행할 수 있는 Stable Diffusion web UI가 대표 사이트로 주목을 받고 있다. 누구나 무료로 사용할 수 있는 오픈소스이다 보니 Stable Diffus..
AI 음성 사이트 TOP3 텍스트를 소리로 변환하는 AI 음성 사이트를 소개한다. 현재 AI 음성 사이트의 양대 산맥으로 vrew와 typecast가 널리 알려져 있다. 이외에 국내에는 생소하지만 이미 외국에서는 유명한 narakeet를 추가로 살펴본다. AI 음성 사이트 국내에서는 브루와 타입캐스트가 AI 목소리 생성 사이트로 인기를 끌고 있다. 둘 다 국내기업이 제작한 AI 음성 사이트이다 보니 한국어에 특화되어 있고 또한 사용하기 편하다는 장점 때문이다. 하지만 초기에 무료로 제공하던 AI 음성 서비스를 부분 유료화로 전환하다 보니, 제대로 된 AI 목소리를 사용하려면 비용을 추가할 수밖에 없다. 또한 각 사이트에 계정을 생성한 후에 로그인 상태에서 텍스트를 입력한 후에 AI 음성을 생성해야 하는 불편함이 존재한다. 물론 간..
Vrew 활용한 AI 음성에 따라 입이 움직이는 AI 아바타 최근 AI를 활용한 챗봇 서비스인 ChatGPT, 이미지 생성 서비스인 Stable Diffusion 등이 세간의 이목을 집중하면서 AI 음성 사이트인 Vrew가 다시 한번 부각하고 있다. AI 음성 사이트 중 사용자가 많은 Vrew를 활용한 AI 목소리에 따라 입 모양이 움직이는 AI 아바타를 제작하는 방법을 소개한다. AI 음성 사이트 텍스트를 음성으로 변환하는 AI 음성 기술이 먼저 공개됐지만, 지금은 OpenAI에서 선보인 GPT에 가려져 있는 상태이다. 여기에 AI 이미지 생성 기술인 Stable Diffusion이 소스를 무료로 배포하다 보니, 이를 기반으로 한 AI 이미지 생성 프로그램들이 계속해서 출시되고 진화하고 있다. 어느덧 실제 인물을 연상할 만큼 실사화에 가까운 AI 이미지 생성도 ..
AI(인공지능) 그림 사이트 3대장 OpenAI에서 출시한 DALL-E를 시작으로 스테이블 디퓨전, 플레이그라운드 AI 등 인공지능이 그림을 생성하는 사이트가 등장하고 있다. 이에 현재 가장 많은 사람들이 사용하는 AI 그림 사이트 3대장인 DALL-E2, Stable Diffusion Web UI, Playground AI를 소개한다. AI 이미지 생성 사이트 TOP3 뜬 구름만 같던 AI를 인공지능이 텍스트만으로 그림을 그려주는 기술이 공개된 이후부터 일반인들이 실제로 AI를 체험하기 시작했다. 그 시작은 OpenAI에서 선보인 DALL-E였지만 무료로 AI 그림을 생성할 수 있는 한도가 너무 낮다 보니, 오픈소스로 공개한 스테이블 디퓨전을 활용해서 누구나 무료로 사용할 수 있는 Stable Diffusion Web UI를 더 많이 사..
스테이블 디퓨전 모델 다운로드 인공지능으로 그림을 생성하는 프로그램 중 스테이블 디퓨전에 모델을 다운로드하고 설치하는 방법을 소개한다. 현재 가장 인기 있는 모델로 꼽히는 동양적인 실사화 이미지로 인기를 끄는 학습 모델로 ChilloutMIX를 비롯하여 서양풍의 Deliberate, 애니메이션 화풍의 OrangeMix 모델을 다운로드하고 Stable Diffusion Web UI에 적용하는 방법을 살펴본다. 스테이블 디퓨전 모델 설치하기 텍스트를 입력하면 이미지를 생성하는 인공지능 그림 생성 프로그램인 스테이블 디퓨전은 사실상 구글 코랩 서버와 연계해서 실행하는 Stable Diffusion Web UI를 지칭한다. 물론 고사양 컴퓨터라면 컴퓨터 자체에 설치할 수도 있지만 대부분은 구글 드라이브와 연동해 사용한다. 이러한 스테이블 디..
말하는 3D 아바타 만드는 AI 스튜디오 국내 인공지능 영상합성 스타트업인 딥브레인AI에서 텍스트만 입력하면 3D 아바타가 말하는 영상을 제작하는 AI 스튜디오(AI STUDIOS)를 소개한다. 국내 기업이 출시한 영상 합성 및 편집 플랫폼이므로 한국어를 비롯하여 영어, 중국어, 일본어 등 다양한 국적과 언어를 말하는 AI 모델을 지원한다. 3D 아바타로 비디오 만들기 딥브레인AI에서 제공하는 인공지능 영상합성 플랫폼인 AI 스튜디오는 특별한 설치 작업 없이 홈페이지에 접속해서 바로 말하는 3D 아바타로 영상을 제작한 후에 다운로드할 수 있다. 다양한 국적 및 언어를 지닌 3D 아바타 중 원하는 아바타를 선택한 후에 텍스트만 입력하면 바로 말하는 3D 아바타 영상이 만들어진다. 다음에서 AI 스튜디오 가입부터 3D 아바타를 활용한 말하는 영상을..
GPT1에서 GPT4까지 역사 OpenAI에서 최초의 GPT인 GPT1을 2018년에 발표한 이후에 2023년 3월에 GPT4를 발표했다. 일반인들에게는 GPT3를 기반으로 한 ChatGPT부터 실질적으로 인공지능을 체험할 수 있는 계기가 됐다. 이에 GPT1부터 GPT4까지 역사를 간략하게 살펴본다. GPT 변천사 GPT(Generative Pre-trained Transformer)는 인공지능 분야 중에서 자연어 처리(NLP)를 수행하는 모델이다. GPT는 대규모 텍스트 데이터를 사용하여 사전 학습되며 이를 기반으로 일반적인 언어 이해 능력을 갖춘다. 이후 자연어 처리를 수행할 수 있도록 추가적인 학습을 진행한다. 그 중심에는 Transformer라는 아키텍처가 존재한다. Transformer는 딥러닝 모델 중 하나로 자연어 처리..
미술대회 1등 차지한 미드저니 DALL-E와 유사하게 영어로 텍스트를 입력하거나 기존 이미지 파일을 넣으면 인공지능이 이미지를 생성하는 미드저니(Midjourney)로부터 제작한 스페이스 오페라 극장이 콜로라도 주립박람회 미술대회 디지털 아트 부문에서 1등을 차지한 바 있다. AI 그림도 창작물인가? 인공지능 프로그램인 미드저니가 생성한 스페이스 오페라 극장이 미국 콜로라도 주의 한 미술대회에서 1위를 차지하면서, 인공지능이 생성한 그림을 예술 창작물로 볼 수 있는가라는 논쟁이 있었다. 물론 순수 그림이 아니라 디지털아트 부문이라는 특이성이 있고, 상금은 불과 300달러로 원화로 해도 40만 원이 채 되지 않는 소액에 불과하다. 그럼에도 실제로 인공지능인 미드저니에 텍스트만을 입력해 생성한 그림인 스페이스 오페라 극장은 보는 사람으로..
인공지능 그림의 시작 DALL-E 인공지능을 일반인들이 체험할 수 있는 시작은 DALL-E라고 해도 과언이 아니다. DALL-E는 텍스트를 입력하면 인공지능이 이미지를 생성할 수 있음을 일반인들이 직접 체험할 수 있는 장을 제공하며, 폭발적인 대중적인 관심을 받은 바 있다. DALL-E 그리고 DALL-E 2 2021년에 OpenAI에서 대중에 공개한 DALL-E는 픽사의 애니메이션 로봇 캐릭터 월-E와 스페인의 현실주의 화가인 살바도르 달리를 합성해서 만든 이름으로 알려져 있다. 자연어 처리 기술을 활용하여 이미지를 생성하는 기계 학습 모델로, GPT3 기반이다. 이후 2022년에 DALL-E 2로 업데이트하면서 더 사실적인 이미지 생성이 가능해졌다. GPT3.5 버전이 실현되고 조만간 CPT4도 상용화할 전망임에 따라 DALL-E도 ..
ChatGPT 제대로 사용하기 인공지능이 전 세계의 화두로 자리한 지 꽤 되었지만 일반인들에게는 뜬구름 잡는 소리에 불과했다. 하지만 OpenAI에서 DALL-E에 이어 ChatGPT까지 연달아 공개한 이후에 상황이 급변화했다. 더 이상 먼 미래의 일이 아니라 당장 현실에서 부딪힌 AI이기 때문이다. ChatGPT란? 챗GPT을 들어보지 않은 사람이 없을 정도로 사람이 질문을 하면 인공지능이 대답을 해준다는 정도는 널리 알려져 있다. 또한 구글 포털사이트에서도 일부 ChatGPT를 적용하고 있고, 빙 포털사이트에서는 GhatGPT를 능가하는 인공지능 챗봇을 장착할 것으로 알려지고 있다. 그러다 보니 국내 포털사이트인 네이버, 카카오 등도 인공지능 챗봇을 준비 중이거나 일부 도입하려는 움직임을 보이고 있다. ChatGPT 사이트 바로가..
Playground AI 사용법 텍스트를 입력하면 인공지능이 이미지를 생성하는 Stable Diffusion이 오픈소스로 공개된 이후에 이 스테이블 디퓨전을 기반으로 다양한 프로그램들이 선보이고 있다. 이중 일부 기능은 유료로 사용해야 하지만 기본적인 스테이블 디퓨전 기능은 무료로 사용할 수 있는 Playground AI를 소개한다. Playground AI Stable Diffusion을 기반으로 하는 Playground AI는 현재 출시된 인공지능 이미지 생성 프로그램 중에서 사용법이 가장 쉽다고 평가받고 있다. 또한 매일 1000장까지는 무료로 이미지를 생성할 수 있어 그 부분에서도 무료 프로그램 중에 최고로 꼽히고 있다. 물론 고급 기능을 사용하려면 유료 버전을 구매해야 하지만, 인공지능으로 그림을 그리는 첫 진입 도구로 Pla..