인공지능을 일반인들이 체험할 수 있는 시작은 DALL-E라고 해도 과언이 아니다. DALL-E는 텍스트를 입력하면 인공지능이 이미지를 생성할 수 있음을 일반인들이 직접 체험할 수 있는 장을 제공하며, 폭발적인 대중적인 관심을 받은 바 있다.
DALL-E 그리고 DALL-E 2
2021년에 OpenAI에서 대중에 공개한 DALL-E는 픽사의 애니메이션 로봇 캐릭터 월-E와 스페인의 현실주의 화가인 살바도르 달리를 합성해서 만든 이름으로 알려져 있다. 자연어 처리 기술을 활용하여 이미지를 생성하는 기계 학습 모델로, GPT3 기반이다. 이후 2022년에 DALL-E 2로 업데이트하면서 더 사실적인 이미지 생성이 가능해졌다. GPT3.5 버전이 실현되고 조만간 CPT4도 상용화할 전망임에 따라 DALL-E도 또 한 번의 큰 변화가 올 것으로 추측된다.
DALL-E 2 사용 방법
Stable Diffusion 등장 이후에 약간 밀린 듯한 분위기이지만 DALL-E 2는 기존에 생성한 이미지 위에 일부를 지우고 그 자리에 이미지를 추가하는 등 새로운 기능을 추가하며, 확실히 초기 버전보다 나은 성능을 보여주고 있다.
DALL-E 2는 기존 DALL-E를 사용하던 유저들은 기존 계정으로 사용이 가능하다. 또한 DALL-E 2가 처음이라면 간단히 구글 계정과 연동해 사용할 수 있다. 초기 버전인 DALL-E는 신청자 중에서 선택된 유저들만 사용할 수 있었는데, 이제는 누구나 가입만 하면 사용할 수 있다. 하지만 완전 무료이던 초기 버전과는 달리 현재 DALL-E 2는 부분 유료화에 진입했다. 처음 DALL-E 2에 가입하면 50크레딧이 무료로 제공하는데, 1크레딧은 이미지를 한 번 생성할 때 사용할 수 있다. 또한 매달마다 15 크레딧을 제공하는데, 즉 한 달에 15개 이미지를 생성할 수 있다는 의미이다. 이러한 크레딧을 다 사용했다면 유료로 크레딧을 충전할 수 있다. GPT4 버전을 결합해 더 현실감 있는 이미지를 생성할 수 있는 DALL-E로 다시 한번 업그레이드할 것으로 예상하지만, 그래도 Stable Diffusion을 위시해서 인공지능을 활용하여 이미지를 생성하는 다양한 후속 모델들이 무료로 출시됨에 따라 일부 유료화 전환은 어떤 식으로든지 변화가 불가피할 듯하다.
DALL-E 2는 초기 버전인 DALL-E와 사용 방법에는 변화가 없다. 텍스트를 입력한 후에 Generate를 누르면 이미지를 생성하는데, 이때 텍스트는 영어로 서술형 문장 또는 키워드를 쉽표로 연결하는 방식으로 입력하면 된다. 그러면 4장의 이미지를 생성해서 보여주는데, 이 중에서 마음에 드는 이미지를 선택한 후에 이를 기반으로 또다시 이미지를 4장 더 생성할 수 있다. 이러한 방법은 크레딧 한도 내에서 무제한으로 반복이 가능하다.
DALL-E 2 향상된 기능
DALL-E 2는 초기 버전에 비해 이미지가 더욱 향상되었지만 개인적으로는 일러스트풍이 DALL-E에는 어울리는 듯하다. 특히 DALL-E 2에서는 초기 버전에 있던 Variations 기능에 edit 기능이 대폭 추가된 것을 알 수 있다. Variations는 기본으로 선택한 이미지를 기반으로 여기에 변화를 주어 또 다른 이미지들을 생성하는 방식이다. 개인적으로 edit에 추가된 지우개 도구가 확실히 유용한 기능이라고 판단한다. 이미지 중에서 특정 영역을 지우개로 지운 후에 텍스트 입력 공간에 원하는 이미지를 표현하는 텍스트를 입력하면, 지우개로 지운 영역에 그 이미지를 추가하는 기능이다. 이러한 edit는 인공지능이 생성한 이미지가 아니라 기존에 개인이 저장한 이미지를 기반으로도 가능하다.
위는 DALL-E 2로 생성한 봄날에 들판을 한가롭게 거니는 스코티쉬폴드 고양이 이미지를 생성한 후에 edit 기능을 활용하여 지우개로 지운 영역에 나비와 병아리를 순서대로 다시 추가한 이미지이다. 하지만 이렇게 원하는 이미지 한 장을 생성하려면 여러 번의 시행착오가 불가피하고, 더불어 편집을 통해 추가 이미지 생성도 필요하다보니 기본으로 주어지는 크레딧만으로도 어려움이 존재한다. 이러한 이유로 DALL-E 2가 분명 초기 버전에 비해 향상된 이미지를 생성하고 추가된 기능이 탁월하지만, 무료로 이미지를 생성하는데 한계가 있다 보니 스테이블 디퓨전을 기반으로 한 무료 인공지능 이미지 생성 프로그램들이 더 주목을 받고 있다.