DALL-E와 유사하게 영어로 텍스트를 입력하거나 기존 이미지 파일을 넣으면 인공지능이 이미지를 생성하는 미드저니(Midjourney)로부터 제작한 스페이스 오페라 극장이 콜로라도 주립박람회 미술대회 디지털 아트 부문에서 1등을 차지한 바 있다.
AI 그림도 창작물인가?
인공지능 프로그램인 미드저니가 생성한 스페이스 오페라 극장이 미국 콜로라도 주의 한 미술대회에서 1위를 차지하면서, 인공지능이 생성한 그림을 예술 창작물로 볼 수 있는가라는 논쟁이 있었다. 물론 순수 그림이 아니라 디지털아트 부문이라는 특이성이 있고, 상금은 불과 300달러로 원화로 해도 40만 원이 채 되지 않는 소액에 불과하다. 그럼에도 실제로 인공지능인 미드저니에 텍스트만을 입력해 생성한 그림인 스페이스 오페라 극장은 보는 사람으로부터 탄성이 나올 만큼 미적으로 훌륭하다.
위의 첨부한 이미지가 미술대회에서 실제로 1등을 수상한 작품으로 제이슨 앨런이 미드저니를 활용해서 생성한 스페이스 오페라 극장(Theatre D'opera Spatial)이다. 실제로 AI 그림에 1등을 주는 게 말이 되느냐는 숱한 반발이 있었지만, 결과는 바뀌지 않았다. 여기에는 순수 그림 부문이 아니라 디지털아트 부문인 점과 제이슨 앨런이 미드저니를 활용했다는 문구를 제출 당시에 명확히 기입했기 때문이다. 제이슨 앨런은 당시 미드저니로 생성한 3개 작품을 출시해서 그중 1개 작품이 1위에 뽑혔다. 또한 미드저니에 간단한 텍스트만 입력했다고 이러한 작품을 생성할 수 없다. 제이슨 앨런은 인터뷰를 통해 80시간을 넘게 미드저니와 작업을 수행해서 생성한 작품이라고 강조하기까지 했다. 향후에는 AI를 활용한 미술대회와 AI 사용을 금하는 미술대회로 나뉠 듯하다. 물론 그림이라는 속성상 AI 사용을 금한다는 문구를 사용하는 미술대회가 대부분이겠지만, 이러한 논란 자체를 활용하거나 나아가 AI 프로그램이 어디까지 예술성을 담보하는 그림을 생성할 지에 대한 의문은 AI를 활용한 미술대회는 필연적으로 열릴 수밖에 없다.
미드저니 원리
미드저니는 GNA(Genrative Adversarial Network) 알고리즘을 사용하여 이미지를 생성하는 인공지능 프로그램이다. 여기서 GNA 알고리즘은 생성자와 판별자라는 모델이 상호작용하는 딥러닝이라 할 수 있다. 미드저니 사이트에 들어가면 나오는 무수하게 생성하는 베타 이미지가 생성자 모델의 역할이다. 이렇게 무수하게 생성한 베터 이미지 중에서 실제로 유사한 이미지만을 판별하는 게 판별자라는 모델이다. 결국, 사람이 텍스트를 입력하면 생성자는 이에 맞춰 무수히 많은 이미지를 생성하는데, 이 중에서 실제와 가장 유사한 이미지만을 선택해서 보여주는 게 판별자의 역할이다.
위의 이미지를 누르면 바로 미드저니 사이트로 연결하는데, 미드저니는 디스코드 계정을 생성한 후에 사용이 가능하다. 2022년 11월부터 베타서비스를 진행하고 있는 미드저니는 무료로는 25회까지 이미지를 생성할 수 있다. 이후에는 유료로 사용해야 한다. 하지만 디스코드 계정만 있으면 미드저니를 사용할 수 있고, 디스코드 계정은 구글 계정만 있으면 생성할 수 있다. 즉, 구글 계정은 무수히 생성할 수 있으므로, 이를 통해 디스코드 계정도 무수히 생성이 가능하다. 역시 디스코드 내 채널 개념인 미드저니 계정도 무수히 생성이 가능하다. 약간 번거롭긴 하지만 이런 방법을 사용하면 25회까지 무료로 사용할 수 있는 미드저니 계정을 무수히 생성이 가능하다.
미드저니 사용법
미드저니는 여러모로 DALL-E와 유사한 인공지능 프로그램이다. 우선 설치를 해야만 사용할 수 있는 스테이블 디퓨전과 달리 사이트에 접속해 바로 사용이 가능하다는 편의성을 지니고 있다. 또한 일정 한도 내의 무료 사용만 제공하고 이후에는 유료로 구매해야만 사용이 가능하다. 이러한 공통점이 존재하지만 미드저니는 디스코드를 사용해 본 적이 없는 사람들이 접근하기에는 약간 진입장벽이 존재한다. 앞에서 언급했듯이 미드저니는 디스코드 내 채널이다. 그렇다보니 처음에 가입을 하면 어디서 시작해야 할지 감이 잡히지 않는다. 하지만 디스코드를 사용해 본 유저라면 매우 간단히 진입할 수 있다.
미드저니에 가입한 후에 시작하는 디스코드 화면에서 왼쪽 패널에 newbies라고 쓰여진 뉴비 채널 중에 아무거나 선택하면 된다. 그런 후에 /imagine prompt를 입력하면 이미지를 생성한다. 즉, 앞에 prompt(프롬프트) 자리에 생성할 이미지 키워드를 입력하면 된다. 그러면 DALL-E처럼 입력한 키워드로 생성한 이미지 4장을 보여준다. 이후 이미지는 순서대로 1, 2, 3, 4라는 번호를 부여받게 되는데, 하단에 위치한 U1은 첫 번째 이미지를 업스케일링하라는 의미이다. 즉 U4는 네 번째 이미지를 업스케일링해서 렌더링 하라는 의미이다. U 아래에 위치한 V는 해당 이미지를 기반으로 파생하는 다른 이미지를 생성하라는 의미이다. 이외에 특정 명령어는 영어로 사용해야 하는데, 영어 사용과 명령어 입력 방법은 아무래도 국내에서는 사용을 꺼리는 요소이다. 미드저니가 SF와 예술성 그림에 뛰어나다는 평가를 받고 있지만, 무료로 제공하는 25회라는 제약과 사용 방법도 영어로 명령어를 입력하는 방식이라는 점에서 국내에서는 여러모로 다른 인공지능 그림 생성 프로그램에 밀리는 모양새이다.
특히 스테이블 디퓨전을 기반으로 한 다양한 인공지능 그림 생성 프로그램이 출시하면서, 한동안은 설치만 하면 무료로 사용이 가능한 Stable Diffusion Web UI가 국내에서는 대세로 자리할 듯하다.