본문 바로가기

AI

인공지능 글 판별 AI Text Classifier

ChatGPT를 출시해 인공지능으로 글을 생성할 수 있는 장을 열은 OpenAI에서 인공지능 글인지 판별하는 AI Text Classifier를 선보였다. 인공지능으로 글을 작성하는 창과 인공지능이 쓴 글인지 판별하는 방패를 동일한 기관인 OpenAI에서 공개했는데, 그야말로 뭐든지 뚫는 창과 뭐든지 막는 방패 이야기가 절로 떠오른다.

 

OpenAI 플랫폼
OpenAI 플랫폼

 

인공지능 글 판별 사이트

인공지능 챗봇 서비스인 ChatGPT를 활용한 글들이 처음에 나올 때에는 신선함으로 다가오며 화제가 되었지만, 현재는 ChatGPT이 작성한 글을 바라보는 시선이 곱지만은 않다. 실제로 ChatGPT를 활용하여 작성한 리포트를 제출한다든지, 논문 초록이나 요약 등에 활용하기에 제격이라는 이야기가 들려온다. 하지만 대부분 ChatGPT를 활용하여 작성한 글을 엄격하게 제한하고 있는 게 현재 분위기이다. 이러한 흐름에 따라 인공지능이 작성한 글을 판별해 주는 사이트가 여럿 등장했다.

 

 

사실 ChatGPT가 작성한 글을 자세히 읽어보면, 어딘가 부자연스러운 느낌을 받을 수밖에 없다. 하지만 국내에서는 한글을 입력해서 영어로 변환해서 ChatGPT에 묻고 대답한 영어를 다시 한글로 변환한 글이다 보니, 실제로 부자연스러운 문장이 있지만 이미 너무나 팽배한 번역체에 익숙하다 보니, 사실 쉽게 분별하기 어렵다. 그렇다보니 국내 기사와 정부 기관의 보도자료를 인공지능 글 판별 사이트에 입력했더니 인공지능이 쓴 글로 의심된다는 결과가 나왔다는 블로그 글을 보기도 했다. 이건 인공지능 글 판별 사이트가 영어라는 언어를 기준으로 개발했다는 점도 있지만, 기사와 보도자료에 난무한 번역체를 인공지능 글 판별 기술로는 쉽게 분별하지 못하는 이유이기도 하다. 다음에서 현재까지 출시한 인공지능 글 판별 사이트를 소개하고, 실제로 국내 글을 입력해서 어느 정도 판별하는지 테스트해 본다.

 

 

AI Text Classifier

OpenAI에서 GPT 기반의 ChatGPT를 출시한 이후에 인공지능을 활용하여 리포트, 소설 등 다양한 글이 실제로 작성되고 있다. 그렇다 보니 자연스럽게 인공지능이 작성한 글인지를 판별하는 기술이 등장했는데, 역으로 이러한 기술을 응용하여 인공지능이 쓴 글을 사람이 작성한 듯 변환해 주는 기술도 등장했다. 여기에서는 인공지능 글을 판별하는 OpenAI의 AI Text Classifier만 살펴보고, 다른 판별 사이트와 사람 글로 변환해주는 기술은 차후에 다룬다.

 

 

OpenAI API

An API for accessing new AI models developed by OpenAI

platform.openai.com

 

위의 링크에 접속하면 OpenAI에서 제공하는 AI Text Classifier 사이트를 볼 수 있는데, 사용하려면 우선 로그인을 해야 한다. 기존에 ChatGPT를 사용하고 있다면 동일 계정으로 로그인하면 되므로, 진입에는 어려움은 없다.

 

AI Text Classifier 사이트 모습
AI Text Classifier 사이트 모습

 

사용방법은 매우 단순하다. 하지만 이때 영문 기준으로 최소 1000자 이상을 입력해야 한다. 또한 흥미로운 건 어린이가 쓴 글과 영어가 아닌 다른 언어로 작성한 글은 판별이 어렵다고 기재하고 있다는 부분이다. 즉, 한국어로 작성한 글은 아직까지 인공지능 글인지 판별할 수 없다는 의미이다.

 

AI Text Classifier 사이트 테스트
AI Text Classifier 사이트 테스트

 

지금까지 위에서 작성한 글을 그대로 복사해 AI Text Classifier 사이트에 붙여 넣은 후에 Submit 버튼을 누르니, 수초만에 결과가 unclear로 나왔다. 역시 한국어를 입력해서 인지 판별하기 어렵다는 불명확 판결이 나왔다. 참고로 likely가 가장 AI 글일 가능성이 높은 것이고 다음으로 possibly도 AI이 글일 가능성을 판별한 것이다. very unlikely가 인간이 쓴 글이라는 의미이고 unlikely도 인간이 썼을 가능성을 판별한 것이다. 그리고 여기에서 판결에 나온 어휘이자, AI Text Classifier에서 판결할 때 가장 중간에 해당하는 unclear는 불명확하다는 말로 즉, AI 글인지 사람 글인지 모르겠다는 말이다.

 

 

조금 더 기사와 보도자료 글을 넣어서 테스트했는데 대부분 unlikely로 판별하며 사람 글일 가능성에 무게를 두었다. 여기서 흥미로운 건, 실제 ChatGpt를 활용해서 생성한 글을 약간 바꾼 글도 unclear로 불명확하다는 판결을 내렸다는 점이다. 

아래는 사람이 쓴 글일 가능성이 높다는 판별부터 인공지능이 작성했을 가능성이 높을 것이라는 판별까지 순서대로 적은 문장이다. 이처럼 AI Text Classifier 사이트에서 5가지 중 하나로 판별해서 결과를 보여준다.

 

  1. The classifier considers the text to be very unlikely AI-generated.
  2. The classifier considers the text to be unlikely AI-generated.
  3. The classifier considers the text to be unclear if it is AI-generated.
  4. The classifier considers the text to be possibly AI-generated.
  5. The classifier considers the text to be likely AI-generated.

즉, 숫자가 낮은 항목에 해당하는 문장이 나올 경우가 사람이 작성한 글이라고 AI Text Classifier는 판별하는 것이다. 반대로 숫자가 높은 항목에 해당하는 문장이 나오면 인공지능이 작성한 글일 가능성이 높다는 게 AI Text Classifier의 판별이다.