본문 바로가기

AI

GPT1에서 GPT4까지 역사

OpenAI에서 최초의 GPT인 GPT1을 2018년에 발표한 이후에 2023년 3월에 GPT4를 발표했다. 일반인들에게는 GPT3를 기반으로 한 ChatGPT부터 실질적으로 인공지능을 체험할 수 있는 계기가 됐다. 이에 GPT1부터 GPT4까지 역사를 간략하게 살펴본다.

 

GPT-4
GPT-4

 

GPT 변천사

GPT(Generative Pre-trained Transformer)는 인공지능 분야 중에서 자연어 처리(NLP)를 수행하는 모델이다. GPT는 대규모 텍스트 데이터를 사용하여 사전 학습되며 이를 기반으로 일반적인 언어 이해 능력을 갖춘다. 이후 자연어 처리를 수행할 수 있도록 추가적인 학습을 진행한다. 그 중심에는 Transformer라는 아키텍처가 존재한다. Transformer는 딥러닝 모델 중 하나로 자연어 처리를 위해 입력 데이터를 인코더와 디코더를 통해 처리하는 기술이다. 인코더는 입력한 데이터를 이해하는 역할을 수행하고, 디코더는 이를 토대로 다음 데이터를 예측하여 텍스트를 생성하는 역할을 수행한다. 즉, GPT1부터 GPT4까지 진화한 역사를 보면 사전 학습하는 데이터의 양과 이를 처리하는 자연어 처리 기술 변화라고 할 수 있다. 이와 관련하여 아래에서 순차적으로 살펴본다. 

 

GPT1

2018년에 발표된 최초의 GPT 모델로 1.5억 개의 매개변수를 지니고 있다. 이 모델은 대규모의 웹 코퍼스를 사용하여 사전 학습됐다. 여기서 웹 코퍼스란 당시 인터넷에 공개된 모든 영문 텍스트를 수집하여 즉, 이렇게 모든 대규모 데이터를 인공지능이 학습하여 자연어를 처리할 수 있도록 하는 훈련 방법이자, 그 자체를 하나의 모델로 지칭하기도 한다. 이러한 웹 코퍼스 모델은 이후 GPT 시리즈에 더 다양한 경로를 통해 데이터를 수집하고 더욱 복잡한 아키텍처를 사용하는 방식으로 진화하고 있다. 

 

GPT2

GPT1 후속 버전으로 2019년에 발표된 모델인 GPT2는 자연어 처리 분야에서 큰 진보를 보였다. 이전 모델인 GPT1보다 더 많은 매개변수를 지니고 있어 더 복잡한 자연어 처리 작업을 수행한다. 또한 GPT1보다 더 많은 문장 구조와 문법 패턴을 학습했기에 문맥을 고려한 더 나은 문장 생성 능력을 지니고 있다. 이때부터 사용자가 직접 입력한 단어나 구를 사용하여 문장을 생성하는 게 가능했다.   

 

GPT3

2020년에 발표한 GPT3는 이전 GPT2를 획기적으로 개선한 모델로 전 세계에 인공지능 언어 모델을 알린 계기가 됐다. 기존 모델보다 자연어 이해와 생성 모두에서 탁월한 성능을 보이며, 특히 문장 생성, 번역, 요약, 질문 - 응답, 챗봇 등에서 놀라운 결과를 보여주었다. 이를 업그레이드한 GPT3.5 버전을 토대로 2022년 11월에 인공지능 챗봇 서비스인 ChatGPT가 공개됐다. ChatGPT는 공개 이후에 바로 전 세계에서 가장 뜨거운 이슈로 자리했다. 그전까지는 뜬구름 잡기로 인식됐던 인공지능을 일반인들이 실제로 체험할 수 있게 된 것이다. 이를 기반으로 AI는 다시 한번 부각하고 있다. 

 

 

 

ChatGPT 제대로 사용하기

인공지능이 전 세계의 화두로 자리한 지 꽤 되었지만 일반인들에게는 뜬구름 잡는 소리에 불과했다. 하지만 OpenAI에서 DALL-E에 이어 ChatGPT까지 연달아 공개한 이후에 상황이 급변화했다. 더 이상

dasfl.com

 

GPT4

GPT4는 기존에 텍스트를 입력하면 텍스트로 대답하는 챗봇 서비스를 능가해 이미지와 영상까지 보여줄 것이라는 소문이 있었다. 하지만 2023년 3월에 발표된 GPT4는 기존 챗봇 서비스인 텍스트를 입력하면 텍스트로 대답하는 방식이다. 하지만 기존 모델보다 언어 능력이 더욱 향상된 것으로 알려지고 있다. 이에 대한 근거로 미국 변호사 시험에서 상위 10% 점수를 받을 수 있을 만큼 언어 능력이 향상되고, 기존 GPT3-5와 비교할 때 미국 수학 능력 시험 점수, 의학지식 자가 진단도 정답률도 큰 폭으로 향상됐음을 제시했다. 특히 기존 GPT3.5 기반의 ChatGPT가 틀린 정보를 뻔뻔하게 사실인 듯 대답하는 오류를 상당 부분 줄였다고 한다. 이러한  GPT4는 기존 무료 버전인 ChatGPT가 아니라 유료버전인 ChatGPT 플러스에 장착하는 것으로 알려져 있다. 또한 마이크로소프트 엣지에서 빙 검색 사이트에도 GPT4가 이미 장착되어 사용 중인 것으로 알려지고 있다.  

 

GPT 미래

대규모 자연어 처리 분야에서 획기적인 성과를 보여주는 GPT는 향후에도 인공지능 연구 및 산업에서 중요한 역할을 담당할 전망이다. 특히 더 많은 데이터와 복잡한 아키텍처를 더욱 진화한 강력한 컴퓨터 자원을 활용하면 지금 보더 더 자연스러운 대화형 인공지능 챗봇이 가능해질 것으로 기대되고 있다. 현재는 ChatGPT라는 챗봇 서비스에서 GPT의 강력한 기능을 체감할 수 있지만, 향후에는 더 많은 분야에서 활용될 수 있다. 이미 빙과 같은 검색 사이트에서 GPT 모델을 장착하고 있는데, 이러한 검색 서비스 이외에도 가상의 개인 비서, 음성 대화형 인터페이스 등도 조만간 현실화할 것으로 추정된다. 문서를 요약하고 텍스트를 생성하는 다양한 유틸리티에 이미 GPT가 활용되는 것을 볼 때, 이미지와 영상까지 제공할 GPT도 멀지 않아 실현할 듯하다.