메타에서 선보인 라마2를 컴퓨터에 설치하거나 클라우드와 연계하여 사용하는 방식이 아니라 Perplexity AI에 접속해서 바로 사용할 수 있는 Llama 2 무설치 버전을 소개한다. ChatGPT와 같은 인공지능 챗봇인 Llama 2는 무료로 사용 가능한 오프 소스 대규모 언어 모델이다.
Llama 2 소개
Llama 2는 메타(구 페이스북)에서 개발한 대규모 언어 모델로 간단히 ChatGPT와 같은 대화형 챗봇 서비스라고 생각하면 된다. OpenAI에서 챗지피티를 선보인 이후에 ChatGPT는 오늘날 AI 트렌드를 선도하며 폭발적인 관심과 성장을 거듭하고 있다. 이에 따라 마이크로소프트에서 빙(Bing), 구글에서 바드(Bard)를 출시하는 등 글로벌기업들은 앞다퉈 생성형 인공지능 챗봇을 개발하고 있는데, 바로 Llama 2도 그러한 연장선에서 메타에서 개발한 챗봇 서비스이다.
Llama 2가 앞서 공개된 다른 챗봇과 차별화된 가장 큰 특징은 오픈소스로 공개하면서 연구와 상업적 용도로 무료로 사용할 수 있도록 제공한다는 점이다. 아래의 이미지를 누르면 Llama 2 웹사이트로 바로 연결하는데, 여기에서 Llama 2 모델을 직접 다운로드해서 컴퓨터에 설치해 사용할 수 있다. 하지만 컴퓨터에 설치하는 일반적인 소프트웨어와 다르다 보니 Llama 2를 컴퓨터에 설치하는 과정이 약간 복잡하다. 또한 컴퓨터에 설치해 사용하면 컴퓨터 자원을 사용하므로 고사양 컴퓨터에 설치해야 Llama 2 기능을 100% 사용할 수 있다.
그렇다 보니 컴퓨터에 직접 설치하는 로컬 방식이 아니라 허깅페이스, Azure 등을 활용한 클라우드 연계 활용 방식이 일반적이다. 물론 최근에 Llama 2를 설치할 필요 없이 Perplexity AI를 활용하면 바로 사용이 가능한데, 이 부분은 뒤에서 살펴본다.
위와 같이 Llama 2는 ChatGPT, Bard 등과 유사한 방식인 강화 학습을 통해 개발되었는데 여기에 사람의 피드백을 추가했다는 차이점을 지니고 있다. 또한 Llama 2는 7B 모델, 13B 모델, 70B 모델 등 3가지 Llama 2 모델을 제공하고 있다.
각각의 모델 특징까지 설명하자면 길어지므로 간단히 사용자 중심으로 요약하면 모델 숫자가 클수록 좋은 모델이다. 하지만 좋은 모델은 그만큼 컴퓨터 자원을 더 많이 사용하며 구동하는데도 더 많은 시간을 소요한다. 따라서 정확도와 속도 등을 고려해서 모델을 선택해야 한다.
메타에서는 Llama 2는 추론, 코딩, 숙련도, 지식 테스트 등 다양한 외부 벤치마크에서 다른 오픈 소스 언어 모델보다 뛰어난 성능을 발휘한다고 발표한 바 있다. 또한 위에서 보듯이 Llama 2 중에서 70B 모델이 7B 모델과 13B모델보다 더욱 월등한 성능을 보여주는데, 이는 각각의 모델을 학습할 때 사용한 데이터 수의 차이에서 기인한다. 즉, 7B 모델보다 13B 모델에서 훨씬 더 많은 데이터를 사용하여 Llama 2를 학습시켰는데, 13B 모델보다 더 많은 데이터를 사용한 모델이 바로 70B 모델이다.
참고로, 메타에서 선보인 Llama 2는 아직까지는 ChatGPT보다는 성능에서 약간 뒤처져 있다는 평가가 일반적이다. 하지만 유료 서비스로 전환한 ChatGPT과 유사한 기능인 챗봇 서비스를 무료로 사용할 수 있기에 Llama 2 사용이 증가할 것으로 예상된다. 또한 오픈소스로 제공했기에 Llama 2가 ChatGPT가 그동안 발전한 기술을 빠르게 따라잡을 수도 있다. 실제로 ChatGPT를 개발한 OpenAI에서 선보였던 인공지능 이미지 생성 기술인 DALL-E가 후발주자였던 스테이블 디퓨전에 밀린 양상인데, 여기에는 스테이블 디퓨전이 오픈 소스라는 점이 중요한 역할을 했다. 따라서 오픈 소스로 공개한 Llama 2도 다른 연구집단의 참여에 따라 ChatGPT를 뛰어넘는 성능을 보이면서도 무료로 제공한다면 향후 대화형 인공지능 챗봇 시장을 주도할 수도 있을 듯하다.
Perplexity AI
앞에서 언급했듯이 Llama 2는 컴퓨터에 직접 설치하거나 클라우드 연계 방식으로 활용할 수 있지만, 상기 방식은 약간 복잡하고 일반인들이 직접 이를 수행하려면 별도로 설치 방법을 습득해야만 가능하다. 하지만 다행히 오픈소스로 Llama 2를 제공하다 보니, 과거 AI 이미지 생성 기술인 스테이블 디퓨전을 웹상에서 간편하게 사용할 수 있는 방식이 등장한 것처럼 Llama 2를 따로 설치할 필요가 없는 무설치 버전인 Perplexity AI도 등장했다.
위에 링크한 Perplexity AI 바로가기 버튼을 누르면 무설치 버전의 Llama 2를 웹사이트에서 바로 사용할 수 있다. 현재는 영어만 지원하고 있는데 이 부분은 추가로 번역과 관련한 확장 프로그램이 개발되어 제공될 것으로 예상된다.
Perplexity AI 웹사이트에 접속하면 위와 같은 화면이 나오는데, 1번 항목에서 Llama 2 모델을 선택할 수 있고 2번 항목에 질문을 입력한 후에 엔터를 치면 된다. 기존에 ChatGPT를 사용해 본 적이 있다면 동일한 사용 방법이므로 별다른 어려움이 없다. 참고로, 앞에서 Llama 2 모델을 언급했지만 숫자가 높을수록 성능은 높지만 그만큼 속도는 느리다는 점을 감안해서 선택하면 된다.
참고로, Perplexity AI 웹사이트에서 제공하는 Llama 2는 기본적으로 영어만 지원하고 있지만 크롬 브라우저에서 마우스 오른쪽 버튼을 누른 후에 한국어로 번역을 선택한 후에 사용하면 약간은 어설프지만 그래도 한국어로 질문하고 한국어로 번역된 답변을 받아볼 수 있다.
Llama 2 살펴보기
앞에서 살펴보았듯이 Llama 2는 대규모 언어 모델로 사전에 70억에서 700억 매개변수 규모에 강화학습을 수행했는데, 여기에 사람의 피드백을 추가해서 안전한 데이터 사용에 중점을 둔 챗봇 서비스이다. 또한 연구 및 상업적 용도로 무료로 사용할 수 있도록 오픈 소스로 공개했는데, 해당 내용은 논문으로 확인할 수 있다.
상기 Llama 2 논문 보기 버튼을 누르면 Llama 2 오픈소스를 볼 수 있으므로 연구자 및 해당 부분에 관심이 있다면 참조가 가능하다. 영어로 제공한 논문 형식이지만 최근에는 무료로 사용할 수 있는 번역 프로그램이 많아서 언어적인 한계는 없이 해당 내용을 확인할 수 있다.
챗지피티와 유사한 기능이지만 언어 모델이 다른 메타에서 개발한 Llama 2는 기존의 Llama 1을 업데이트한 모델로 마이크로소프트와 공동으로 개발을 진행할 뿐만 아니라 다른 기업에서도 사용이 가능하도록 오픈 소스로 제공하고 있다. 기존에 Llama 1를 개발할 당시에 해당 대규모 언어 모델에 접근할 수 있는 요청이 상상을 초월했기에 메타는 Llama 2를 공개하면서 아예 연구 및 상업적 용도로 무료로 제공하고 있다.
즉, Llama 2는 연구 및 상업적 용도로 무료 제공이라고 명확하게 명시할 만큼 일반적으로 코드 수정 및 변환 등이 자유로운 오픈소스라는 개념과는 약간 차이가 있다. 물론 일반 사용자들은 자세히 알 필요는 없지만 Llama 2를 활용하여 유사 챗봇을 개발하려 한다면 Llama 2 사용 가이드를 반드시 숙지해야 한다.
더불어 대규모 언어 모델인 Llama 2는 계속해서 진화할 예정인데, 현재는 70억 개에서 700억 개의 매개변수를 사전 학습한 후에 사람이 개입하여 추가로 미세 조정을 했다. 해당 Llama 2를 컴퓨터에 설치 또는 클라우스 방식을 활용하려면 상기 이미지를 누르면 전환하는 Llama 2 깃허브 페이지를 참조하면 된다. 이외에도 해당 Llama 2 깃허브 페이지에는 Llama 2에 담긴 실제 코드부터 사용법까지 담겨 있다.