본문 바로가기

AI

멀티모달 AI Gemini 제미니 사용법

구글 딥마인드에서 기존 GPT-4를 뛰어넘는 새로운 AI 모델인 Gemini를 공개했다. 쌍둥이자리라는 의미를 지닌 Gemini는 한국말로 제미니 또는 제미나이로 지칭되는데, 텍스트뿐만 아니라 오디오, 이미지, 비디오 등을 지원하는 멀티모달 인공지능으로 기대를 받고 있다.

 

Gemini 소개 영상
  • 제품명 : Gemini (제미니)
  • 종류 : AI 생성형 인공지능 모델
  • 플랫폼 및 라이선스 : PC 및 모바일 / 무료 (유료)

Gemini
바로가기

 

 

다음에서 정교한 멀티모달 추론 기능을 지닌 AI 생성형 인공지능 모델인 Gemini (제미니) 특징과 더불어 실제 사용하는 방법을 자세히 살펴본다.

 

 

Gemini 소개

Gemini (제미니)는 3가지 버전인 Gemini Pro와 Gemini Ultra, Gemilni Nano로 구분되는데, Gemini Pro는 무료로 사용할 수 있는 무료 버전이고 Gemini Ultra와 Gemini Nano는 유료로 제공할 예정인데 아직은 출시 전이다.

 

구글 딥마인드 홈페이지

 

위의 이미지를 누르면 Gemini를 개발한 구글 딥마인드 홈페이지로 바로 연결하는데, 여기에서 Explore more를 누르면 Gemini 페이지로 전환한다.

 

Gemini 살펴보기 1
Gemini 살펴보기 2

 

Gemini 페이지는 영어로만 제공하고 해당 Gemini 페이지에서 Gemini를 사용하는 게 아니라, 단지 제공된 이미지와 영상 등에서 Gemini가 어떤 기능을 지녔는지를 살펴볼 수 있을 뿐이다. 하지만 해당 Gemini 페이지에서 아래로 스크롤을 하면 무료 버전인 Gemini Pro를 사용할 수 있는 구글 바드로 연결하는 링크를 제공한다.

 

구글 바드 홈페이지

 

상기에 추가한 이미지를 누르면 Gemini Pro를 무료로 사용할 수 있는 구글 바드로 전환하는데, 바로 바드 웹사이트에서 Gemini Pro를 사용할 수 있다. 다음은 구글 바드 웹사이트에서 Gemini Pro를 사용하는 기본적인 방법만 정리한 내용이다.

 

 

1) 구글 바드 웹사이트에 접속한다.

2) Gemini Pro를 사용하려면 구글 바드 로그인을 필수로 해야 한다.

3) 구글 바드 웹사이트에서 하단에 나오는 Bard 사용해보기 버튼을 누른 후, 약관까지 동의하면 무료로 사용이 가능하다.

 

구글 바드 바로가기

 

참고로, 구글 바드에서 Gemini 모드를 따로 설정하거나 선택하는 게 아니라 기본값으로 구글 바드에 설치되어 있으므로, 누구나 무료로 Gemini Pro를 구글 바드에서 사용할 수 있으며, 현재 기본적으로 한국어도 일정 정도 지원하므로 한국어로 바로 사용이 가능하다.

 

구글 바드에서 Gemini Pro 사용하기

앞에서 언급헀듯이 무료로 제공하는 멀티 모달 기능을 지닌 AI 생성형 모델인 Gemini Pro를 체험하려면 구글 바드 웹사이트에 로그인을 해야 한다. 이때 기존 구글 계정으로 연동하면 간편하게 로그인을 할 수 있다.

 

 

Google Bard - 생성형 AI 챗봇 사이트

생성형 AI 기술이 적용된 챗봇 AI 사이트, Google Bard로 혁신적인 생산성을 경험하세요.

bard.google.com

 

그러면 처음에 구글 바드 웹사이트 화면 하단에 Bard 사용해보기라는 버튼이 나오는데, 해당 버튼을 눌러 구글 약관 및 개인 정보 보호 팝업에 동의 버튼까지 누른다. 이때 해당 약관을 아래 끝까지 스크롤을 해야만 더보기 항목이 동의 항목으로 전환한다. 

 

Gemini Pro 사용하기 1
Gemini Pro 사용하기 2

 

이후 프롬프트에 원하는 질문을 하면 기존 챗지피티와 동일한 방식으로 아래와 같이 답변을 제시한다. 

 

Gemini Pro 사용하기 3

 

참고로, 현재 Gemini Pro만 사용이 가능한데, Gemini Pro는 다양한 작업에 사용할 수 있는 일반적인 모델로 텍스트 생성 및 질문에 답변하기, 코드 생성 등을 수행할 수 있다. 더불어 아직은 출시 전인 Gemini Ultra는 복잡한 작업까지 수행이 가능한 가장 강력한 모델로, 자연어 처리, 기계 번역, 챗봇 생성 등을 수행할 수 있다. 이외에 Gemini Nano는 온디바이스 작업에 최적화된 가장 작은 모델로, 스마트폰이나 스마트 스피커에서 사용할 수 있다.

 

Gemini 살펴보기

앞에서 살펴보았듯이 Gemini Pro는 기존 챗지피티와 거의 동일한 기능인 질문에 답변해주는 개인비서 역할에 충실하다. 하지만 유료로 향후 출시될 Gemini Ultra는 매우 다양한 기능을 추가한 멀티모달 인공지능 기능을 사용할 수 있다.

 

 

대표적으로 Gemini Ultra는 이미지 인식 능력이 매우 탁월해서 직접 그린 오리 그림을 보고 Gemini Ultra가 수면에서 수영하는 오리를 정확히 답변으로 표현한다. 이외에도 Gemini가 퀴즈도 출제하는데, 세계지도 이미지를 업로드하면 Gemini가 캥거루, 코알라, 산화가 연상되는 나라는 어디일까요?라는 퀴즈를 내는 방식이다.

 

Gemini Ultra 미리보기 1
Gemini Ultra 미리보기 2

 

이외에도 동영상에 담긴 움직임도 답변으로 일정 정도 표현이 가능하며, 특정 사물과 어울리는 대상을 판별하거나 악기를 그려서 보여주면 해당 악기로 어떤 음악을 생성할 수 있는지 실제 음악 파일까지 제공한다.

 

Gemini Ultra 미리보기 3
Gemini Ultra 미리보기 4

 

단, 해당 Gemini Ultra 멀티모달 기능은 구글 딥마인드의 설명일 뿐 아직 실제로 일반인들이 구현할 수 없으므로, Gemini Ultra가 정식으로 출시될 때까지 기다려야 정확한 Gemini Ultra 성능을 확인할 수 있다.