영상·음성 등 인식 ‘멀티모달’ 갖춰
추론·코딩 능력·수학 지식 등 우수
구글 “GPT-4·사람 능력 넘어서”
오픈AI·AI동맹과 3자 패권 다툼
AMD, 엔비디아 대응 AI칩 출시
구글이 6일(현지시간) 오픈AI의 거대언어모델(LLM) ‘GPT-4’ 대항마로 ‘제미나이(Gemini)’를 공개했다. 이는 지금껏 공개된 인공지능(AI) 모델 가운데 가장 높은 성능을 지닌 것으로 평가되어 생성형 AI를 둘러싼 구글과 오픈AI, AI동맹(메타·IBM) 3자 패권경쟁이 본격화할 태세다.
이날 구글이 공개한 제미나이는 텍스트와 사진, 영상, 음성을 모두 인식하고 생성하는 ‘멀티모달’ 기능을 갖춘 AI 모델이다. 수학 문제를 풀거나 데이터를 분석하는 추론 능력, 코딩 능력까지 갖췄다.
제미나이는 카메라로 사람의 행동을 인식한 뒤 그에 맞춰 소통한다. 구글이 전날 공개한 영상에서 제미나이는 사람과 같은 사물 인식 능력, 판단력을 뽐냈다.
사람이 종이에 펜으로 오리를 그리자 제미나이는 그 그림이 ‘새’라는 것을 인식했고, 오리 옆에 물결 표시를 추가로 그리자 ‘오리’라는 정답을 말했다.
오리를 파란색으로 칠하자 제미나이는 “흔한 경우는 아니지만, 파란 오리도 있다”고 소개했다. 뒤이어 파란색 장난감 오리를 보여주자 제미나이는 “이것은 고무(장난감) 오리”라고 분간해냈고, ‘이 장난감이 물에 뜰 수 있느냐’고 물으며 고무 오리를 손으로 누르는 모습을 보여주자 “속이 비었으니 물에 뜰 수 있다”고 답했다.
물리학과 수학 지식수준도 뛰어났다. 제미나이에게 앞면이 네모인 차량과 삼각형인 차량 두 개를 보여주고 ‘어느 차량이 더 빠를까’라고 묻자 “공기역학이 적용되는 삼각형 차량이 더 빠르다”고 말했다. 일부러 잘못 계산한 수학 풀이 과정을 보여주자 틀린 부분을 지적한 뒤 이를 고쳐 올바른 수식을 제시했다.
구글은 이렇게 제미나이의 우수한 성능을 과시하며 “오픈AI의 GPT-4보다 뛰어난 능력”이라고 주장했다. 제미나이를 개발한 구글 딥마인드팀의 데미스 허사비스 최고경영자(CEO)는 그 근거로 성능·크기에 따라 나뉘는 울트라·프로·나노 버전 중 가장 고성능인 제미나이 울트라가 “수학, 물리학, 역사, 법률, 의학, 윤리 등 57개 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 대규모 다중작업 언어 이해(MMLU) 평가에서 90%의 정답률을 기록했다”고 밝혔다.
허사비스 CEO는 제미나이가 “인간 전문가 점수인 89.8%를 넘은 최초의 모델”이라고 덧붙였다. GPT-4는 86.4%의 정답률을 기록한 바 있다.
제미나이 프로 버전은 바로 이날부터 구글의 AI 챗봇 ‘바드’에 적용됐다. 가장 ‘똑똑한’ 울트라는 내년 초 ‘바드 어드밴스트’ 라는 이름으로 바드에 탑재된다. 제미나이가 장착된 바드는 우선 영어로만 지원된다. 구글은 가까운 시일 내 다른 언어 서비스도 제공하겠다고 밝혔다.
나노 버전은 구글의 최신 스마트폰 ‘픽셀8 프로’와 결합한다. 나노가 장착된 스마트폰은 인터넷 연결 없이도 기기 내부의 AI 애플리케이션을 이용할 수 있다.
구글의 이날 제미나이 공개는 시장의 예상을 깬 깜짝 공개였다. 구글이 지난달 제미나이 출시를 앞두고 비영어권에서의 언어 오류가 발견됐다며 발표를 내년 1월로 연기했었기 때문이다.
외신들은 이번 깜짝 공개가 최근 CEO인 샘 올트먼 축출 사태로 내홍을 겪은 오픈AI 상황을 이용해 오픈AI가 우위에 있는 AI 패권경쟁 구도를 재편하려는 의도로 보인다고 분석했다.
전날 메타와 IBM 주도로 기업·대학·기관 50곳 이상이 참여한 ‘AI 동맹’이 오픈AI의 독주를 저지하겠다며 출범한 데 이어 구글의 제미나이 공개로 AI 패권경쟁의 ‘본선’이 시작됐다는 평가다.
선두주자를 겨냥한 AI 칩 업계의 경쟁도 본격화했다. 미 반도체 기업 AMD는 이날 캘리포니아주 샌프란시스코에서 투자자 행사를 열고 업계의 독보적 1등 엔비디아에 대항할 자사의 최신 AI 칩 ‘인스팅트(Instinct) MI300’ 시리즈를 공식 출시했다.
인스팅트 MI300 시리즈는 그래픽처리장치(GPU)인 MI300X, 중앙처리장치(CPU)와 GPU 결합 형태인 MI300A로 구성된다. 이 중 MI300X가 불티나게 팔려나가는 엔비디아 칩 H100의 대항마다.
메타는 이날 AI 스티커 생성 기능과 이미지 편집 등의 작업에 MI300X를 사용할 것이라고 밝혔고, 마이크로소프트(MS)도 클라우드 서비스인 애저에 MI300X를 사용하겠다고 밝혔다. 오픈AI 역시 자사의 GPU 프로그래밍 언어인 ‘트리톤’에 AMD 칩을 사용할 계획이다. 메타와 MS가 올해 엔비디아 H100의 최대 구매자였던 점을 고려하면 엔비디아로선 타격이 불가피할 것으로 보인다.
[ⓒ 세계일보 & Segye.com, 무단전재 및 재배포 금지]