매개변수 320억개로 딥시크 5% 수준
수능 수학 94.5점…선택과목 올 1등급
과학 테스트 ‘인간 최고 전문가’와 비슷
H100 칩 딥시크 16개 vs 엑사원 딥 1개
‘딥시크 쇼크’가 글로벌 인공지능(AI) 시장을 강타한 가운데, LG가 18일 딥시크 R1보다 20배 가볍지만 성능은 비슷하거나 더 우수한 자체 추론 AI ‘엑사원 딥-32B’(이하 엑사원 딥)를 오픈소스로 공개했다. 엑사원 딥은 특히 AI 구동에 필요한 인프라 효율도 딥시크 R1보다 16배 높은 것으로 알려졌다. 한국 기업이 자체 개발한 추론 AI가 글로벌 시장에서 본격적인 경쟁력을 입증했다는 평가가 나온다.
LG AI연구원은 17∼21일(현지시간) 미국 캘리포니아주 새너제이에서 열리는 엔비디아의 연례 개발자 콘퍼런스(GTC)에서 엑사원 딥을 공개한다고 이날 밝혔다.

LG는 “현재 전 세계적으로 미국의 오픈AI와 구글, 중국의 딥시크와 알리바바 등 파운데이션 모델을 보유한 소수의 기업만이 자체 추론 AI를 개발하고 있다”며 “엑사원 딥은 이들과 경쟁할 수 있는 국내 첫 모델”이라고 소개했다. 추론 AI는 단계적인 사고 과정을 통해 논리적인 답변을 하는 AI로, 스스로 가설을 세워 검증하고 자율적인 의사결정이 가능한 ‘에이전틱 AI’의 핵심 토대가 된다.
엑사원 딥의 매개변수는 320억개로, 딥시크 R1(6710억개)의 20분의 1 수준이다. 매개변수는 AI 모델의 ‘체급’을 결정하는 요인으로, 매개변수가 적을수록 경량화된 모델로 간주한다.
두 모델은 체급 차이가 큰데도 성능은 비슷하거나 엑사원 딥이 더 우수한 것으로 나타났다.
2025학년도 수능 수학 영역으로 문제 해결 능력을 평가한 결과 엑사원 딥은 딥시크 R1(89.9점)보다 높은 94.5점을 받았다.
엑사원 딥은 확률과 통계, 미적분, 기하 등 선택과목 또한 각각 95점, 95.1점, 93.5점으로 1등급을 맞았다. 반면 딥시크 R1은 90.8점, 89.4점, 89.6점 등 90점 내외에 머물렀다.
과학 문제 해결 능력을 평가하는 GPQA 다이아몬드 테스트에서도 엑사원 딥은 66.1점으로 매개변수 규모가 비슷한 알리바바의 ‘QwQ-32B’(63.3) 등보다 점수가 높았다.
딥시크 R1은 해당 테스트에서 71.5점으로 앞서갔다. 다만 인간 중 최고 전문가가 받을 수 있는 최고점이 69.7점으로 보는 만큼, 엑사원 딥이 딥시크 R1의 5%에 불과한 규모로 최고 전문가에 근접한 결과를 낸 것은 의미가 크다는 분석이 나온다.
엑사원 딥은 인프라 효율도 뛰어난 것으로 알려졌다. 딥시크 R1을 구동하려면 엔비디아의 주력 AI칩인 H100이 16개 필요한데, 엑사원 딥은 한 개면 구동 가능해서다.
LG AI연구원은 “엑사원 딥이 수학과 과학 등 전문 분야 평가 지표에서 높은 성능을 보여준 만큼, 향후 기업이 필요로 하는 전문 분야뿐 아니라 물리·화학 등 과학 연구와 교육 현장에서도 활용도가 높아질 것”이라고 기대했다.
엑사원 딥은 오픈소스 공개와 함께 미국 비영리 AI 연구·조사 기관 에포크 AI가 선정하는 ‘주목할 만한 AI’에 이름을 올렸다. 해당 리스트엔 지난달 LG AI연구소의 ‘엑사원 3.5 32B’도 포함됐다. 2023년 이래 국내 기업이 이 분야에 등재된 건 LG AI연구원이 유일하다.
[ⓒ 세계일보 & Segye.com, 무단전재 및 재배포 금지]