엔비디아, 에이전트 특화 오픈소스 AI 모델 공개…AI 클라우드 투자도 확대

[서울이코노미뉴스 박희만 기자] 세계 최대 인공지능(AI) 칩 개발사 엔비디아가 에이전트 기능에 특화된 개방형(오픈소스) AI 모델을 공개하며 AI 생태계 확장에 나섰다.

동시에 AI 클라우드 기업에 대한 대규모 투자도 단행하며 인프라 구축전략을 강화하고 있다.

엔비디아는 매개변수(파라미터) 1200억개 규모의 개방형 AI 모델 ‘네모트론3 슈퍼(Nemotron3 Super)’를 출시한다고 11일(현지시간) 밝혔다.

이 모델은 사람의 개입없이 스스로 판단하고 외부도구를 활용해 복잡한 작업을 수행하는 ‘AI 에이전트’를 효율적으로 구동하는 데 초점을 맞춰 설계됐다.

AI 에이전트는 단순히 질문에 답하는 기존 챗봇과 달리, 여러 단계의 추론과 외부도구 호출을 반복하며 실제작업을 수행하는 것이 특징이다.

매 단계마다 데이터와 맥락정보를 반복적으로 읽고 처리해야 하기 때문에 일반 챗봇보다 데이터 처리량이 최대 15배 많아 더 많은 연산 자원과 비용이 요구된다.

네모트론3 슈퍼는 이러한 부담을 줄이기 위해 ‘혼합 전문가(MoE·Mixture of Experts)’ 구조를 적용했다. 전체 1200억개의 매개변수 중 상황에 따라 최소 120억개만 선택적으로 활용하도록 설계해 비용 효율성을 높였다.

또 한 번에 처리할 수 있는 데이터 양을 늘려 이전작업 결과를 반복적으로 불러와야 하는 비효율을 줄였으며, 에이전트가 초기 지시 내용을 잊고 다른 작업을 수행하는 오류 가능성도 낮췄다.

엔비디아는 이 모델이 동급 최고 수준의 정확도를 보이며 자사의 최신 AI 칩 ‘블랙웰’에서 구동할 경우, 이전 세대 ‘호퍼’ 칩 대비 최대 4배 빠른 추론 속도를 구현할 수 있다고 설명했다.

엔비디아가 반도체 설계뿐 아니라 AI 모델까지 직접 개발해 오픈소스로 공개하는 것은 자사 그래픽처리장치(GPU) 생태계를 강화하기 위한 전략으로 풀이된다.

성능이 높은 개방형 모델을 자사 GPU에 최적화해 제공함으로써 고객들이 다른 AI 칩으로 이동하기 어렵게 만드는 ‘록인(lock-in)’ 효과를 노린다는 분석이다.

젠슨 황 엔비디아 최고경영자(CEO)는 “개방형 모델은 AI 발전 과정에서 핵심적인 역할을 한다”며 “연구자와 스타트업, 기업은 물론 국가단위까지 개방형 모델을 기반으로 AI 경쟁에 참여하고 있다”고 강조했다.

엔비디아는 이날 네덜란드 암스테르담에 본사를 둔 AI 클라우드 기업 네비우스와 전략적 파트너십을 체결하고 20억달러(약 2조9560억원)를 투자한다고 발표했다.

이번 협력을 통해 양사는 AI 데이터센터 설계와 추론 및 에이전트 기술 최적화, 차세대 엔비디아 칩의 조기도입 등 다양한 분야에서 협력할 계획이다.

네비우스는 오는 2030년까지 5GW(기가와트) 규모 이상의 엔비디아 시스템을 구축한다는 방침이다.

황 CEO는 “AI가 새로운 전환점을 맞고 있다”며 “에이전트 AI가 막대한 연산수요를 창출하며 인프라 구축을 가속화하고 있다”고 말했다. 이어 “네비우스는 에이전트 시대에 걸맞은 AI 클라우드를 구축하고 있다”고 덧붙였다.

엔비디아는 앞서 지난 1월 네비우스 경쟁사인 코어위브에도 20억달러를 투자했다. 최근에는 영국 클라우드 기업 엔스케일의 자금조달에도 참여하는 등 AI 인프라 기업에 대한 투자를 확대하고 있다.

다만 일각에서는 엔비디아가 자사 칩 고객사에 직접 투자하는 구조가 일종의 ‘순환 거래’로 이어질 수 있다는 우려도 제기되고 있다.