오픈AI 'GPT-5.4' 공개...추론·코딩·에이전트 하나의 모델로 통합

[서울이코노미뉴스 박희만 기자] 오픈AI가 추론 능력과 코딩 성능을 하나로 결합한 차세대 인공지능(AI) 모델 ‘GPT-5.4’를 공개했다.

복잡한 지식업무와 소프트웨어 개발작업을 동시에 수행할 수 있는 범용모델이다. 기업과 전문가를 위한 AI 에이전트 기반 업무환경을 겨냥했다.

6일 업계에 따르면 오픈AI는 새로운 AI 모델 ‘GPT-5.4’와 상위모델 ‘GPT-5.4 프로’를 발표했다.

이번 모델은 기존에 분리돼 있던 추론중심 모델 ‘GPT-5.2 사고(Thinking)’와 코딩특화 모델 ‘GPT-5.3 코덱스’를 하나로 통합한 것이 특징이다.

GPT-5.4는 실제 업무환경에서 활용되는 기능을 대폭 강화했다. 스프레드시트 작성, 문서 생성, 프레젠테이션 제작 등 다양한 업무를 수행할 수 있다. 여러 소프트웨어와 도구를 연동해 복잡한 작업을 처리하는 능력도 개선됐다.

이를 통해 반복적인 업무를 줄이고 작업효율을 높일 수 있다는 설명이다.

성능 지표에서도 이전 모델보다 개선된 결과를 보였다. 44개 직군의 실제 지식업무 수행능력을 평가하는 ‘GDPval’ 벤치마크에서 GPT-5.4는 전체과제의 약 82~83%에서 산업전문가 수준과 동등하거나 더 높은 성과를 기록했다.

이는 GPT-5.2의 약 70% 수준에서 크게 향상된 수치다.

또 투자은행 주니어 애널리스트 수준의 스프레드시트 모델링 작업을 평가한 내부테스트에서는 평균 87.5%의 점수를 기록해 기존 모델 대비 정확도가 높아졌다.

정보 검색능력을 평가하는 ‘브라우즈컴프’ 지표에서도 구글과 앤트로픽 등 경쟁모델보다 높은 성능을 보였다고 회사측은 설명했다.

이번 모델에는 ‘컴퓨터 사용(Computer-use)’ 기능도 기본 탑재됐다. AI 에이전트가 실제 컴퓨터 환경에서 애플리케이션을 직접 조작하며 작업을 수행할 수 있도록 설계된 기능이다.

이를 통해 여러 프로그램을 넘나드는 복잡한 업무흐름을 자동으로 처리할 수 있다.

처리 가능한 데이터 범위도 확대됐다. 최대 100만토큰의 컨텍스트를 지원해 장시간에 걸친 작업계획 수립과 실행, 검증 과정을 포함하는 에이전트 시스템 구축에도 활용할 수 있다.

이와 함께 챗GPT에는 새로운 작업방식도 도입됐다. 모델이 답변을 생성하기 전에 작업계획을 먼저 제시해 사용자가 진행방향을 조정할 수 있도록 한 것이 특징이다.

또한 다양한 출처의 정보를 종합해 분석하는 웹 기반 심층조사 기능도 강화됐다.

오픈AI는 "GPT-5.4가 이전 모델보다 더 적은 토큰으로 문제를 해결하도록 설계돼 동일한 작업을 더 빠르고 비용 효율적으로 수행할 수 있다"고 밝혔다.