오픈AI, 구글 제미나이 맹추격에 GPT-5.2 전격 투입…AI 경쟁 격화
GPT-5.1 공개 한 달 만에 공개…업무용 성능강화 구글도 ‘심층연구 에이전트’ 공개하며 정면 대응 독주 체제 흔들리며 AI 모델 경쟁 최고조
오픈AI가 차세대 인공지능(AI) 모델 ‘GPT-5.2’를 조기에 투입하며 구글과의 기술 경쟁이 한층 격화되고 있다. 구글이 최근 제미나이(Gemini) 3.0을 앞세워 빠르게 추격에 나서자, 오픈AI가 이례적으로 신속한 대응에 나섰다는 평가다.
오픈AI는 11일(현지시간) 신규 모델 GPT-5.2를 공개했다. 지난달 GPT-5.1을 선보인 지 불과 한 달 만이다. 업계에서는 통상 수개월 간격으로 이뤄지던 모델 업데이트 주기를 감안할 때, 경쟁 상황을 의식한 ‘속도전’ 성격이 짙다고 보고 있다.
이 같은 움직임은 구글의 제미나이 3.0 공개 이후 본격화된 것으로 전해졌다. 로이터통신에 따르면 샘 올트먼 오픈AI 최고경영자(CEO)는 제미나이 3.0 발표 직후 사내에 이른바 ‘코드 레드(Code Red)’를 언급하며 챗GPT 성능 개선에 총력을 기울릴 것을 주문한 것으로 알려졌다.
GPT-5.2는 문서 작성, 스프레드시트 분석, 발표 자료 구성, 복잡한 코드 작성 등 전문 업무 처리 능력 강화에 초점을 맞췄다. 오픈AI는 이번 모델을 즉답형, 사고형, 전문가형 등 세 가지로 나눠 제공하며, 장기 프로젝트 수행과 다단계 추론에서 효율을 높였다고 설명했다.
오픈AI가 공개한 자료에 따르면 44개 직무를 기준으로 실제 업무 수행 능력을 평가하는 GDPval 벤치마크에서 GPT-5.2 전문가형은 74.1%, 사고형은 70.9%의 점수를 기록했다. 이는 동일 과제에서 인간 전문가와 대등하거나 앞서는 수준이라는 것이 오픈AI의 설명이다. 코딩 성능을 측정하는 SWE 벤치마크에서도 80%를 기록했다.
고난도 추론 능력을 평가하는 ‘휴머니티스 라스트 이그잼’(HLE) 벤치마크에서는 검색 등 외부 도구를 활용한 조건에서 GPT-5.2 전문가형이 50%를 기록해 경쟁 모델보다 높은 점수를 받았다고 오픈AI는 밝혔다. 또 기존 모델 대비 오류가 포함된 응답 비율도 상대적으로 약 30% 줄었다고 설명했다.
구글 역시 같은 날 반격에 나섰다. 구글은 제미나이 3.0을 기반으로 한 ‘심층연구 에이전트’를 공개하고, 이를 평가하기 위한 새로운 벤치마크인 ‘심층검색 질의응답(DeepSearchQA)’ 도구를 함께 선보였다. 구글은 이 평가에서 자사 에이전트가 66.1%의 점수를 기록했다고 밝혔다.
이처럼 오픈AI와 구글이 나란히 새 모델과 평가 지표를 공개하면서, 한동안 오픈AI 중심으로 흘러가던 AI 모델 시장은 본격적인 양강 경쟁 구도로 재편되는 모습이다. 업계에서는 단순 질의응답을 넘어 실제 업무를 대신 수행하는 ‘에이전트형 AI’가 차세대 경쟁의 핵심이 될 것으로 보고 있다.
올트먼 CEO는 이날 자사 블로그를 통해 “우리의 연구와 제품 로드맵에 대해 그 어느 때보다 낙관적”이라며 “AI는 앞으로 인간이 상상하지 못했던 수준의 생산성을 만들어낼 것”이라고 밝혔다.
GPT-5.2는 이날부터 유료 구독자를 대상으로 순차 제공된다. 오픈AI는 향후 몇 달간 실제 서비스 환경에서의 활용 결과를 바탕으로 추가 개선을 이어간다는 방침이다.