[아이뉴스24 윤소진 기자] 구글 제미나이 시리즈의 추격에 압박을 받는 오픈AI가 이전 버전 출시 한 달 만에 새로운 플래그십 모델 GPT-5.2를 출시했다.
![오픈AI는 11일(현지시간) 최신 플래그십 모델 GPT-5.1을 출시했다. [사진=오픈AI 공식 홈페이지]](https://image.inews24.com/v1/1849e0d6944f3a.jpg)
오픈AI는 11일(현지시간) “전문적인 지식 업무 수행에 가장 뛰어난 모델”이라며 GPT-5.2 시리즈를 공식 공개했다. 이번 업데이트는 GPT-5.1 이후 불과 한 달 만에 이뤄진 것으로, 챗GPT 서비스 출시 이후 가장 빠른 플래그십 교체 사례다.
GPT-5.2는 즉답(Instant)·사고(Thinking)·프로(Pro) 등 세 가지 모드로 구성된다. 즉답 모드는 일상적인 질의와 학습용 응답에 초점을 맞춘 고속 모드이며, 사고 모드는 코딩·수학 문제 해결·장문 문서 분석 등에 적합하도록 설계됐다. 새로 추가된 프로 모드는 보다 긴 처리 시간과 높은 정확도가 요구되는 난이도 높은 질문을 겨냥한 모델이다.
오픈AI에 따르면 GPT-5.2는 추론과 코딩 능력을 강화하는 동시에 환각 현상을 크게 줄였으며, 주요 AI 성능 평가 지표에서 최고 수준의 성과를 기록했다.
전문 산업 현장 44개 직종의 업무 수행 능력을 평가하는 GDPval 테스트에서 GPT-5.2 사고 모드는 70.9%, 프로 모드는 74.1%를 기록했다. 이는 GPT-5의 38.8% 대비 크게 상승한 수치로, 인간 전문가와 유사하거나 이를 상회하는 수준이라는 평가다.
소프트웨어 개발 역량을 측정하는 SWE 벤치마크에서는 80%를 기록해 구글 제미나이 3 프로(76.2%)를 앞섰다. 앤트로픽의 클로드 오퍼스 4.5(80.9%)와도 근접한 수치다. 박사급 추론 능력을 가늠하는 HLE 벤치마크에서도 구글 최신 모델을 넘어섰다.
다만 도구를 사용하지 않고 모델 자체 능력만으로 평가한 HLE 테스트에서는 GPT-5.2 프로가 36.6%로 제미나이 3 프로(37.5%)보다 소폭 낮았지만, 검색 등 외부 도구를 활용한 평가에서는 50%를 기록해 제미나이 3 프로(45.8%)를 앞질렀다.
신뢰성 지표도 개선됐다. 오픈AI 내부 테스트에 따르면 GPT-5.2 사고 모드의 오류율은 6.2%로, GPT-5.1 사고 모드(8.8%) 대비 약 30% 감소했다. 긴 문맥 이해, 그래프·이미지 인식, 다단계 업무 처리 능력 역시 이전 세대보다 향상됐다.
안전성 관련 기능도 강화됐다. 민감한 대화(정신건강, 자해, 감정적 의존 등) 대응을 개선했고, 연령 예측 모델을 제한적으로 출시해 18세 미만 사용자에게 자동으로 콘텐츠 보호를 적용하고 부모 통제 기능을 강화했다.
업계에서는 오픈AI가 GPT-5.2 출시 시점을 당초 계획보다 앞당긴 배경으로 제미나이 3 프로의 강력한 벤치마크 성과를 지목하고 있다. 실제 샘 올트먼 오픈AI 최고경영자(CEO)는 제미나이 3 프로 공개 이후 사내에 ‘코드 레드’를 발령하고 챗GPT 성능과 사용성 개선에 집중하라고 주문한 바 있다.

--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기