[디지털데일리 오병훈기자] 인공지능(AI) 대형언어모델(LLM) 기업 오픈AI가 더 강력한 추론 모델 오쓰리(o3)를 선보인다.
오픈AI는 20일(현지시간) 공식 홈페이지를 통해 신규 LLM 오원(o1) 및 ‘o1-mini(o1-미니)’ 상위 모델인 o3, o3-mini에 대한 개발자 및 연구자 테스트를 진행한다고 밝혔다.
오픈AI에 따르면 o3는 소프트웨어(SW) 분석 벤치마크 중 하나인 ‘SWE-벤치마크 베리파이드(SWE-bench Verified)에서 직전 모델인 o1보다 20% 향상된 71.7% 정확도를 기록했다. 수학 능력에서도 뛰어난 성과를 보였다. 경쟁 수학 벤치마크에서는 o3가 약 96.7% 정확도를 기록하며, o1의 83.3%보다 높다는 것이 회사 측 설명이다.
오픈AI는 비용 효율에 초점을 맞춘 o3-Mini 모델도 소개했다. o3-Mini에는 사용자가 필요에 따라 추론 시간을 조정할 수 있는 ‘적응적 추론 시간(adaptive thinking time)’ 기능이 추가된다. 사용자는 단순한 문제에서는 빠른 추론을, 복잡한 문제에서는 더 긴 추론을 선택할 수 있다.
오픈AI는 o3를 일반 이용자들에게 공개하기에 앞서 일부 개발자 및 연구자들을 대상으로 신청을 받아 실사용 테스트를 진행할 예정이다.
샘 알트먼 오픈AI 최고경영자(CEO)는 ‘오픈AI의 12일 간의 여정’ 프로젝트 관련 영상에 출연해 “현재 시장은 더 복잡한 추론 작업을 수행할 수 있는 AI를 선보이는 시대로 진입했다”며 “오픈AI 모델이 점점 더 강력해지면서 안전 테스트를 더욱 중요시 하게 됐다. 새로운 모델을 공개할 때는 연구자들이 테스트에 참여할 수 있도록 접근 권한을 제공하는 새로운 절차를 추가하고자 한다”고 전했다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
[윤석열 파면] 헌재 “야당의 방통위원장 탄핵소추, 계엄령 요건 될 수 없어”
2025-04-04 16:47:39SKT 유영상 “돈버는 AI 성과 본격화”…AI 성과 가시화 재차 강조
2025-04-04 10:44:29'尹 운명의 날'…통신3사, 탄핵선고 앞두고 총력 대비
2025-04-04 10:08:18[단독] 유료방송 위기여파 PP로…“콘텐츠 사용료 약 1200억원 감소 전망”
2025-04-03 17:44:35[DD퇴근길] 5대 AI에게 물었다…"尹 탄핵심판 결과, 어떨 것 같니?"
2025-04-03 17:13:51[인터뷰] 이해민 의원, "美 통상마찰 없이 '망 무임승차' 해결하려면"
2025-04-03 15:59:44[윤석열 파면] "네이버·다음 프로필, 前 대통령"…페북·인스타 소개글은?
2025-04-04 18:23:30엔시티 위시, 엠넷플러스 '숨바꼭질' 두번째 플레이어로 출격
2025-04-04 17:44:41[DD퇴근길] 윤석열 대통령 파면…ICT·산업계 미칠 영향은?
2025-04-04 17:16:48[윤석열 파면] '탄핵 기념 정식' 인증샷 급증…中 포털서는 실시간 검색어 1위도
2025-04-04 16:49:16우아한형제들, 독일 모기업 DH 자사주 매입·소각…5372억원 지급
2025-04-04 16:48:46우아한형제들, 지난해 매출 4조원 벽 뚫었지만…무료배달 경쟁에 영업익 감소
2025-04-04 15:16:39