[디지털데일리 오병훈기자] 인공지능(AI) 대형언어모델(LLM) 기업 오픈AI가 더 강력한 추론 모델 오쓰리(o3)를 선보인다.
오픈AI는 20일(현지시간) 공식 홈페이지를 통해 신규 LLM 오원(o1) 및 ‘o1-mini(o1-미니)’ 상위 모델인 o3, o3-mini에 대한 개발자 및 연구자 테스트를 진행한다고 밝혔다.
오픈AI에 따르면 o3는 소프트웨어(SW) 분석 벤치마크 중 하나인 ‘SWE-벤치마크 베리파이드(SWE-bench Verified)에서 직전 모델인 o1보다 20% 향상된 71.7% 정확도를 기록했다. 수학 능력에서도 뛰어난 성과를 보였다. 경쟁 수학 벤치마크에서는 o3가 약 96.7% 정확도를 기록하며, o1의 83.3%보다 높다는 것이 회사 측 설명이다.
오픈AI는 비용 효율에 초점을 맞춘 o3-Mini 모델도 소개했다. o3-Mini에는 사용자가 필요에 따라 추론 시간을 조정할 수 있는 ‘적응적 추론 시간(adaptive thinking time)’ 기능이 추가된다. 사용자는 단순한 문제에서는 빠른 추론을, 복잡한 문제에서는 더 긴 추론을 선택할 수 있다.
오픈AI는 o3를 일반 이용자들에게 공개하기에 앞서 일부 개발자 및 연구자들을 대상으로 신청을 받아 실사용 테스트를 진행할 예정이다.
샘 알트먼 오픈AI 최고경영자(CEO)는 ‘오픈AI의 12일 간의 여정’ 프로젝트 관련 영상에 출연해 “현재 시장은 더 복잡한 추론 작업을 수행할 수 있는 AI를 선보이는 시대로 진입했다”며 “오픈AI 모델이 점점 더 강력해지면서 안전 테스트를 더욱 중요시 하게 됐다. 새로운 모델을 공개할 때는 연구자들이 테스트에 참여할 수 있도록 접근 권한을 제공하는 새로운 절차를 추가하고자 한다”고 전했다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
[DD퇴근길] 5G, 진짜 가입자는?…정부, 단말기준 집계 방식 바꿀까
2025-02-24 17:19:32진짜 ‘5G 가입자’ 몇명일까…정부, 가입자 집계 기준 변경 검토
2025-02-24 16:33:20[MWC25] SKT, 'K-AI 얼라이언스' 7개사 글로벌 진출 지원
2025-02-24 10:17:42"스터디그룹·선의의 경쟁 봤지?"…와이랩, 이제는 '넷플릭스'다
2025-02-23 16:48:11통신3사, MWC25서 'AI 각축전' 예고…유상임 장관 깜짝 회동할까
2025-02-23 14:57:14[OTT레이더] 인생을 건 머니게임이 시작됐다, 웨이브 ‘보물섬’
2025-02-23 12:04:50[현장] "MZ세대가 위험하다"…웹툰·웹소설 불법유통, 도박 및 성매매로 확산
2025-02-24 17:59:29[DD퇴근길] 5G, 진짜 가입자는?…정부, 단말기준 집계 방식 바꿀까
2025-02-24 17:19:32"카톡 선물·야놀자 예약, AI가 한다"…오픈AI, '오퍼레이터' 국내 첫 도입
2025-02-24 14:00:37"3D 아바타 만나는 가상도시"…마와리, AI·XR 더한 '난바 프로젝트' 가동
2025-02-24 11:35:40넥슨 ‘던전앤파이터’, 중천으로 재도약… 바통은 ‘카잔’으로
2025-02-24 11:30:05"KTX 타면서 렌터카까지"…쏘카, 장거리 이동 트렌드 제시
2025-02-24 10:26:32