[디지털데일리 오병훈기자] 인공지능(AI) 대형언어모델(LLM) 기업 오픈AI가 더 강력한 추론 모델 오쓰리(o3)를 선보인다.
오픈AI는 20일(현지시간) 공식 홈페이지를 통해 신규 LLM 오원(o1) 및 ‘o1-mini(o1-미니)’ 상위 모델인 o3, o3-mini에 대한 개발자 및 연구자 테스트를 진행한다고 밝혔다.
오픈AI에 따르면 o3는 소프트웨어(SW) 분석 벤치마크 중 하나인 ‘SWE-벤치마크 베리파이드(SWE-bench Verified)에서 직전 모델인 o1보다 20% 향상된 71.7% 정확도를 기록했다. 수학 능력에서도 뛰어난 성과를 보였다. 경쟁 수학 벤치마크에서는 o3가 약 96.7% 정확도를 기록하며, o1의 83.3%보다 높다는 것이 회사 측 설명이다.
오픈AI는 비용 효율에 초점을 맞춘 o3-Mini 모델도 소개했다. o3-Mini에는 사용자가 필요에 따라 추론 시간을 조정할 수 있는 ‘적응적 추론 시간(adaptive thinking time)’ 기능이 추가된다. 사용자는 단순한 문제에서는 빠른 추론을, 복잡한 문제에서는 더 긴 추론을 선택할 수 있다.
오픈AI는 o3를 일반 이용자들에게 공개하기에 앞서 일부 개발자 및 연구자들을 대상으로 신청을 받아 실사용 테스트를 진행할 예정이다.
샘 알트먼 오픈AI 최고경영자(CEO)는 ‘오픈AI의 12일 간의 여정’ 프로젝트 관련 영상에 출연해 “현재 시장은 더 복잡한 추론 작업을 수행할 수 있는 AI를 선보이는 시대로 진입했다”며 “오픈AI 모델이 점점 더 강력해지면서 안전 테스트를 더욱 중요시 하게 됐다. 새로운 모델을 공개할 때는 연구자들이 테스트에 참여할 수 있도록 접근 권한을 제공하는 새로운 절차를 추가하고자 한다”고 전했다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
[DD퇴근길] 우티, 티맵 손 떼고 우버 단독체제…넷플릭스에 올라탄 SBS
2024-12-20 17:11:09넷플릭스, SBS 손 잡고 K-콘텐츠 확대…"신작 글로벌 동시공개"
2024-12-20 14:37:42美 TIME지가 선정한 K-콘텐츠 10선, 절반이 '이곳'에서?
2024-12-20 14:37:20[현장] 티빙·웨이브 합병 두고 CEO별 온도차…"주주 동의 필요 vs 無 관여"
2024-12-19 17:13:57[DD퇴근길] 갈길 먼 AI 기본법…바디프랜드, '가구' 선보인 이유는
2024-12-19 16:52:18‘핫플’ 예약에 각종 할인·이벤트…연말연시 ‘꿀팁’ 네카오에 다 있다
2024-12-21 11:07:47[DD퇴근길] 우티, 티맵 손 떼고 우버 단독체제…넷플릭스에 올라탄 SBS
2024-12-20 17:11:09신종환 카카오 CFO, CA협의체 재무 총괄 대표 겸직…“그룹 재무 관리 체계 강화”
2024-12-20 16:17:13[종합] 택시 사업 철수 vs 韓 공략 박차…다른 길 걷는 티맵·우버
2024-12-20 15:23:38[DD's톡] ‘붉은사막’ 출시 지연 장기화… 펄어비스, 내년도 ‘버티기’
2024-12-20 12:41:27우버·티맵 합작법인 ‘우티’, 내년부터 우버 단독법인 체제로
2024-12-20 10:23:47