[디지털데일리 오병훈기자] 오픈AI가 개발자를 위한 지원 도구 음성 지원 응용프로그램 인터페이스(API)를 비롯한 다양한 추가 기능을 선보였다.
1일(현지시간) 오픈AI는 ‘오픈AI 데브데이’를 개최하고, ▲실시간 API ▲비전 AI 파인튜닝(미세조정) 도입 ▲프롬프트 캐싱 ▲AI 모델 증류 등 신규 기능을 소개했다.
먼저 실시간 API는 6가지 사전 설정 음성을 사용해 AI 모델과 개발자 간 음성 대 음성 대화를 지원하는 기능이다. 이전 음성 지원 기능은 개발자가 자동 음성 인식 모델을 사용해 음성을 텍스트로 전환하고 이를 다시 AI 모델에 전달해 음성 변환을 사용해야 했기 때문에 중간에 부자연스러운 억양이 출력되는 문제가 있었다.
실시간 API는 오디오 입력 및 출력을 직접 스트리밍해 개발자에게 보다 자연스러운 대화 성능을 제공한다. 앞서 지난달 25일 출시된 챗GPT 고급 음성 모드와 동일하게 각종 음성 조정 기능들이 포함됐다.
비전AI 파인튜닝을 통해서는 더 많은 이미지 데이터셋을 기반으로 GPT-4o 이미지 인식 성능을 개선했다. 그 예시로 모빌리티 플랫폼 ‘그랩’에서는 비전 데이터 파인튜닝을 사용해 기존 GPT-4o 모델보다 차선 수 정확도를 20%, 속도 제한 표지판 위치 인식 정확도를 13% 개선할 수 있었다는 것이 오픈AI 측 설명이다.
프롬프트 캐싱은 개발자가 최근에 사용한 캐시 데이터를 재사용할 수 있도록 해 개발 시간을 단축시켜주는 기능이다. 이때 발생하는 비용에는 50% 할인율이 적용된다. 이를 통해 개발자는 작업 과정 중 응답 대기 시간을 최대 80%까지 줄이고, 비용도 아낄 수 있다.
마지막으로 AI모델 증류 기능도 도입된다. AI모델 증류란 거대 AI 모델이 학습한 데이터를 비교적 소형인 AI 모델에 압축·전송하는 것을 의미한다. 비교적 작은 규모로 제작되는 소형언어모델(sLM)은 거대언어모델(LLM)보다 비용이 저렴하고, 처리 효율이 뛰어나다는 장점이 있다. 개발자는 모델 증류 기능을 통해 ‘GPT-4o 미니’와 같이 가격 대비 성능에 초점을 맞춘 모델을 파인튜닝하고 개선할 수 있게 됐다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
최민희 의원, 부총리급 '과기정통인공지능부' 격상 개정안 발의
2025-04-16 18:17:07스타링크 韓 진출 임박…정부, 전파 혼간섭 방지 '총력'
2025-04-16 17:54:18[DD퇴근길] KT, 미디어사업 전략 수정…"공격적으로 AI 접목"
2025-04-16 16:53:56저속노화에 ‘홀베리’ 브랜드 열풍…SK스토아, 레몬·자몽 신상품 출시
2025-04-16 16:08:29KT 미디어사업, AX로 ‘헤쳐모여’...“눈앞 수익보단 효율화·매출원 확장 최우선”(종합)
2025-04-16 15:30:49[일문일답]KT “미디어사업, 매출 5조원 목표보단 전략수정 시급”...AI로 승부수
2025-04-16 13:09:05악연·기안장·폭싹…K-콘텐츠, '넷플릭스 톱10' 6편 석권
2025-04-16 18:17:52뉴진스, 데뷔 1000일 자축했지만…법원 판단은 그대로
2025-04-16 18:11:42[단독] 'O'PENing 2025' 라인업 확정…하반기 tvN서 만난다
2025-04-16 16:08:16한국게임이용자협회, 주요 정당에 게임 이용자 정책 제안서 전달
2025-04-16 15:25:54“경쟁보단 협동이 좋아” 마비노기 모바일, MMORPG 새 방향성 제시했다
2025-04-16 14:46:58네이버플러스 스토어 출시 한 달, MAU는 낮지만…‘지금배송’에 거는 기대감
2025-04-16 14:25:57