[디지털데일리 오병훈기자] 오픈AI가 개발자를 위한 지원 도구 음성 지원 응용프로그램 인터페이스(API)를 비롯한 다양한 추가 기능을 선보였다.
1일(현지시간) 오픈AI는 ‘오픈AI 데브데이’를 개최하고, ▲실시간 API ▲비전 AI 파인튜닝(미세조정) 도입 ▲프롬프트 캐싱 ▲AI 모델 증류 등 신규 기능을 소개했다.
먼저 실시간 API는 6가지 사전 설정 음성을 사용해 AI 모델과 개발자 간 음성 대 음성 대화를 지원하는 기능이다. 이전 음성 지원 기능은 개발자가 자동 음성 인식 모델을 사용해 음성을 텍스트로 전환하고 이를 다시 AI 모델에 전달해 음성 변환을 사용해야 했기 때문에 중간에 부자연스러운 억양이 출력되는 문제가 있었다.
실시간 API는 오디오 입력 및 출력을 직접 스트리밍해 개발자에게 보다 자연스러운 대화 성능을 제공한다. 앞서 지난달 25일 출시된 챗GPT 고급 음성 모드와 동일하게 각종 음성 조정 기능들이 포함됐다.
비전AI 파인튜닝을 통해서는 더 많은 이미지 데이터셋을 기반으로 GPT-4o 이미지 인식 성능을 개선했다. 그 예시로 모빌리티 플랫폼 ‘그랩’에서는 비전 데이터 파인튜닝을 사용해 기존 GPT-4o 모델보다 차선 수 정확도를 20%, 속도 제한 표지판 위치 인식 정확도를 13% 개선할 수 있었다는 것이 오픈AI 측 설명이다.
프롬프트 캐싱은 개발자가 최근에 사용한 캐시 데이터를 재사용할 수 있도록 해 개발 시간을 단축시켜주는 기능이다. 이때 발생하는 비용에는 50% 할인율이 적용된다. 이를 통해 개발자는 작업 과정 중 응답 대기 시간을 최대 80%까지 줄이고, 비용도 아낄 수 있다.
마지막으로 AI모델 증류 기능도 도입된다. AI모델 증류란 거대 AI 모델이 학습한 데이터를 비교적 소형인 AI 모델에 압축·전송하는 것을 의미한다. 비교적 작은 규모로 제작되는 소형언어모델(sLM)은 거대언어모델(LLM)보다 비용이 저렴하고, 처리 효율이 뛰어나다는 장점이 있다. 개발자는 모델 증류 기능을 통해 ‘GPT-4o 미니’와 같이 가격 대비 성능에 초점을 맞춘 모델을 파인튜닝하고 개선할 수 있게 됐다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
디즈니+, '계정공유 단속' 가시화…"韓 적용시기, 미정"
2024-10-02 17:05:54[DD퇴근길] "선택약정 24개월, 12개월보다 불리"…탈의실까지 지켜보는 중국 IP캠
2024-10-02 17:03:41"불법스팸 막아야 하는데"…인증제 시행 임박, 참여율 8% 그쳐
2024-10-02 16:06:50경성크리처2, 공개 3일 만에 글로벌 2위…20개국 톱10
2024-10-02 13:44:49지피유엔 “‘프로젝트 테라리움’, 세계관이 강점… 좋은 개발자·퍼블리셔 찾는다”
2024-10-02 17:07:34친구가 만들어준 내 동물 캐릭터로 카카오톡 프로필 꾸미자
2024-10-02 16:08:00여기어때, 외부 전문가로 꾸린 개인정보 보호 자문위원회 출범
2024-10-02 16:05:37외국 이용자 겨냥…네이버 지도, 장소 리뷰에 영·중·일 번역 지원
2024-10-02 16:03:52게임 너머 바라보는 유니티, “디지털트윈으로 산업 혁신 선도”
2024-10-02 16:03:18