[디지털데일리 이건한 기자] 매일, 매주 전해지는 한국 인공지능(AI) 기업들의 소식을 핵심 내용과 의미만 간추려 깔끔하게 요리(Cook)해드립니다. 2월 3일 AI 한쿡은 화제의 '딥시크'를 비롯한 AI 모델들의 에이전트 역량 평가 벤치마크를 공개한 올거나이즈의 소식 외 4건입니다.
■ 주요 소식
AI 에이전트 평가 벤치마크 공개한 '올거나이즈'
올거나이즈가 국내 최초로 LLM 에이전트의 역량을 종합 평가할 수 있는 '올인원 벤치마크(All-in-One Benchmark)'를 공개했다. 사용자는 본 벤치마크로 오픈AI의 GPT, LG전자의 엑사원, 알리바바의 큐원, 딥시크의 V3, 자사의 소형언어모델 '알파 LLM' 등 국내외 12개 LLM의 에이전트 역량을 평가할 수 있다. 특히 LLM이 에이전트로서 외부 도구를 호출하는 핵심 기능인 ‘툴 콜링(tool calling)’은 한국어·외국어 환경에 따른 별도 평가 도구가 사용됐으며, 유통, 항공 등 실제 산업 현장 내 다양한 시나리오에서의 문제 해결 역량을 평가하는 벤치마크도 포함됐다.
실제로 올거나이즈는 최근 저비용 개발, 고성능으로 화제를 모은 딥시크 V3 모델의 에이전트 역량을 평가한 결과 오픈AI의 'GPT-4o 미니'와 유사한 성능을 보였다고 밝혔다.
올인원 벤치마크는 에이전트 역량 외에도 일반적인 언어 이해, 지식수준, 명령 준수(Instruction Following) 등 LLM의 성능을 종합적으로 평가한다. 또한 새로 출시된 LLM도 벤치마크 플랫폼으로 해당 모델의 API를 자동 구현해 평가를 진행할 수 있고, 평가 시간도 기존 벤치마크 대비 1시간30분에서 20분 수준으로 줄여 편의성이 높아졌다.
의미: 올해 국내외 AI 기술 및 서비스 트렌드는 단순 LLM에서 고도화된 액션 수행까지 가능한 AI 에이전트로 넘어갈 것이란 업계의 전망이 지배적이다. 이에 따라 에이전트의 실질적 역량을 측정하기 위한 벤치마크 또한 수요가 증가할 전망인 가운데, 국내에서도 발빠른 대응이 이뤄졌다는 점에서 주목할 만하다. 또한 벤치마크 개발을 위해선 AI 에이전트 기술 및 구조에 대한 깊은 이해가 수반되어야 하는 만큼, 올거나이즈 역시 에이전트 자체 개발 및 고도화에 필요한 최적화 노하우 확보를 기대해 볼 수 있다.
업스테이지-조선일보, 국내 첫 '미디어 AI' 개발 협력
업스테이지가 조선일보와 미디어 AI 공동 개발에 나선다. 양사는 이번 협약으로 신문과 디지털 뉴스 제작·서비스 전 과정에 AI 도입 실험에 나선다. 이 가운데 업스테이지는 자사의 LLM(대형언어모델) '솔라'를 제공하며, 조선일보는 105년치 기사 410만건과 35만건의 인물 데이터베이스(DB), 영문 및 일문 기사 등 모델 학습에 필요한 데이터를 제공한다.
양사는 우선 상반기에 '교열 AI'를 선보일 예정이다. 기사 초안을 입력하면 95% 이상의 정확도로 오탈자를 잡아내고, 어색한 문장 구조를 바꾸거나 문맥에 맞는 단어를 추천하는 기능이 포함된다. 나아가 ▲기사 번역 ▲RAG(검색증강생성) 기반 자료 검색 ▲뉴스 팩트체크 ▲발제문 기반의 기사 생성 등 미디어 산업 전반에 활용 가능한 AI 기술 개발이 이뤄질 예정이다.
의미: AI 기업과 언론사의 협력은 상대적으로 큰 시너지 효과를 기대할 수 있다. 고성능 AI 모델의 성능을 극대화하려면 신뢰할 수 있는 양질의 데이터가 필요한데, 일반적으로 언론사의 기사 데이터는 사실 확인, 문장, 문법, 형태, 키워드 등 측면에서 고품질로 분류되기 때문이다. 해외에서도 지난해 오픈AI가 모델 학습을 위해 타임지, 뉴스코프 등 언론사들과 잇따라 데이터 활용 라이선스 계약을 맺은 것도 이 때문이다.
다만 업스테이지와 조선일보의 이번 협약에 학습 데이터 활용 라이선스는 포함되지 않은 것으로 확인된다. 그러나 국내에서도 주요 AI 기업과 미디어가 정식으로 특화 AI 서비스를 개발하고 공동 서비스를 기획한 첫 사례란 점은 의미가 있다. 또한 현재 뉴스 데이터 저작권 침해로 골머리를 썩고 있는 여타 미디어들에게도 문제 해결을 위한 하나의 대안이 될 수 있을지 주목된다.
■ 짧은 뉴스
크릿벤처스, 퓨리오사AI에 20억원 투자 집행
크릿벤처스가 국내 AI 반도체 전문회사 퓨리오사AI에 20억원을 투자했다. 2021년 첫 AI 반도체 '워보이'를 공개한 퓨리오사는 당시 동급 엔비디아 제품보다 뛰어난 성능으로 주목받은 바 있다. 지난해 8월에도 전력 효율이 크게 개선된 신제품을 공개했다. 크릿벤처스는 "퓨리오사AI의 기술력, 가격 경쟁력이 글로벌 플레이어들과 견줄 만하다"며 투자 이유를 밝혔다. 크릿벤처스는 국내외 총 2600억원 규모의 운용 자산을 보유한 VC로, 컴투스 그룹의 글로벌 투자 총괄인 송재준 대표가 2020년 설립했다.
알체라, AI 탑재 전자담배 무인 자판기 공급
알체라가 필굿이노베이션과 손잡고 전국 고속도로 휴게소에 AI 성인인증 솔루션이 탑재된 무인 전자담배 자판기 공급에 나선다. 알체라는 필굿이 생산하는 무인 자판기에 고수준의 AI 성인인증 솔루션을 제공할 예정이다. 1차로 신분증에서 위조 및 성인 여부를 판별하고, 2차로 신분증의 사진과 실시간 구매자 얼굴을 비교해 신원을 확인하는 방식이다. 알체라 관계자에 따르면 개인의 얼굴에서 변하지 않는 고유 특징 데이터를 활용해 판별하므로 인증 정확도는 99%에 달한다는 설명이다.
코난테크놀로지, '챗봇 무인 동시통역' 이달 공개
투명 스크린으로 한국어를 비롯한 13개 언어 동시통역이 가능한 코난테크놀로지의 '코난 챗봇 플러스'가 출시 1주년을 맞아 서비스 영역 확대에 나선다. 해당 서비스는 누구나 모국어로 질문하면 텍스트 변환 과정 없이 바로 번역되어 평균 1초 이내로 스크린에 표시된다. 그동안 외국인 관광객이 많은 지하철역, 롯데 백화점 잠실점, 용산구청 종합 민원실 등에 도입된 바 있다. 회사는 이달 중 아예 상담사가 없어도 챗봇이 주요 FAQ(질의응답)에 무인으로 즉각 대응할 수 있는 서비스로 확대할 계획이라고 밝혔다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
쿠팡플레이 '뉴토피아' 윤성현 감독 "계엄령·여객기 폭발은 우연, 깜짝 놀랐다"
2025-02-03 19:44:19KCA, 보안·네트워크 분야 스타트업에 3년 간 최대 6억원 지원
2025-02-03 18:16:06[DD퇴근길] 오픈AI CEO, 카카오 대표 만난다…AI 파트너십 맺을까
2025-02-03 17:52:141월 번호이동 '50만선' 붕괴…"갤럭시S25 대기 수요"
2025-02-03 13:04:13"AI로 업무속도↑"…SKT, '에이닷 비즈' CBT 돌입
2025-02-03 10:47:24크래프톤 김창한, 샘 올트먼 만난다...글로벌 AI 거물들과 밀착 행보
2025-02-03 19:54:17[DD's톡] 딥시크 수혜주에 오픈AI 동맹까지…카카오 주가 고공행진
2025-02-03 17:52:34[DD퇴근길] 오픈AI CEO, 카카오 대표 만난다…AI 파트너십 맺을까
2025-02-03 17:52:14컴투스 ‘MLB 9이닝스 25’, 한국 및 대만 원스토어 출시
2025-02-03 17:39:06카카오 정신아, 샘 올트먼 만난다…오픈AI와 협업 기대감 증폭
2025-02-03 15:35:16탄핵정국 변수에 셈법 복잡…네이버 제평위 부활 시점에 쏠린 눈
2025-02-03 13:47:28