실시간
뉴스

AI

코난테크놀로지, 이종 AI반도체 기반 LLM 실증한다

과기정통부 '이종 AI반도체용 분산 추론 및 모델 최적화 기술 개발' 과제 수주

[ⓒ 코난테크놀로지]
[ⓒ 코난테크놀로지]

[디지털데일리 이나연기자] 인공지능(AI) 소프트웨어 전문기업 코난테크놀로지가 과학기술정보통신부가 추진하는 K-클라우드 기술개발 사업 일환인 이종 AI반도체 기반 분산 추론 및 모델 최적화 기술 개발 과제에 선정됐다고 29일 밝혔다.

총사업비 104억원 규모로 진행되는 이 과제는 이달부터 2029년 12월까지 약 4년9개월간 수행된다. 주관연구개발기관은 한국전자통신연구원(ETRI)이며 공동 연구 컨소시엄에는 리벨리온, 서울대학교, 한국과학기술원이 포함됐다.

최근 거대언어모델(LLM) 기반 서비스 수요는 급증하고 있으나 높은 추론 비용이 제약으로 작용하고 있다. 신경망처리장치(NPU)와 프로세싱인메모리(PIM) 등 다양한 AI반도체를 활용한 최적화 기술과 분산 소프트웨어 개발 중요성이 커지는 이유다.

코난테크놀로지는 이번 과제를 통해 이종 AI반도체 환경에서 LLM-검색증강생성(RAG) 분산 추론 통합 실증 서비스를 맡을 계획이다. 다양한 반도체 환경에서도 안정적인 AI 서비스 구동이 가능한 기술적 기반을 확보하고, 고성능 분산 추론 구조 실증 사례를 구현한다.

과제 연구개발 책임자인 오창민 코난테크놀로지 언어음성연구소 상무는 “국내 AI 인프라의 기술 자립을 위한 핵심 과제에 참여하게 되어 의미가 크다”며 “이종 AI반도체 기반 추론 환경에서 고도화된 실증 서비스를 현실화하고, 차세대 AI 인프라 상용화에 기여하겠다”고 말했다.

디지털데일리 네이버 메인추가
x