[디지털데일리 이종현기자] 인공지능(AI) 소프트웨어(SW) 기업 코난테크놀로지는 매개변수 131억개의 자체개발 대규모언어모델(LLM) ‘코난 LLM’을 오는 8월 출시한다고 19일 밝혔다.
코난 LLM은 17일 기준 전체 학습 토큰 4920억개, 한국어 토큰 2840억개로 학습을 마쳤다. 현 시점에서 총 매개변수는 131억개다. 파인튜닝을 거쳐 오는 8월 정식 출시하고 8월1일부터 학습을 시작해 10월까지 매개변수 400억개, 전체 토큰 6000억개, 한국어 토큰 4000억개를 목표로 하고 있다.
코난 LLM의 가장 큰 특징은 온프레미스 형태로 제공된다는 점이다. 오픈AI의 챗GPT 등 대부분의 생성형 AI 서비스는 서비스 형태로 제공되고 있다. 이는 필연적으로 보안 상의 문제가 발생할 수밖에 없다. 이에 코난테크놀로지는 기업(B2B), 정부(B2G)향 서비스라는 차별점을 둔다는 방침이다.
한국어에 특화돼 있다는 점도 강점으로 꼽힐 수 있다. 목표로 하는 수치상 코난 LLM은 전체 토큰 중 66%가량이 한국어다. 기업이나 기관에 최적화된 지도학습, 강화학습을 거쳐 문서 초안 생성이나 요약, 질의, 응대 등에서 높은 성능을 제공하겠다는 포부다.
‘가성비’를 강점으로 내세우고 있다. 통상 생성형 AI의 학습비용은 매개변수 개수에 비례하는데, 모델의 매개변수가 늘어날수록 비용 역시 커진다. 코난테크놀로지는 131억개와 400억개 매개변수 모델 중 기업‧기관 요구에 따라 옵션을 선택할 수 있도록 해 비용을 줄이면서 안정적인 성능을 제공하겠다는 목표 하에 LLM을 개발 중이다.
김영섬 코난테크놀로지 대표는 “자체개발 초거대 언어모델 확보를 위해 24여년간의 기술력을 쏟아 부었다”며 “기업과 기관에 최적화된 모델로 시장 요구에 부응하고, 온프레미스 형태로 보안을 강화시켜 생성형 AI 생태계 구축을 이끌겠다”고 말했다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
[OTT레이더] 협박전화 한 통에…넷플릭스·웨이브 '지금 거신 전화는'
2024-11-24 13:04:04주파수 재할당대가, 정부가 부르는게 값? “산정방식 검토 필요”
2024-11-22 18:23:52유료방송 시장, 역성장 지속…케이블TV 사업자 중 SKB 유일 성장
2024-11-22 13:28:49[디즈니 쇼케이스] 판타스틱4, MCU 합류…미소 짓는 케빈 파이기
2024-11-22 12:56:31LGU+, 기업가치 제고 계획 발표…"AX 컴퍼니 구조 전환 가속화"
2024-11-22 10:18:34“놀러 가고 싶지만 흔한 곳 싫어”…벌써 160만 다녀간 네이버 서비스
2024-11-24 13:05:06드림어스컴퍼니, 자본준비금 감액해 이익잉여금 500억원 전입
2024-11-22 14:57:25야놀자·인터파크트리플, 12월 ‘놀 유니버스’로 법인 통합
2024-11-22 14:57:10