[디지털데일리 이종현기자] 알리바바클라우드는 자체 개발한 대규모언어모델(LLM) ‘통이치엔원(Tongyi Qianwen)’의 720억개 매개변수(파라미터) 버전 ‘큐원-72B(Qwen-72B)’와 18억개 매개변수 버전 ‘큐원-1.8B’, 오디오 이해 모델 ‘큐원-오디오’ 등을 인공지능(AI) 플랫폼 허깅페이스와 자사 AI 모델 커뮤니티 ‘모델스코프’에 공개했다고 5일 밝혔다.
알리바바클라우드는 현재까지 18억, 70억, 140억, 720억 매개변수까지 다양한 크기의 LLM과 오디오 및 비주얼 판독 기능을 갖춘 멀티모달 LLM을 개발했다.
징런 저우(Jingren Zhou) 알리바바 클라우드 최고기술책임자(CTO)는 “오픈소스 생태계를 구축하는 것은 LLM 및 AI 애플리케이션 개발에 매우 핵심적인 일이다. 알리바바 클라우드는 가장 개방적인 클라우드로서 모든 사람이 생성형 AI 역량을 활용할 수 있도록 하는 것을 목표로 한다”며 “이러한 목표를 달성하기 위해 자사의 최첨단 기술을 공유하고 파트너들과 함께 오픈소스 커뮤니티의 발전을 촉진해 나갈 것”이라고 말했다.
알리바바클라우드에 따르면 큐원-72B는 3조개 이상의 토큰으로 사전 학습됐다. 주요 오픈소스 모델들을 10개 벤치마크 부문에서 능가한다고 강조했다. 대표적으로 앞선 벤치마크 부문은 대규모 다중작업 언어이해(MMLU), 코드 개발 역량 테스트인 휴먼이발(HumanEval) 및 수학 문제를 푸는 GSM8K 등이다.
큐원-72B는 역할극인 롤 플레이, LLM이 특정 역할이나 페르소나를 취해 맥락에 보다 맞는 응답을 생성하는 능력을 드러내는 언어 스타일 이전(Language style transfer) 등 다양하고 복잡한 작업을 처리하는 데 높은 성능을 보인다. 이러한 기능은 개인화된 챗봇과 같은 AI 애플리케이션(앱)에서 유용하게 사용될 수 있다고 전했다.
기업과 연구기관들은 큐원-72B 모델을 연구 목적으로 활용 시 코드, 모델 가중치 및 도큐멘테이션(설명서)를 무료로 활용할 수 있다. 상업적 용도의 경우, 월간 활성 사용자(MAU) 수가 1억명 미만인 기업에 한해서 무료로 사용할 수 있다.
또 알리바바클라우드는 에지(Edge)에서 실행할 수 있는 18억개의 파라미터로 구성된 LLM 큐원-1.8B도 오픈소스화했다. 경량 버전인 큐원-1.8B는 컴퓨터 리소스가 제한된 휴대폰과 같은 엔드 장치에서 추론을 가능하게 한다. 작은 규모의 LLM 모델은 컴퓨팅 리소스 요구사항이 적어 비용 효율적이며 배포가 용이한 대안을 찾는 경우 유용하다. 큐원-1.8B는 현재 연구 목적으로만 활용 가능하다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
[OTT레이더] 인생을 건 머니게임이 시작됐다, 웨이브 ‘보물섬’
2025-02-23 12:04:50[인터뷰]“밤 9시까지 AI 열정!”...’KT에이블스쿨 전형’이 신설된 이유는?
2025-02-23 09:00:00연간 통신분쟁 전년 대비 22% 급증…”이용계약 관련 분쟁이 절반”
2025-02-21 17:39:30[DD퇴근길] 계속되는 '망 사용료 갈등'…MWC, 논의의 장으로
2025-02-21 17:28:22[IT클로즈업] ‘망 사용료 논쟁’ MWC서 재점화될까…“주요국 입장 예의주시해야”
2025-02-21 11:30:17신작 시험대, ‘스팀 넥스트 페스트’ 개막… K-게임도 출전 준비 완료
2025-02-23 12:03:00[툰설툰설] 신분차이 로맨스…재벌과의 인터뷰 vs 품격을 배반한다
2025-02-23 11:42:17SM·카카오엔터 합작 英 보이그룹 '디어앨리스' 공식 데뷔
2025-02-21 17:28:39[DD퇴근길] 계속되는 '망 사용료 갈등'…MWC, 논의의 장으로
2025-02-21 17:28:2229CM, 상반기 ‘이구홈위크’ 전년비 거래액 2배 돌파…“주방용품·홈 패브릭 상품 추천 적중”
2025-02-21 16:24:36위메이드 ‘레전드오브이미르’, 구글 플레이 인기 1위 달성
2025-02-21 16:16:01