실시간
뉴스

일반

LLM이 부른 AI 붐, 벌써 '캐즘'이 보인다...대안은 'SLM' [real! AI Pro]

AI 대전환의 시대, 쏟아지는 이슈와 키워드 중 '꼭 알아야 할 것'과 '알아두면 좋은' 것을 구분하기란 쉽지 않습니다. 뜬구름 잡는 이야기도 많습니다. [real! AI Pro]는 이 고민을 현업 전문가들이 직접 선정한 주제와 인사이트를 담아 명쾌하게 정리해드립니다. <편집자주>

[디지털데일리 이건한 기자] 요즘 인공지능(AI) 산업은 캐즘(Chasm)을 맞이했다는 평가가 많죠. 캐즘은 '소비 정체기'를 말합니다. 구체적으론 혁신기술이나 제품이 초기 얼리어답터 성향 소비자들에게 주목받다가 관심이 식고, 아직 일반 사용자들에게는 널리 수용되지 못한 상태입니다.

이는 대부분의 혁신 기술이 보편화 단계에서 겪는 과정이지만, 기업에게 이 시기는 다음 농작물의 수확까지 허리띠를 졸라매고 버텨야 하는 보릿고개 같기도 합니다. 그런데 문제는? 요즘 AI 트렌드를 주도하는 LLM(대형언어모델)은 기본적으로 모델 개발 및 서비스 운영비가 지금까지의 어떤 첨단기술보다 크다는 점입니다. 사람처럼 똑똑한 AI를 가동하려면 그만큼 방대한 규모의 데이터 학습과, 여기에 필요한 다량의 고성능 GPU(그래픽처리장치), 서버 등이 필요한 까닭입니다.

[ⓒ AI 생성 이미지]
[ⓒ AI 생성 이미지]

이 점은 현재 글로벌 AI 시장 선두 그룹인 오픈AI는 물론, 구글, 메타 같은 빅테크들도 LLM 부문에서 천문학적인 적자를 면치 못하고 있는 이유인데요. 그럼에도 그들은 현재 막강한 자금력을 바탕으로 출혈을 감수한 AI 패권 다툼, 혹은 치킨게임을 택하고 있습니다. 반면 나머지 기업, 중소 스타트업들은 그와 같은 고래싸움에서 도저히 버틸 재간이 없습니다. 설상가상 투자 시장의 분위기도 이제는 '수익성 있는 AI를 개발하라'는 압박이 큰 상황입니다.

이런 상황에서 기존 LLM보다 크기를 줄여 비용을 절감하면서도, 특화 기능과 최적화된 성능 기반의 비즈니스 전개가 가능한 SLM(Small Language Model, 소형언어모델)은 기업 입장에서 매력적인 대안인데요. 이를 주제로 본편에서는 '감성AI' 분야에서 일찍이 SLM 개발 및 비즈니스 경험을 풍부히 쌓은 스캐터랩 김종윤 대표가 SLM의 정의와 특징, 실전 비즈니스 노하우를 전해드립니다.

[ⓒ 디지털데일리]
[ⓒ 디지털데일리]

■ LLM? SLM? 그 기준은?

안녕하세요, 김종윤입니다. SLM에 대한 이야기에 앞서, 다소 생소한 개념인 SLM과 LLM의 차이가 궁금한 분들이 있을 것 같습니다. 요즘 업계에서는 LLM, sLLM, SLM 등 모델을 분류하는 여러 용어가 쓰이고 있지만 동일 사이즈의 LLM이라도 어떤 기업은 LLM, 어떤 기업은 SLM이라고 말하곤 해서 다소 헷갈릴 수 있습니다. 사실, 아직 명확한 기준은 없는 상황이죠.

이건 사람의 키만 해도 크고 작음을 판단하는 기준이 보는 관점에 따라 다른 것과 비슷합니다. 언어모델 역시 파라미터(매개변수) 수를 기준으로 할 것이냐, 학습에 투입된 연산량이 기준이냐 등등 관점이 달라질 수 있다는 얘기지요.

그러나 개인적으로 가볍게 구분하자면, 파라미터 30B(300억개) 미만은 SLM, 그 이상은 LLM으로 봐도 무방할 것 같습니다. 요즘은 고성능 LLM을 만드는 오픈AI나 메타도 7B에서 10B 정도를 가장 작은 규모로 두고 개발하곤 합니다. 또 어떤 측면에서 LLM의 정의는 점차 연구단계에서 다각적으로 활용해볼 수 있는 모델로 국한되지 않을까란 생각도 듭니다.

안 쓸 수 없어…'갓성비'로 나아가는 SLM

그럼 SLM 기반 AI 서비스는 확실히 LLM보다 수익성이 좋을까요? 이 또한 서비스 사용량과 과금량에 따라 다를 수 있지만, 충분히 그렇다고 봅니다. SLM을 활용하는 스캐터랩의 AI 콘텐츠 플랫폼 '제타(zeta)'도 현재 트래픽 규모가 상당하지만 충분한 경제성으로 운영되고 있거든요. 그것이 가능한 이야기는 이어서 자세히 설명하겠습니다.

우선 SLM은 애초에 '가능하면 더 작은 크기로 성능은 LLM 못지 않는 것'을 추구합니다. LLM이나 비슷한 사이즈의 모델을 비교 대상으로 두고 끊임없이 가성비 고도화를 고민하죠. 덕분에 아마 곧 네트워크 연결 없이 스마트폰에서 구동되는 온디바이스(On-device) 환경에서도 충분히 강력한 성능으로 구동되는 SLM들이 속속 개발될 겁니다. 동시에 이를 지원하는 하드웨어 수준도 좋아지고 있으므로 지금 SLM 크기의 모델이 모바일에서 구현 가능한 날도 올 것이고요.

또한 기업의 다각적인 노력으로도 비용 절감을 모색해볼 수 있습니다. 모델 최적화는 기본이고, GPU 제공 사업자들과 협상해 'SLM이지만 이 정도 사용량은 보장하겠다'고 약속함으로써 사용료를 할인 받는 방법이 있죠. 아예 '스팟 인스턴스(Spot instance)'라는, GPU 제공 사업자의 유휴 자원을 활용하는 계약도 있습니다. 스팟은 비록 제공자 여력에 따라 언제든 뺏길 수 있는 자원이지만 GPU를 꽤 저렴하게 쓸 수 있다는 장점도 따릅니다.

AI 훈련용 GPU로 널리 쓰이는 엔비디아의 'H100' 모델, 개당 가격이 수천만원을 호가한다. [ⓒ 엔비디아]
AI 훈련용 GPU로 널리 쓰이는 엔비디아의 'H100' 모델, 개당 가격이 수천만원을 호가한다. [ⓒ 엔비디아]

SLM이 LLM에 뒤지지 않는 것

중요한 건 비용뿐 아니라 SLM이 LLM에 성능면에서도 뒤지지 않을 수 있다는 겁니다. 물론 범용성은 비기기 어렵습니다. 그러나 사실 우리가 일상에서 쓰는 대부분의 서비스는 범용성보단 개별 분야에 특화된 것들입니다. AI는 어떨까요? 거의 만능처럼 보이는 '챗GPT'가 초기부터 범용성이 부각된 까닭에 대중이 AI에 거는 기대는 지금도 범용성에 더 초점이 맞춰져 있습니다.

하지만 최근 시장 트렌드는 범용성보단 세부 기능 지원에 특화된 '도메인 특화 AI' 중심으로 변모하고 있습니다. 나아가 범용 AI도 하나의 운영체제 같은, 성능 좋은 대형모델에 다양한 AI 에이전트 모델이 레고처럼 붙어 확장되는 형태로 만들어질 거란 예측들도 나오고 있고요.

이때 도메인 특화 AI 서비스는 가성비 좋은 SLM으로 충분히 만들 수 있습니다. 또한 이런 모델은 동일 서비스 영역에서 범용 모델 대비 더 많고 세밀한 데이터를 집중적으로 학습할 수 있습니다. 이 말은 AI 서비스가 전문영역으로 세분화될수록 오히려 SLM이 퍼포먼스와 사업성 측면에서 LLM을 앞설 수 있다는 의미입니다.

SLM 비즈니스에 앞서 잊지 말아야 할 것

그럼 SLM 하나만 잘 만들면 끝일까요? 그럴 리 없습니다. 기능의 특화도 '도메인(영역) 특화'가 아니라 '제품 특화' 수준으로 날카로워야 합니다. 스캐터랩의 서비스만 해도 이전의 '이루다'나 지금의 '제타'나 크게 보면 대화형 AI입니다. 또한 각기 페르소나를 지닌 캐릭터 AI 서비스이기도 하죠. 솔직히 캐릭터형 AI와 대화할 수 있는 서비스는 저희 외에도 다양합니다.

그러나 지금 제타가 비슷해 보이는 대화형 AI 서비스들 중에서도 사용자들에게 더 좋은 반응을 얻은 배경은 '정교함'에 있다고 생각합니다. 스캐터랩은 창업 당시부터 '대화' 도메인보다 훨씬 세부적 도메인인 '감성대화'의 특화를 추구해왔는데요. 이는 무슨 질문이든 똑똑하게 답하는 AI보다, 실제 친구와 대화하듯 자연스러운 느낌의 인격적 AI 구현에 더욱 추구했다는 의미입니다.

제타 내 인기 캐릭터는 지난 6개월 간 발화 횟수가 1억회 이상에 달할 만큼 사용자들로부터 좋은 반응을 얻고 있다. [ⓒ 제타 앱 갈무리]
제타 내 인기 캐릭터는 지난 6개월 간 발화 횟수가 1억회 이상에 달할 만큼 사용자들로부터 좋은 반응을 얻고 있다. [ⓒ 제타 앱 갈무리]

이런 AI 모델을 만들기 위해 스캐터랩은 지난 수년 동안 '감성 대화'에 영향을 미치는 온갖 학습 데이터를 누구보다 깊이 있고 전문적으로 연구해 왔습니다. 또한 그 데이터셋을 가장 효율적으로 활용하는 SLM 모델도 최적화해왔죠. 한마디로, 감성 AI 대화라는 도메인으로 한정하면 현시점 챗GPT를 비롯한 어떤 회사의 모델도 스캐터랩 모델보다 성능과 가성비가 좋을 수 없다는 이야기입니다. 무엇보다 이는 다른 AI 회사가 다른 AI 서비스 영역에서 경쟁하더라도 동일하게 적용될 공식입니다.

이런 관점에서 SLM 비즈니스는 '누가누가 더 전문적이냐', '그 전문성을 어떤 노하우로 확보할 거냐'가 중요합니다. '누가 얼마나 더 많이 정확하게 답할 수 있느냐'를 겨루는 LLM과는 확실히 다른 결을 갖고 있지요. 또한 만약 그렇게 자신만의 특화된 제품 분야, 그 분야 사용자들의 수요까지 파악했다면, 남은 과제는 이제 성능과 비용을 한계까지 제고하는 겁니다.

이 과정은 끝이 없습니다. 수익성과 직결되니 어쩔 수 없죠. 하지만 스캐터랩만 해도 초기보다 지금 비용이 절반 수준밖에 안 됩니다. 지금 제타에서는 엄청난 대화 트래픽이 오가지만 무료 요금제에 노출되는 광고만으로도 이익이 남는 수준이죠. 동시에 성능도 놓치지 않았다는 자부심이 있습니다. 실제로 올해는 모 엔터테인먼트 기업이 "제타가 재미 측면에서 GPT-4o보다 낫다"며 활용 가능성을 타진해 함께 협업해본 사례도 있었고요.

SLM 비즈니스 우선순위는 모델? No!

제가 SLM 기반 AI 서비스 사업을 하며 깨달은 또 하나의 핵심 노하우는 '우선순위'에 관한 것입니다. 많은 이가 실수하는 점이 AI 비즈니스를 한다고 하면 보통 모델부터 시작하는 건데, 그건 잘못된 방법이고 불필요합니다. 앞서 '제품 특화'가 중요하다고 말했듯, 지금은 비즈니스의 출발도 무조건 제품이어야 합니다. 과거는 성능 좋은 오픈소스 AI 모델이 없어서 어쩔 수 없이 모델부터 시작했죠. 지금은 오픈소스 중에도 고성능 파운데이션 모델이 많습니다. 따라서 이것들을 가지고도 완벽하지 않지만 구현하고자 하는 제품을 충분히 테스트 가능한 수준까지 활용할 수 있습니다.

결국 LLM의 범용성을 포기하는 대신, 우리는 사람들이 뭘 원하고 그것을 어떻게 잘 쓸 수 있을지 제품단에서부터 고민하는 과정이 굉장히 중요합니다. 그렇게 초기 테스트에서 상용화의 희망이 보인다면 그때 모델 파인튜닝을 한다든지 고도화를 해야하는 시점이고, 나아가 제품이 좋아지면 자연히 좋은 데이터가 모여 다시 고도화되는 선순환 기회도 따라옵니다.

더불어 요즘 AI 캐즘에 대한 이야기가 많습니다. 어쩔 수 없이 투자사도, 사용자도 AI에 대한 환상을 버리고 PoC(개념검증) 수준을 넘어 누가 얼마나 실용적이고 수익성 있는 AI를 만들 수 있느냐가 중요해졌습니다. 계속 강조하지만 이런 시기에 AI 비즈니스에 뛰어든다면 누구보다 AI를 담백하게 힘을 빼고 보되, 사람들은 정말 어떤 서비스를 쓸까라는 본질적 관점으로 접근하는 것이 경쟁력을 만든다고 확실히 말씀드릴 수 있습니다.

디지털데일리 네이버 메인추가
x