네이버가 모바일 메인 개편에 이어 동영상 중심의 사용자경험을 위한 체질 개선, 창작자가 검색의 주인공이 되는 ‘인플루언서 검색’ 등 여러 굵직한 변화를 추진하고 있다. 이용자가 보는 앞단의 변화가 이 정도라면 개발 뒷단에선 보다 과감하고 치열한 고민이 필요하다.
<디지털데일리>는 네이버를 움직이는 기술 리더들을 마블 캐릭터에 빗대 ‘네이버 어벤저스’라 이름 붙이고 이들의 연속 인터뷰를 통해 국내 최대 인터넷 기업의 속 깊은 고민과 핵심 경쟁력의 원천을 짚어보고자 한다. ▲빅데이터 & AI 플랫폼 ▲검색엔진 ▲엣지서버 ▲SRE ▲데브옵스 ▲음성인식 ▲클로바더빙 ▲클린봇2.0에 이어 ▲에어스 AI 추천 개발진을 만났다. <편집자 주>
[디지털데일리 이대호기자] 오는 25일부터 사흘간 진행될 ‘데뷰(DEVIEW) 2020’ 개발자 컨퍼런스에서 2021년 네이버를 가늠할 수 있는 다양한 변화가 공개된다. 준비된 전체 세션만 81개. 역대 최대 규모다. 그중 하나의 세션이 ‘뭐볼까’다. 네이버가 마이(MY)구독 추천 서비스를 뭐볼까로 개편한다.
데뷰2020 첫날 세션에 뭐볼까 주요 개발진이 나선다. 네이버 에어스(AiRS)에서 인공지능 추천(AI recommendation) 팀을 이끄는 김창봉 리더<사진 왼쪽부터>와 김도희 테크리더, 이태영 연구원이 ‘네이버 AiRS 인공지능 콘텐츠 추천의 진화’를 주제로 발표한다.
뭐볼까는 ‘많은 사용자들이 검색과 쇼핑, 뉴스를 보기 위해 네이버를 방문하고 있지만, 그 이외에는 심심할 때 주로 어떤 콘텐츠를 보고 있을까’라는 질문에서 출발한 서비스다. 네이버 로그인 방문자들이 가볍게 접근할 수 있는 콘텐츠와 내 관심사 기반으로 콘텐츠를 추천한다. 비(非)로그인 기반에선 인기 문서 위주로 보여준다.
김창봉 리더는 최근 성남시 네이버 그린팩토리에서 진행한 인터뷰에서 “너무 심각하지 않게 무엇을 볼 수 있을까’, ‘뭐 재미있는 거 없을까’에서 뭐볼까가 출발했다”며 “네이버엔 ‘뿜’이라는 유머 콘텐츠도 있고 20여년 된 카페 서비스에도 유머 게시판이 활성화돼 있다. 카페 유머도 노출하게 될 것”이라고 개편 취지와 방향성을 설명했다.
◆네이버 앱 전면에 나오는 ‘뭐볼까’
네이버 앱이 또 한번 진화를 앞뒀다. 내년 초 개편이 예상된다. 이때 마이구독이 뭐볼까로 바뀐다. 가장 큰 변화는 네이버 앱 전면에 뭐볼까가 나온다는 것이다. 마이구독 내에서 여러 변화에 있던 것에 비해 보다 무게감 있는 시도다. 그만큼 네이버가 뭐볼까에 기대하는 바가 적지 않다고 볼 수 있다.
김 리더는 “네이버에 블로그도 포스트도 있고 오디오클립도 있고 많은 서비스가 있는데, 제각각 앱에서 설정해서 봐야 한다. 일일이 주제판을 설정하기도 번거롭다”며 “관심있는 여러 주제의 콘텐츠를 한곳에서 보여주는 추천 서비스가 뭐볼까”라고 정의했다.
네이버엔 방대한 카테고리의 서비스가 있다. 예를 들면 블로그, 카페, 네이버TV, 웹툰, 브이라이브 등에서 각각의 이용자가 원하면서도 재미있어할 만한 콘텐츠를 추천해야 한다. 개발진이 난관을 맞닥뜨린 부분이다. 유튜브와 넷플릭스, 페이스북, 인스타그램 내 특화된 추천보다 기술 구현 난도는 물론 사용자환경(UI) 측면에서도 고민이 많았을 것이라 볼 수 있다.
김 리더는 개편 과정에 대해 “추천 로직도 중요했지만, 문서도 전달하고 사진도 동영상도 자동플레이가 돼야 하는 등 UI(사용자환경) 측면에서도 많이 고민했다”며 “타이틀을 한 줄로 노출하니 CTR(노출대비 클릭수)이 확 떨어져 두 줄로 노출하고 섬네일 이미지도 단순화해서 크게 1개로 하다 작게 반씩 나누는 등 피드형에서 그리드형으로 테스트하면서 최적의 UI를 찾는 과정에 있다”고 현황을 전했다.
◆어떻게 추천해줄까
이용자가 뭘 좋아하는지는 각종 검색 이력으로 파악할 수 있다. 검색 이력이 많을수록 ‘이용자 콘텍스트(context·맥락)’가 쌓여간다고 말한다. 우선 인공지능이 이용자를 파악하기 위한 콘텍스트 학습셋이 필요했다.
개발진은 30여개 주제판에 게재된 문서들을 정답(Positive Sample)으로, 아닌 문서를 부정적으로(Negative) 보는 주제 분류기를 만들었다. 문서가 특정 주제에 속하는 여부만 판별하는 분류기도 갖췄다. 추천 모델링의 문제 정의는 어떤 순서(Ranker)로 제공할지, 어떤 취향(User modeling)인지, 볼만한 콘텐츠(Retriever)가 있는지를 주축으로 접근했다.
이태영 연구원은 “하나의 모델을 통해 적합한 문서를 골라주는 리트리버(Retriever)를 10여개 갖춰 추천 후보문서를 만들고 한꺼번에 조합해서 파이널 랭킹을 내고 피드형태로 추천한다”고 핵심을 설명했다. 이어서 “앙상블(콜라보레이티브 필터링, 콘텐츠베이스드 필터링 등을 조합한) 모델로 테슬라를 많이 검색한다면 자동차 주제문서 중에서도 전기차를 추천해주는 식”이라고 덧붙였다.
네이버는 리트리버 고도화를 위해 ‘콘텍스추얼 밴딧(Contextual Bandit)’을 도입했다. 쉽게 말하면 ‘적극적인 이용자 취향 탐색’ 모델이다. 이용자를 보다 깊숙이 파악하려는 시도다. 딥러닝 기반으로 로그가 쌓일수록 정확도가 높아진다. 실제로도 적용 이후 이용자 반응 지표가 올라갔다.
김창봉 리더는 콘텍스추얼 밴딧에 대해 “새로 생성된 문서 중에서 랜덤성을 섞어서 주고 실제 클릭하게 되면 그런 종류의 문서를 탐색 추천하는 새로운 모델 중 하나”라고 풀이했다.
김도희 테크리더는 “리트리버는 개별 고도화 문제도 있고 새로운 리트리버를 도입해 (추천후보생성) 성능을 높일 수도 있다”고 부연했다. 또 “로그인 기반이면 개인화가 다 다르게 적용된다”며 “실시간으로 노출해 클릭로그를 수집해 봤던 것은 바로 빼주고 안 봤다면 (추천) 랭킹을 올려주는 등 수천만명과 인터랙션(상호작용)하고 있다”고 말했다.
◆창작자 발굴하는 기술의 집합체
김도희 테크리더는 뭐볼까에 들어간 네이버가 자신할만한 기술을 꼽아달라는 질문에 “많은 분이 만들어낸 집합체로 너무 다양한 기술이 들어가있다”며 “딱 하나 짚어서 말하기가 쉽지 않다”고 답했다.
김 테크리더는 “개인적으로 보면 뭐볼까는 기존의 네이버 검색으로 찾거나 주제판에서 보는 것을 편하게 자동으로 올려줘 소비하게 해준다”며 “콘텐츠를 생산하는 입장에서 기존 메인판의 소수의 창작자뿐 아니라 보다 많은 창작자의 콘텐츠를 발굴해서 추천 풀에 집어넣고 소비할 수 있게 하는 플랫폼이라는 의미가 있다”고 강조했다.
김창봉 리더는 “넷플릭스, 유튜브뿐 아니라 네이버에도 오리지널 콘텐츠인 포스트 등이 많이 숨겨져 있다”며 “주제와 관심사가 다양한 넓은 스펙트럼의 콘텐츠를 하나의 필드로 조합해서 보여주는 게 허들이 있어 그동안 활성화되지 못했다”고 과거 시도를 되짚었다.
이어서 김 리더는 “뭐볼까(현재 마이구독)는 우상향으로 활성화되고 있다. 네이버의 오리지널 콘텐츠를 배달하는 서비스로 봐달라”며 미소를 보였다.
◆추천 장인들이 모인 ‘뭐볼까’팀…인재 뽑아요
뭐볼까엔 네이버와 일본 라인 뉴스, 웹툰, 통합 콘텐츠 등 다양한 영역에서 추천과 관련 기술을 경험한 인재들이 매달려있다. 김 리더도 그중 한 명이다. 코어 개발자만 20여명. 협업 부서와 UI, 전체 서비스 기획 등을 합하면 인원은 더 늘어난다.
이번 인터뷰에도 네이버 여느 개발팀을 만날 때 빠지지 않는 얘기가 나왔다. ‘인재 수급’이다. 더 많은 추천과 고도화된 기술을 다루려면 개발자가 필요하다는 것이다. 이태영 연구원은 “사람들이 무엇을 좋아할지, 어떤 가치를 줄지 고민하는 인재면 좋겠다”고 “내부 분위기도 좋다. 추천 업무 외에 북극곰 살리기 캠페인, 테드(TED) 느낌으로 재테크 노하우를 공유하는 등 다양한 활동도 한다”고 전했다.
김 리더는 “일본 대만 태국 등지의 라인 계열사 콘텐츠 추천도 많이 진행하고 있다”며 “각 도메인마다 국내에서 경험할 수 있는 제일 많은 종류의 데이터를 추천한다. 추천에 대해 경험을 쌓고 전문가가 되고 싶다면 저희 쪽으로 와주십사 한다”고 힘줘 말했다.