올해 20주년을 맞은 네이버가 상당 폭의 변화를 맞았다. 하루 3000만명이 드나드는 모바일 메인 개편은 여러 실험 끝에 적용이 이뤄졌고 동영상 중심의 콘텐츠 제작과 편집, 소비에 이르기까지 끊이지 않는 사용자경험을 위한 체질 개선에도 나선다. 이용자가 보는 앞단의 변화가 이 정도라면 개발 뒷단에선 보다 과감하고 치열한 고민이 필요하다.
<디지털데일리>는 네이버를 움직이는 기술 리더들을 마블 캐릭터에 빗대 ‘네이버 어벤저스’라 이름 붙이고 이들의 연속 인터뷰를 통해 국내 최대 인터넷 기업의 속 깊은 고민과 핵심 경쟁력의 원천을 짚어보고자 한다. ‘빅데이터 & AI 플랫폼’과 ‘검색엔진’에 이은 세 번째 네이버 어벤저스 팀은 ‘엣지 서버’ 엔지니어들이다. <편집자 주>
[디지털데일리 이대호기자] 네이버 검색 계층을 구성하는 수많은 서버 가운데 ‘엣지(edge) 서버’가 있다. 이용자의 검색 요청을 직접 받는 서버군을 말한다. 이 서버군을 운영하고 성능을 유지·개선하기 위한 기술이 ‘엣지 엔지니어링’이다.
엣지 엔지니어링은 프론트서비스, 프론트엔드 등 이름으로 네이버는 물론 구글과 페이스북 등 여러 인터넷 기업들이 오래전부터 쓴 기술이지만, 넷플릭스에서 처음 ‘엣지’라고 명명한 것으로 알려져 있다. 이용자와 검색 시스템의 경계나 가장자리에서 개발 작업이 이뤄진다는 의미가 담겨있다.
따지고 보면 엣지 엔지니어링은 한때 TV 드라마에서 유행한 ‘엣지있게’라는 말과 일맥상통한다. 당시 유행어는 ‘남들보다 뛰어나게’, ‘두드러지게’ 등의 의미로 쓰였다.
예상치 못한 이슈로 대규모 트래픽이 몰리면 이때 ‘엣지있는’ 엔지니어링이 필요하다. 이용자들의 다양한 요청을 받아 내부 시스템으로 연동 경로를 단일화하는 등 성능 유지를 위한 최적화된 돌파구인 ‘엣지’를 찾아야 하는 까닭이다.
현재 네이버 엣지 서버를 담당하는 개발자는 20여명. 이들 가운데 3명을 만났다. <사진> 왼쪽부터 프론트서비스플랫폼 조직을 이끌고 있는 이원진 개발 리더, 정지훈 엔지니어, 김선호 엔지니어다. 이들은 이용자와 맞닿아있는 네이버 검색의 최전방에서 오늘도 진짜 엣지를 찾는 엔지니어링을 이어가는 중이다.
◆위기 뒤엔 ‘엣지 서버’가 있다=엣지 서버는 위기를 겪으면서 더욱 발전한다. 2017년 11월15일 포항 지진이 그런 사례다.
이원진 리더는 “지진 당시에 평소 3~4배의 검색 요청 트래픽이 들어왔다”며 “갑작스런 트래픽의 변화가 있을 때에도 사용자들이 원활하게 사용할 수 있도록 하면서 그 이후 엣지 서버가 더욱 정교해졌다”고 회고했다.
이런 외부 이슈에 잘 대처하지 못하면 이용자들이 떠나기 마련이다. 구글도 예외는 아니다. 정지훈 엔지니어는 “(외신에 따르면) 구글이 0.5초 검색 결과가 느리게 나오도록 테스트를 해봤더니 20%의 이용자들이 떠나더라는 결과가 있다”고 전했다.
이밖에도 BBC 사이트 로드에 1초씩 더 걸릴 때마다 추가적으로 10%의 사용자들을 잃거나 구글 더블클릭(광고플랫폼)에서 페이지 로드에 3초가 넘어가면 53% 모바일 사이트 방문이 취소되는 등의 사례 분석이 제기된다.
◆검색 시스템 내부 요구도 중요=엣지 서버는 네이버 검색 사용자와 직접 맞닿은 ▲사용자향 GSLB(Global Software Load Balancer)과 내·외부 시스템 연동 및 보호를 위한 ▲API용 GSLB로 나뉜다.
이에 따른 엣지 서버의 주된 역할은 ▲검색 시스템의 내·외부 경계에서 트래픽이 몰릴 때도 동일한 성능을 유지하고 ▲다양한 형태의 외부 검색 요청에 맞도록 내부 시스템을 연결하는 것이라 할 수 있다.
검색 시스템의 복잡한 연동 경로를 단일화하는 등 엣지 서버가 제대로 구축돼야 신기술을 일관성 있게 전개할 수 있음은 물론이다. 이는 이용자들에게 최적의 웹 성능을 제공하기 위한 기반을 구축한다는 의미이기도 하다. 이를 감안하면 엣지 서버의 중요성은 아무리 강조해도 지나치지 않다. ◆최적의 웹 성능 어떻게 끌어낼까=김선호 엔지니어는 웹 성능 최적화를 위한 다양한 시도를 언급했다. 그는 “(보안이 강화된) HTTPS 프로토콜을 적용하면서도 추가적으로 최적화하는 등 여러 기술적인 부분들을 진행하고 있다”고 말했다.
HTTPS는 보안 강화 차원에서 서버와 패킷 전송이 한 번 더 이뤄지는 등 이전보다 느려질 수밖에 없는 전송규약(프로토콜)이다. 네이버는 이 같은 속도 지연을 상쇄하기 위해 HTTP/2의 전신이자 비공식 표준인 SPDY(스피디)를 구글을 제외하고 덩치 큰 국내 인터넷 업체 중에서 최초 적용하는 등 웹 성능 최적화를 위한 다양한 노력을 기울여왔다는 게 정 엔지니어의 설명이다.
그는 “밑단부터 갈아엎는 HTTP/3 프로토콜이 나와도 엣지 서버에서 적용하면 응용개발자들은 신경을 안 쓰고 자동화된다”며 차세대 프로토콜 대응에도 자신감을 보였다.
◆보수적 운영 속 실험 이어간다=엣지 서버가 먹통이 된다면 네이버 검색도 멈춘다. 조그만 실수에도 큰 장애가 불거질 수 있어 엣지 서버 개발자들은 보수적 운영을 우선시하게 된다.
그럼에도 3인의 개발자들은 “보수적 운영에만 매몰되지 않고 발전하는 플랫폼을 위한 노력을 이어가겠다”며 입장을 밝혔다.
최근 웹 환경을 보면 데이터센터 내 서버(backend) 내부 처리시간보다 엣지 서버로부터 사용자 브라우저까지의 도달 시간이 웹페이지 성능에 큰 비중을 차지하고 있다.
이를 개선하기 위해 네이버 엣지 서버 개발자들은 브라우저와 서버 간 연결 시간을 단축하는 TLS 1.3 적용부터 올해 표준화 예정인 UDP 기반의 HTTP/3 프로토콜도 살펴볼 예정이다. 검색 시스템 내부에 위협이 될 수 있는 트래픽의 격리를 위한 고도화와 성능을 해치지 않으면서 보안을 강화할 수 있는 부분도 고민한다.
이원진 개발 리더는 “5G (이동통신) 환경이 갖춰지고 단말기가 보급되면 검색 내에서 영상이나 움직이는 사진 파일 등의 데이터 사이즈도 커질 것으로 보고 엣지 서버를 통한 성능 최적화를 이뤄가겠다”고 힘줘 말했다.
김 엔지니어는 “엣지 서버와 브라우저 사이에서 (도달 시간이) 물리적 한계로 내려갈 수 없는 부분을 5G로 극복하게 되지 않을까”라며 기대감을 보였다. 정 엔지니어는 “압축 알고리즘을 보고 있다. 항상 실험하고 새로운 시도를 하겠다”고 덧붙였다.