'맛집'·'여행' 관련 UGC 문서 기계학습해 인기 토픽을 자동 추출

[테크월드=양대규 기자] 블로그, 카페, 지식iN 등 다양한 내외부 UGC(User Generated Contents)문서의 검색 랭킹을 결정하는 네이버 ‘C(Creator)-Rank’ 알고리듬이 문서의 출처뿐만 아니라, 검색 주제에 따른 사용자 패턴까지 분석한다.

2015년부터 적용된 C-Rank는 문서의 출처(Creator)에 대한 신뢰도와 인기도에 기반을 둔 알고리듬이다. 이 알고리듬은 오랜 기간 동안 믿을 수 있는 문서를 지속적으로 만들어 왔는지의 여부를 주요 랭킹 요소로 반영한다. 

이번 개편을 통해 C-Rank 알고리듬에 검색 주제별로 사용자가 UGC문서를 소비하는 방식을 분석한 랭킹 요소가 새롭게 추가됐다. 먼저 '맛집'과 '여행' 모바일 검색에 적용했다. 이미지 중심의 문서를 빠르게 소비하는 '맛집' 주제 관련 사용 패턴이나 하루 단위로 소비되는 '여행' 주제 관련 사용 패턴 등을 랭킹 요소로 개발하여 알고리듬에 반영하는 식이다.

네이버 UGC 검색 박찬훈 리더는 “사용자들이 가장 많이 이용하는 ‘맛집’과 ‘여행’에 우선 집중해 개선을 시작하고, 더욱 다양한 주제에서 신뢰할 수 있는 정보를 잘 보여줄 수 있도록 C-Rank 알고리듬을 연구해나갈 예정”이라며, “문서의 출처에 대한 신뢰도를 중요시하는 C-Rank의 기본 원칙하에, 고도화를 위한 다양한 프로젝트가 진행될 것”이라고 말했다.

네이버는 수시로 변화하는 맛집과 여행 검색에 대한 사용자들의 니즈와 관심사를 한 눈에 파악할 수 있도록, 각 주제에 대한 UGC 문서에서 많이 언급된 토픽을 기계학습을 통한 그룹화, 계층화 기술로 학습해, 인기 토픽을 자동 추출·랭킹화해 제공한다.

또한, 네이버는 효율적이고 편리한 정보 탐색 환경 지원을 위해, 각 주제의 특징을 살린 보기 옵션을 적용했다. 맛집 검색은 ▲다양한 이미지 결과를 한 눈에 보여주는 ‘포토’ 옵션과 ▲이미지, 음식점명, 주메뉴 정보를 함께 확인할 수 있는 ‘글감‘ 옵션을 추가했다. 여행 검색은 ▲UGC 결과를 매일 업데이트해 제공하는 ‘데일리’ 옵션과 ▲‘리뷰’와 ‘여행가이드’를 통합 제공하는 영역에서 더욱 다양한 정보를 쉽게 얻을 수 있도록 개선했다.

이 기사를 공유합니다
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지