#Tech
[검색서비스] 네이버 검색의 C-Rank 알고리즘
100호랭
2022. 11. 23. 18:53
오늘도 아무 생각없이 네이버 검색하다가 불현듯이 호기심이 발동했다.
네이버에서 검색을 하면 어떤 알고리즘으로 블로그 글을 추천해줄까?
그 중 네이버 검색 알고리즘 중 하나인 C-Rank에 대해 간단하게 알아봤다.
1. 검색모델 : 검색 이용자의 니즈 충족을 위한다.
- '검색 모델'이란 시스템이 문서를 평가하기 위해 검색 이용자가 찾고자 하는 문서와 그렇지 않은 문서의 표본을 구성한 것이다.
- 만약 '김치'를 검색했으면 알고리즘을 바탕으로 일상적 내용(일기)보다는 레시피 관련 내용이 나오는 것이다.
- 그리고 시의성에 따라 결과가 달라진다. 만약 김치에 대한 논란이 발생한 경우 레시피보다 해당 뉴스가 먼저 나오는 경우가 생길 것이다.
2. C-Rank :
- 'C-Rank'란 네이버 블로그 신뢰도 평가 알고리즘이다.
- 아래 3가지를 바탕으로 블로그(크리에이터)를 계산한다.
1. 맥락 : 주제별 관심사의 집중도
2. 내용 : 생산되는 정보의 퀄리티
3. 연결된 소비/생산 : 생산된 콘텐츠는 어떤 연쇄반응을 보이며 소비/생산되는 지 파악 - 만약 지속적으로 동일한 맥락으로 양질의 콘텐츠를 발행한 블로그는 우선 추천된다는 것이다.
'비즈니스/경제' 주제의 블로그이면서 '맛집' 주제의 글만 발행한다면 저품질 블로그가 된다. - 또한 일반 블로거들 대상의 대가성 홍보글이 많아지고 있다. 그래서 블로그 신뢰도를 평가함으로써 홍보 글 노출을 줄이려 하고 있다.
- 아래와 같은 데이터를 참고한다고 한다. 그리고 항목은 지속적으로 업데이트 되고 있다.
그러니까 상단에 보여주는 정보는 대략적으로 (이외에도 다른 것도 추가되었겠지만)...
양질의 글이어야하고
검색된 단어의 주제를 지속적으로 써온 블로그여야하고
해당 기간/실시간으로 사람들이 많이 보는 정보였던 것이다.
아래 블로그는 검색 관련된 재미있는 정보가 많으니 자주 들어가봐야겠다.
주제별 출처의 신뢰도와 인기도를 반영하는 C-Rank 알고리즘
지난 포스트에서는 흔히 이야기하는 '최적화 블로그'와 '저품질 블로그'의 개념이 어떻게 시작되었는지 유...
blog.naver.com