#Tech

[검색서비스] 네이버 검색의 C-Rank 알고리즘

100호랭 2022. 11. 23. 18:53

오늘도 아무 생각없이 네이버 검색하다가 불현듯이 호기심이 발동했다.

네이버에서 검색을 하면 어떤 알고리즘으로 블로그 글을 추천해줄까?

 

그 중 네이버 검색 알고리즘 중 하나인 C-Rank에 대해 간단하게 알아봤다.

 

 

1. 검색모델 : 검색 이용자의 니즈 충족을 위한다.

  • '검색 모델'이란 시스템이 문서를 평가하기 위해 검색 이용자가 찾고자 하는 문서와 그렇지 않은 문서의 표본을 구성한 것이다.
  • 만약 '김치'를 검색했으면 알고리즘을 바탕으로 일상적 내용(일기)보다는 레시피 관련 내용이 나오는 것이다. 
  • 그리고 시의성에 따라 결과가 달라진다. 만약 김치에 대한 논란이 발생한 경우 레시피보다 해당 뉴스가 먼저 나오는 경우가 생길 것이다.

 

2. C-Rank : 

  • 'C-Rank'란 네이버 블로그 신뢰도 평가 알고리즘이다.
  • 아래 3가지를 바탕으로 블로그(크리에이터)를 계산한다.
    1. 맥락 : 주제별 관심사의 집중도
    2. 내용 : 생산되는 정보의 퀄리티
    3. 연결된 소비/생산 : 생산된 콘텐츠는 어떤 연쇄반응을 보이며 소비/생산되는 지 파악
  • 만약 지속적으로 동일한 맥락으로 양질의 콘텐츠를 발행한 블로그는 우선 추천된다는 것이다.
    '비즈니스/경제' 주제의 블로그이면서 '맛집' 주제의 글만 발행한다면 저품질 블로그가 된다.
  • 또한 일반 블로거들 대상의 대가성 홍보글이 많아지고 있다. 그래서 블로그 신뢰도를 평가함으로써 홍보 글 노출을 줄이려 하고 있다.

<C-Rank 알고리즘> 출처:&nbsp;NAVER Search & Tech

  • 아래와 같은 데이터를 참고한다고 한다. 그리고 항목은 지속적으로 업데이트 되고 있다.

<블로그 C-Rank 알고리즘에서 참고하는 데이터>&nbsp;출처:&nbsp;NAVER Search & Tech

 

그러니까 상단에 보여주는 정보는 대략적으로 (이외에도 다른 것도 추가되었겠지만)...

양질의 글이어야하고

검색된 단어의 주제를 지속적으로 써온 블로그여야하고

해당 기간/실시간으로 사람들이 많이 보는 정보였던 것이다.

 

아래 블로그는 검색 관련된 재미있는 정보가 많으니 자주 들어가봐야겠다.

 

출처: NAVER Search & Tech

 

주제별 출처의 신뢰도와 인기도를 반영하는 C-Rank 알고리즘

지난 포스트에서는 흔히 이야기하는 '최적화 블로그'와 '저품질 블로그'의 개념이 어떻게 시작되었는지 유...

blog.naver.com