Yahoo’s Link-Based Spam Detection Patent Application 야후의 링크 - 기반의 스팸 탐지 특허 출원

Search Engine News May 7th, 2006 검색 엔진의 뉴스 2006년 5월 7일

In an effort to curb spam, TrustRank has been used as one of the factors in establishing rankings in search engines like Big G. 을위한 노력을 억제 스팸 메일, trustrank 사용되었습니다 순위를 수립하는 요인 중 하나로 큰 g. 같은 검색 엔진에

Now, Yahoo is joining in the game by using domain “Trust” as a ranking factor. 지금, 야후가 게임에 참여를 사용하여 도메인 "신뢰"를 순위를 계수합니다.

From the latest patent abstract by Yahoo : 에서 최신 특허 발췌하여 야후 :

A computer implemented method of ranking search hits in a search result set. 순위 검색 안타 방법을 구현하는 컴퓨터를 검색 결과 집합을합니다. The computer-implemented method includes receiving a query from a user and generating a list of hits related to the query, where each of the hits has a relevance to the query, where the hits have one or more boosting linked documents pointing to the hits, and where the boosting linked documents affect the relevance of the hits to the query. - 구현 방법을 포함하는 컴퓨터에서 수신하는 쿼리의 목록을 생성하는 사용자와 관련하여 안타 검색어, 각각의 위치에 대한 관련성이 안타는 쿼리, 어디에 하나 이상의 조회수가 링크된 문서 포인팅을 강화 안타 링크된 문서 및 향상에 영향을 어디에 대한 조회수가 검색어의 관련성을 파악합니다. The method associates a metric to each of at least a subset of the hits, the metric being representative of the number of boosting linked documents that point to each of at least a subset of the hits and which artificially inflate the relevance of the hits. 동료하는 방법을 각 통계의 하위 집합을 안타는 최소한의 수치가 향상 대표 링크된 문서의 개수는 최소한의 부분 집합을 각 해당 시점의 안타로 안타를 인위적으로 부풀려의 관련성을 파악합니다. The method then compares the metric, which is representative of the size of a spam farm pointing to the hit, with a threshold value, processes the list of hits to form a modified list based in part on the comparison, and transmits the modified list to the user. 이러한 통계를 비교하는 방법 다음은 스팸 메일의 크기를 대표하는 히트를 가리키는 농장으로 임계값, 프로세스의 목록을 업데이 트 조회수를 목록에 일부 기반을 형성하는 비교, 그리고 수정된 목록을 전송 해당 사용자합니다.

The patent provides some insight into the way it would identifying spam pages from search results, in conjunction with pagerank. 어떤 통찰력을 제공하는 방법의 특허 그것은 스팸 메일의 페이지를 식별 검색 결과 페이지와 함께합니다. The system sorts reputable pages from spam pages by using combining with input from humans reviewers who manually identify these reputable seed pages. 페이지에서 페이지를 신뢰할 수 종류의 시스템을 사용하여 스팸 메일로부터 입력 인간을 결합하여 이러한 평판 좋은 씨앗 리뷰 페이지에 who를 수동으로 식별합니다.

While link “trustability” acts as a fairly good indicator of site quality overall, it is still flawed as shown in the case of Expedia subdomains . 하는 동안 링크 "신뢰성"의 역할을 공정하게 좋은 지표의 사이트의 품질 전반적으로 그것은 아직도의 그림에 나타난 결함이 하위 도메인의 경우, Expedia합니다.

,

One Response to “Yahoo’s Link-Based Spam Detection Patent Application” 하나의 대응책을 "야후의 링크 - 기반의 스팸 탐지 특허 출원"

  1. Update: Big G has cleaned up its results for Buy Viagra, Buy Cialis, and other keywords since then. 업데이트 : 큰 그램은 그 결과를 청소 비아그라 구매, 구매 cialis, 그리고 그때부터 다른 키워드합니다. The results seen in the screen capture no longer show up in the search results. 그 결과를 보는 화면 캡처가 검색 결과에 나타나지 않습니다.

Leave a Reply 남길 회신

You must be logged in to post a comment. 로그인해야합니다 의견을 게시합니다.