PageRank算法研究现状与展望
摘要为了能使用户在Inte rnet海量的信息中准确的找到需要的资源 Web挖掘这项新技术出现了。而PageRank算法就是在这种背景下产生的。它是基于Web超链接结构分析算法最成功的代表之一 已经成功的运用在了实际系统中。但同时PageRank算法也有一定的局限性和不足之处。本文讨论了PageRank算法的背景、算法原理及其主要的缺陷。
关键词 P age Rank算法 Web结构 超链接
1.引言
随着Inter ne t的飞速发展Web上的信息量也以惊人的速度增长人们也越来越多的在Interne t上发布和获取信息万维网已经成为资料共享和信息交流的最大平台。那么一个很突出的问题就出现了如何在互联网中海量的资源中迅速、准确的找到自己所需的信息而Web挖掘这项新技术就是为了解决这一难题的。Web挖掘技术是数据挖掘技术和Inte rnet技术的结合是当今计算机研究领域的新热点。
2.经典的Web结构分析算法
传统的互联网应用技术大多是基于文档内容的业界对互联网搜索功能的理解是某个关键词在一个文档中出现的频率越高该文档在搜索结果中的排列位置就要越显著。这种做法都是忽略了互联网包含而传统数据环境没有的另一种丰富信息互联网的超链接拓扑结构。所谓的超链接就是指从一个网页指向另一个目标的连接关系。另一个目标可以是其它网页也可以是本网页其它位置。假设网页A有一条超链接指向网页B那么我们就认为网页A的创建者判定网页B包含了有价值的信息。因此充分利用互联网间的链接结构信息对互联网的搜索具有重大意义。
基于超链接的分析方法 Page Rank、HI TS、 SALSA等算法应运而生。其中不少算法已经在实际系统中使用并取得了良好的效果而PageRank算法就是其中应用最广泛的一个。
3.PageRank算法原理
PageRank算法是Google创始人Sergey Brin和Lwarence Page于1998年提出来的它是基于Web超链接结构分析的算法中最成功的代表也是评鉴网页权威性的重要工具。
PageRank算法借鉴了传统的情报检索理论中的引文分析方法。核心思想就是 当网页A存在一条超链接指向网页B时就理解为“网页A向网页B投了一票”网页B的重要级数就得到增加。PageRank算法还认为网页B的重要性不
中午的时候有网友联系提到自己前几天看到Namecheap商家开学季促销活动期间有域名促销活动的,于是就信注册NC账户注册域名的。但是今天登录居然无法登录,这个问题比较困恼是不是商家跑路等问题。Namecheap商家跑路的可能性不大,前几天我还在他们家转移域名的。这里简单的记录我帮助他解决如何重新登录Namecheap商家的问题。1、检查邮件让他检查邮件是不是有官方的邮件提示。比如我们新注册账户是需...
OneTechCloud(易科云)是一家主打CN2等高端线路的VPS主机商家,成立于2019年,提供的产品包括VPS主机和独立服务器租用等,数据中心可选美国洛杉矶、中国香港、日本等,有CN2 GIA线路、AS9929、高防、原生IP等。目前商家针对全场VPS主机提供月付9折,季付8折优惠码,优惠后香港VPS最低季付64元起(≈21.3元/月),美国洛杉矶CN2 GIA线路+20Gbps防御型VPS...
关于半月湾HMBCloud商家之前也有几篇那文章介绍过这个商家的产品,对于他们家的其他产品我都没有多加留意,而是对他们家的DC5机房很多人还是比较喜欢的,这个比我们有些比较熟悉的某商家DC6 DC9机房限时,而且半月湾HMBCloud商家是相对便宜的。关于半月湾DC5机房的方案选择和介绍:1、半月湾三网洛杉矶DC5 CN2 GIA同款DC6 DC9 1G内存 1TB流量 月$4.992、亲测选择半...