Discuz! Board

 Forgot Password
 Register now
Search
Hot Search: Activity Personals discuz
View: 1163|Reply: 0
Print Previous Topic Next Topic

PageRank 引用值:让网络秩序井然

[Copy Link]

1

Threads

1

Posts

5

Credits

Newbie Member

Rank: 1

Credits
5
Jump to the specified floor
Landlord
Posted at 2023-11-12 13:29:07 | Only Author Replies reward |Descending browser |Read mode
网页的重要性本质上取决于读者对感兴趣的主题、知识和态度的个人观点。然而,关于网页的相对重要性仍然有很多话要说。本文定义了PageRank,它客观、机械地评估网页,有效衡量人们感兴趣的内容和感兴趣的主题。 我们使用理想的随机网络爬虫作为参考来对 PageRank 进行基准测试。我们展示了如何有效计算大量页面的 PageRank。并且,我们展示了如何将 PageRank 应用于搜索和用户操作。 本内容是斯坦福大学1998年发表的PageRank文章的翻译。 1. 介绍和动机 万维网给信息提供带来了许多新的挑战。它相当大且异构。目前的计算显示,网页数量超过 1.5 亿个,并且这个数字在不到一年的时间内翻了一番。更重要的是,网页的范围从“乔今天午餐吃什么”到提供信息的报纸。除了这一主要挑战之外,网络搜索引擎还必须应对缺乏经验的用户和想要操纵搜索引擎排名功能的页面。

然而,与“普通”文档不同,万维网具有超文本结构,其中还包含重要的辅助信息,例如网站顶部文本中的链接结加销 香港 WhatsApp 号码列表 量并强化构和链接文本。在本文中,我们利用网络的链接结构来生成每个网页的全局“重要性”值。这种排名称为 PageRank,可帮助搜索引擎和用户快速了解万维网的巨大异质性。 1.1 网页的多样性 尽管已经有大量关于学术引文分析的文献,但网页和学术出版物之间存在一些重要的区别。与经过仔细审查的学术出版物不同,网页在没有任何质量控制或出版费的情况下激增。通过一个简单的程序,可以轻松地生成大量页面,人为地夸大页数和引用数。由于网络上包括以利润为导向的竞争对手企业家,因此尽管搜索引擎算法发生变化,策略也会随着时间的推移而变化。因此,针对网站可复制功能制定的策略也容易受到操纵。此外,学术论文都是定义明确的作品,在质量、引用以及目的方面大致相似。



与学术文章相比,网页在质量、用法、引用和长度方面的差异要大得多。随机存档的消息询问有关 IBM 计算机的晦涩问题,这与 IBM 主页有很大不同。就驾驶员分心而言,有关手机的研究文章和特定手机提供商的广告有很大不同。用户体验到的平均网页质量高于网页的平均质量。这是因为网页易于创建和发布,导致用户可能不想阅读的低质量网站。 有很多方法可以区分网页。在本文中,我们将特别关注一个——一种衡量网页整体相对重要性的方法。 1.2 页面排名 为了衡量网页的相对重要性,我们提出了一种称为PageRank的计算方法,它根据网络的总体结构对网页进行排名。PageRank 具有用于搜索、爬行和流量计算的应用程序。 第二部分给出了 PageRank 的数学定义并提供了一些直观的理由。在第 3 部分中,我们展示了如何有效计算 5.18 亿个超链接的 PageRank。为了测试 PageRank 服务在搜索中的使用,我们创建了一个名为 Google 的网络搜索引擎。

Reply

Use props Report

You need to log in before you can reply Login | Register now

This forum Credits Rules

Archiver|Mobile ver.|Darkroom|enbbs.makerpi3d.com

GMT+8, 2024-12-22 16:55 , Processed in 0.094129 second(s), 20 queries .

Powered by Discuz! X3 English ver.

© 2001-2013 Comsenz Inc.

Quick Reply Back to top Back to list