搜索引擎的工作原理:抓取、索引和排名
搜索引擎是回答机器。它们的存在是为了发现、理解和组织互联网的内容,以便为搜索者提出的问题提供最相关的结果。
为了显示在搜索结果中,您的内容首先需要对搜索引擎可见。这可以说是 SEO 难题中最重要的部分:如果找不到您的网站,您将永远无法出现在 SERP(搜索引擎结果页面)中。
一:搜索引擎是如何工作的?
搜索引擎通过三个主要功能工作:
爬行:在 Internet 上搜索内容,查看他们找到的每个 URL 的代码/内容。
索引:存储和组织在爬取过程中发现的内容。一旦页面在索引中,它就会在运行中显示为相关查询的结果。
排名:提供最能回答搜索者查询的内容,这意味着结果按最相关到最不相关排序。
二:什么是搜索引擎爬行?
爬行是搜索引擎派出一组机器人(称为爬虫或蜘蛛)来寻找新的和更新的内容的发现过程。内容可能会有所不同——它可以是网页、图像、视频、PDF 等——但无论格式如何,内容都是通过链接发现的。
Googlebot 从获取几个网页开始,然后按照这些网页上的链接查找新的 URL。通过沿着这条链接路径跳跃,爬虫能够找到新内容并将其添加到的索引中——一个包含已发现 URL 的庞大数据库——稍后当搜索者正在寻找该 URL 上的内容是很适合。
三、什么是搜索引擎索引
搜索引擎处理和存储他们在索引中找到的信息,这是一个包含他们发现的所有内容的巨大数据库,并且认为足以为搜索者提供服务。
四、搜索引擎排名
当有人执行搜索时,搜索引擎会在他们的索引中搜索高度相关的内容,然后对这些内容进行排序,以期解决搜索者的查询。这种按相关性对搜索结果进行排序称为排名。一般来说,您可以假设网站排名越高,搜索引擎认为该网站与查询越相关。
可以阻止搜索引擎爬虫访问您网站的部分或全部内容,或者指示搜索引擎避免将某些页面存储在其索引中。虽然这样做可能是有原因的,但如果您希望搜索者找到您的内容,您必须首先确保爬虫可以访问它并且可以索引。否则,它就像隐形一样好。
问题一:爬行:搜索引擎能找到你的网页吗
正如您刚刚了解到的,确保您的网站被抓取并编入索引是出现在 SERP 中的先决条件。如果您已经有一个网站,最好先查看索引中有多少页面。这将对 Google 是否正在抓取并找到您想要的所有页面以及您不想要的页面产生一些深刻的见解。
检查索引页面的一种方法是“site:www.oseo.cn”,这是一种高级搜索运算符。前往谷歌并在搜索栏中输入“site:yourdomain.com”。这将返回 Google 在其索引中针对指定站点的结果:
Google 显示的结果数量(请参阅上面的“关于 XX 个结果”)并不准确,但它确实让您清楚地了解哪些页面已在您的网站上编入索引,以及它们当前在搜索结果中的显示方式。
如果您没有出现在搜索结果中的任何位置,可能有以下几个原因:
您的网站是全新的,尚未被抓取。
您的网站未链接到任何外部网站。
您网站的导航使机器人很难有效地抓取它。
您的网站包含一些称为爬虫指令的基本代码,这些代码会阻止搜索引擎。
您的网站因垃圾邮件策略而受到 Google 的处罚。
告诉搜索引擎如何抓取您的网站
如果您使用 Google Search Console 或“site:domain.com”高级搜索运算符,发现索引中缺少某些重要页面和/或某些不重要的页面被错误索引,则可以进行一些优化实施以更好地指导 Googlebot 如何抓取您的网络内容。告诉搜索引擎如何抓取您的网站可以让您更好地控制索引中的内容。
大多数人都在考虑确保 Google 可以找到他们的重要页面,但很容易忘记您可能不希望 Googlebot 找到某些页面。这些可能包括内容稀少的旧 URL、重复 URL(例如电子商务的排序和过滤参数)、特殊促销代码页面、登台或测试页面等。
要引导 Googlebot 离开您网站的某些页面和部分,请使用 robots.txt。
机器人.txt
Robots.txt 文件位于网站的根目录(例如 www.oseo.com/robots.txt),并建议您的网站搜索引擎的哪些部分应该和不应该抓取,以及它们抓取您网站的速度,通过特定的 robots.txt 指令。
Googlebot 如何处理 robots.txt 文件
如果 Googlebot 找不到某个网站的 robots.txt 文件,它会继续抓取该网站。
如果 Googlebot 发现某个网站的 robots.txt 文件,它通常会遵守建议并继续抓取该网站。
如果 Googlebot 在尝试访问网站的 robots.txt 文件时遇到错误并且无法确定该文件是否存在,它将不会抓取该网站。
优化抓取预算!
抓取预算是 Googlebot 在离开之前将在您的网站上抓取的平均网址数,因此抓取预算优化可确保 Googlebot 不会浪费时间抓取您不重要的页面,而可能会忽略您的重要页面。抓取预算在拥有数万个 URL 的超大型网站上最为重要,但阻止抓取工具访问您绝对不关心的内容绝不是一个坏主意。只需确保不要阻止爬虫访问您添加了其他指令的页面,例如规范或 noindex 标记。如果 Googlebot 在某个页面上被阻止,它将无法看到该页面上的说明。
并非所有网络机器人都遵循 robots.txt。不怀好意的人(例如,电子邮件地址抓取工具)构建不遵循此协议的机器人。事实上,一些不良行为者使用 robots.txt 文件来查找您的私人内容所在的位置。尽管阻止爬虫访问诸如登录和管理页面等私人页面似乎是合乎逻辑的,这样它们就不会出现在索引中,但将这些 URL 的位置放在可公开访问的 robots.txt 文件中也意味着有恶意的人可以更轻松地找到它们。最好对这些页面进行 NoIndex 并将它们关在登录表单后面,而不是将它们放在您的 robots.txt 文件中。
在 GSC 中定义 URL 参数
一些网站(最常见于电子商务)通过将某些参数附加到 URL 来使相同的内容在多个不同的 URL 上可用。如果您曾经在网上购物,您可能已经通过过滤器缩小了搜索范围。例如,您可以在亚马逊上搜索“鞋子”,然后按尺码、颜色和款式细化您的搜索。每次优化时,URL 都会略有变化:
Google 如何知道向搜索者提供哪个版本的 URL?Google 在自己确定代表 URL 方面做得很好,但是您可以使用 Google Search Console 中的 URL 参数功能来告诉 Google 您希望他们如何处理您的页面。如果您使用此功能告诉 Googlebot“不使用____参数抓取 URL”,那么您实际上是在要求对 Googlebot 隐藏此内容,这可能会导致这些页面从搜索结果中删除。如果这些参数创建重复页面,这就是您想要的,但如果您希望这些页面被索引,则不理想。
爬虫能找到你所有的重要内容吗?
现在您已经了解了一些确保搜索引擎抓取工具远离您的不重要内容的策略,让我们了解可以帮助 Googlebot 找到您的重要页面的优化。
有时,搜索引擎将能够通过抓取找到您网站的某些部分,但其他页面或部分可能由于某种原因而被遮挡。确保搜索引擎能够发现您想要索引的所有内容,而不仅仅是您的主页,这一点很重要。
问问自己这个问题:机器人可以爬过你的网站,而不仅仅是爬到它上面吗?
您的内容是否隐藏在登录表单后面?
如果您要求用户在访问某些内容之前登录、填写表格或回答调查,搜索引擎将不会看到这些受保护的页面。爬虫肯定不会登录。
您是否依赖搜索表单?
机器人不能使用搜索表单。有些人认为,如果他们在他们的网站上放置一个搜索框,搜索引擎将能够找到访问者搜索的所有内容。
文本是否隐藏在非文本内容中?
不应使用非文本媒体形式(图像、视频、GIF 等)来显示您希望被索引的文本。虽然搜索引擎在识别图像方面做得越来越好,但不能保证他们能够阅读和理解它。最好在网页的 <HTML> 标记中添加文本。
搜索引擎可以跟随您的网站导航吗?
正如爬虫需要通过来自其他站点的链接来发现您的站点一样,它也需要您自己站点上的链接路径来引导它从一个页面到另一个页面。如果您有一个希望搜索引擎找到的页面,但它没有与任何其他页面链接,那么它就像不可见一样好。许多网站都犯了一个严重错误,即以搜索引擎无法访问的方式构建导航结构,从而阻碍了它们在搜索结果中列出的能力。
常见的导航错误可能会阻止爬虫查看您的所有网站:
拥有显示与桌面导航不同结果的移动导航
菜单项不在 HTML 中的任何类型的导航,例如启用 JavaScript 的导航。谷歌在抓取和理解 Javascript 方面做得更好,但它仍然不是一个完美的过程。确保某些内容被 Google 找到、理解和索引的更可靠的方法是将其放入 HTML 中。
个性化,或向特定类型的访问者显示独特的导航而不是其他人,可能看起来像是在隐藏搜索引擎爬虫
忘记通过导航链接到您网站上的主页 - 请记住,链接是爬虫跟踪到新页面的路径!
你有干净的信息架构吗?
信息架构是在网站上组织和标记内容以提高用户效率和可查找性的实践。最好的信息架构是直观的,这意味着用户不必费力地思考就可以浏览您的网站或找到一些东西。
你在使用站点地图吗?
站点地图就像它听起来的样子:您网站上的 URL 列表,爬虫可以使用这些 URL 来发现和索引您的内容。确保 Google 找到您的最高优先级页面的最简单方法之一是创建一个符合 Google 标准的文件并通过 Google Search Console 提交。虽然提交站点地图并不能取代对良好站点导航的需求,但它肯定可以帮助爬虫找到通往所有重要页面的路径。
确保您只包含您希望被搜索引擎编入索引的 URL,并确保为爬虫提供一致的方向。例如,如果您已通过 robots.txt 阻止该 URL,则不要在站点地图中包含该 URL,或者在您的站点地图中包含重复的 URL,而不是首选的规范版本
爬虫在尝试访问您的 URL 时是否会出错?
在抓取您网站上的 URL 的过程中,抓取工具可能会遇到错误。您可以转到 Google Search Console 的“抓取错误”报告来检测可能发生这种情况的 URL - 此报告将向您显示服务器错误和未找到的错误。服务器日志文件也可以向您显示这一点,以及其他信息的宝库,例如爬网频率,但由于访问和剖析服务器日志文件是一种更高级的策略
4xx 代码:当搜索引擎爬虫由于客户端错误而无法访问您的内容时
4xx 错误是客户端错误,这意味着请求的 URL 包含错误的语法或无法实现。最常见的 4xx 错误之一是“404 – 未找到”错误。这些可能是由于 URL 拼写错误、页面被删除或重定向损坏,仅举几个例子。当搜索引擎遇到 404 时,他们无法访问该 URL。当用户点击 404 时,他们可能会感到沮丧并离开。
5xx 代码:当搜索引擎爬虫由于服务器错误而无法访问您的内容时
5xx 错误是服务器错误,表示网页所在的服务器未能满足搜索者或搜索引擎访问该页面的请求。在 Google Search Console 的“抓取错误”报告中,有一个专门针对这些错误的选项卡。这些通常是因为对 URL 的请求超时,因此 Googlebot 放弃了该请求。查看Google 的文档以了解有关修复服务器连接问题的更多信息。
值得庆幸的是,有一种方法可以告诉搜索者和搜索引擎您的页面已移动 - 301(永久)重定向。
301 状态代码本身意味着页面已永久移动到新位置,因此请避免将 URL 重定向到不相关的页面——旧 URL 的内容实际上并不存在的 URL。如果一个页面正在针对某个查询进行排名,而您将其 301 转到具有不同内容的 URL,则它的排名位置可能会下降,因为使其与该特定查询相关的内容不再存在。301 功能强大——负责任地移动 URL!
您还可以选择 302 重定向页面,但这应该保留用于临时移动以及传递链接公平性不那么重要的情况。302 有点像绕道而行。您暂时通过特定路线吸引流量,但不会永远这样。
注意重定向链!
如果 Googlebot 必须经过多次重定向,它可能很难到达您的页面。谷歌称这些为“重定向链”,他们建议尽可能限制它们。如果您将 example.com/1 重定向到 example.com/2,然后决定将其重定向到 example.com/3,最好消除中间人并将 example.com/1 重定向到 example.com/3。
一旦您确保您的网站针对可抓取性进行了优化,接下来的工作就是确保它可以被索引。
索引:搜索引擎如何解释和存储您的页面?
一旦您确保您的网站已被抓取,接下来的工作就是确保它可以被编入索引。没错——仅仅因为您的网站可以被搜索引擎发现和抓取并不一定意味着它将存储在他们的索引中。在前面关于抓取的部分中,我们讨论了搜索引擎如何发现您的网页。索引是您发现的页面的存储位置。爬虫找到一个页面后,搜索引擎会像浏览器一样呈现它。在此过程中,搜索引擎会分析该页面的内容。所有这些信息都存储在其索引中。
我可以查看 Googlebot 抓取工具如何查看我的网页吗?
是的,您网页的缓存版本将反映 Googlebot 上次抓取它的快照。
谷歌以不同的频率抓取和缓存网页。更成熟、更知名的网站,频繁发帖的网站将比 Roger the Mozbot 的小众网站更频繁地被抓取。 .(如果它是真的……)
页面是否曾从索引中删除?
是的,页面可以从索引中删除!可能会删除 URL 的一些主要原因包括:
URL 正在返回“未找到”错误 (4XX) 或服务器错误 (5XX) – 这可能是意外的(页面已移动且未设置 301 重定向)或故意的(页面已被删除并 404ed 以便将其从索引中删除)
该 URL 添加了一个 noindex 元标记 - 站点所有者可以添加此标记,以指示搜索引擎从其索引中省略该页面。
该 URL 已因违反搜索引擎的网站管理员指南而受到人工处罚,因此已从索引中删除。
该 URL 已被阻止抓取,并在访问者访问该页面之前添加了所需的密码。
告诉搜索引擎如何索引您的网站
机器人元指令
元指令(或“元标签”)是您可以向搜索引擎提供的关于您希望如何处理您的网页的指令。
您可以告诉搜索引擎爬虫“不要在搜索结果中将此页面编入索引”或“不要将任何链接权益传递给任何页面链接”。这些指令通过 HTML 页面的 <head> 中的机器人元标记(最常用)或通过 HTTP 标头中的 X-Robots-Tag 执行。
机器人元标记
漫游器元标记可在网页 HTML 的 <head> 中使用。它可以排除所有或特定的搜索引擎。以下是最常见的元指令,以及您可以应用它们的情况。
index/noindex告诉引擎是否应该抓取页面并将其保存在搜索引擎的索引中以进行检索。如果您选择使用“noindex”,则表示您希望将页面从搜索结果中排除在外。默认情况下,搜索引擎假定它们可以索引所有页面,因此没有必要使用“index”值。
什么时候可以使用:如果您尝试从 Google 的网站索引中修剪精简页面(例如:用户生成的个人资料页面),但您仍然希望访问者可以访问它们,您可能会选择将页面标记为“noindex”。
follow/nofollow告诉搜索引擎页面上的链接是应该被关注还是不被关注。“关注”会导致机器人跟随您页面上的链接并将链接资产传递到这些 URL。或者,如果您选择使用“nofollow”,搜索引擎将不会跟随或传递任何链接权益到页面上的链接。默认情况下,假定所有页面都具有“关注”属性。
什么时候可以使用:当你试图阻止页面被索引以及阻止爬虫跟踪页面上的链接时,nofollow 通常与 noindex 一起使用。
noarchive用于限制搜索引擎保存页面的缓存副本。默认情况下,引擎将保留其已编入索引的所有页面的可见副本,搜索者可以通过搜索结果中的缓存链接访问。
什么时候可以使用:如果您经营一个电子商务网站并且您的价格经常变化,您可能会考虑使用 noarchive 标签来防止搜索者看到过时的价格。
X-Robots-标签
x-robots 标签用于 URL 的 HTTP 标头中,如果您想大规模阻止搜索引擎,则比元标签提供更多的灵活性和功能,因为您可以使用正则表达式、阻止非 HTML 文件并应用站点范围的 noindex 标签.
例如,您可以轻松排除整个文件夹或文件类型(如 moz.com/no-bake/old-recipes-to-noindex):
<Files ~ “\/?no\-bake\/.*”> 标头集 X-Robots-Tag “noindex, nofollow”</Files>
机器人元标记中使用的衍生物也可以用于 X-Robots-Tag。
或特定文件类型(如 PDF):
<Files ~ “\.pdf$”> 标题集 X-Robots-Tag “noindex, nofollow”</Files>
排名:搜索引擎如何对 URL 进行排名?
搜索引擎如何确保当有人在搜索栏中输入查询时,他们会得到相关的结果作为回报?该过程称为排名,或按与特定查询最相关到最不相关对搜索结果进行排序。
为了确定相关性,搜索引擎使用算法、过程或公式,通过该过程或公式以有意义的方式检索和排序存储的信息。这些算法多年来经历了许多变化,以提高搜索结果的质量。例如,谷歌每天都会对算法进行调整——其中一些更新是细微的质量调整,而另一些则是为解决特定问题而部署的核心/广泛算法更新,例如 Penguin 解决链接垃圾邮件。查看我们的Google 算法更改历史记录,了解可追溯到 2000 年的已确认和未确认的 Google 更新列表。
为什么算法变化如此频繁?谷歌只是想让我们保持警惕吗?虽然谷歌并不总是透露他们为什么这样做的细节,但我们知道谷歌在进行算法调整时的目标是提高整体搜索质量。这就是为什么在回答算法更新问题时,谷歌会回答类似这样的话:“我们一直在进行质量更新。” 这表明,如果您的网站在算法调整后遭受损失,请将其与Google 的质量指南或搜索质量评估指南进行比较,两者都非常能说明搜索引擎想要什么。
搜索引擎想要什么?
搜索引擎一直想要同样的事情:以最有用的格式为搜索者的问题提供有用的答案。如果这是真的,那么为什么现在的 SEO 似乎与过去几年不同?
从某人学习一门新语言的角度来考虑它。
起初,他们对语言的理解非常初级——“See Spot Run”。随着时间的推移,他们的理解开始加深,他们学习语义——语言背后的含义以及单词和短语之间的关系。最终,通过足够的练习,学生对语言的了解足以甚至理解细微差别,并且能够为甚至模糊或不完整的问题提供答案。
当搜索引擎刚刚开始学习我们的语言时,通过使用实际上违反质量准则的技巧和策略来玩弄系统要容易得多。以关键字填充为例。如果您想为“有趣的笑话”之类的特定关键字排名,您可以在页面上多次添加“有趣的笑话”一词,并将其加粗,以期提高该词的排名:
欢迎来到有趣的笑话!我们讲世界上最有趣的笑话。有趣的笑话既有趣又疯狂。你有趣的笑话在等着你。坐下来阅读有趣的笑话,因为有趣的笑话可以让你快乐和有趣。一些有趣的最喜欢的笑话。
这种策略带来了糟糕的用户体验,人们不是因为有趣的笑话而大笑,而是被烦人的、难以阅读的文字轰炸。它在过去可能有效,但这绝不是搜索引擎想要的。
链接在 SEO 中的作用
当我们谈论链接时,我们可能意味着两件事。反向链接或“入站链接”是指向您网站的其他网站的链接,而内部链接是您自己网站上指向您的其他页面(在同一网站上)的链接。
链接历来在搜索引擎优化中发挥了重要作用。很早以前,搜索引擎需要帮助确定哪些 URL 比其他 URL 更值得信赖,以帮助他们确定如何对搜索结果进行排名。计算指向任何给定站点的链接数量有助于他们做到这一点。
反向链接的工作方式与现实生活中的 WoM(口碑)推荐非常相似。让我们以假设的咖啡店 Jenny's Coffee 为例:
来自他人的推荐=权威的良好标志
示例:许多不同的人都告诉过你珍妮的咖啡是城里最好的
来自你自己的推荐=有偏见,所以不是权威的好兆头
示例:珍妮声称珍妮的咖啡是城里最好的
来自不相关或低质量来源的推荐 = 不是一个好的权威标志,甚至可能让您被标记为垃圾邮件
示例:珍妮花钱请从未去过她的咖啡店的人告诉别人它有多好。
没有推荐=权限不明确
示例: Jenny's Coffee 可能不错,但您一直找不到任何有意见的人,因此您无法确定。
这就是创建PageRank的原因。PageRank(谷歌核心算法的一部分)是一种链接分析算法,以谷歌创始人之一拉里佩奇的名字命名。PageRank 通过测量指向它的链接的质量和数量来估计网页的重要性。假设网页越相关、重要和值得信赖,它获得的链接就越多。
您从高权威(可信)网站获得的自然反向链接越多,您在搜索结果中排名更高的几率就越大。
内容在 SEO 中的作用
如果他们没有将搜索者引导到某些东西,那么链接将毫无意义。那就是满足!内容不仅仅是文字;它是搜索者消费的任何东西——有视频内容、图像内容,当然还有文本。如果搜索引擎是回答机器,那么内容就是引擎提供这些答案的方式。
任何时候有人执行搜索,都会有数千个可能的结果,那么搜索引擎如何决定搜索者会找到哪些有价值的页面?确定您的页面对给定查询的排名的很大一部分是您页面上的内容与查询意图的匹配程度。换句话说,这个页面是否与被搜索的词匹配并有助于完成搜索者试图完成的任务?
由于对用户满意度和任务完成的关注,没有严格的基准来说明您的内容应该多长、应该包含多少次关键字或您在标题标签中放置的内容。所有这些都可以影响页面在搜索中的表现,但重点应该放在将阅读内容的用户身上。
今天,有数百甚至数千个排名信号,前三名保持相当一致:指向您网站的链接(用作第三方可信度信号)、页面内容(满足搜索者意图的高质量内容)和排名大脑。
什么是RankBrain?
RankBrain 是 Google 核心算法的机器学习组件。机器学习是一种计算机程序,它通过新的观察和训练数据随着时间的推移不断改进其预测。换句话说,它一直在学习,因为它一直在学习,所以搜索结果应该不断改进。
例如,如果 RankBrain 注意到排名较低的 URL 比排名较高的 URL 为用户提供了更好的结果,那么您可以打赌 RankBrain 会调整这些结果,将相关性更高的结果移到更高的位置,并将相关性较低的页面作为副产品降级。
与搜索引擎的大多数事情一样,我们并不确切知道 RankBrain 是由什么组成的,但显然,谷歌的人也不知道。
这对 SEO 意味着什么?
由于 Google 将继续利用 RankBrain 来推广最相关、最有用的内容,因此我们需要比以往任何时候都更加专注于满足搜索者的意图。为可能登陆您页面的搜索者提供最好的信息和体验,您已经迈出了在 RankBrain 世界中表现出色的第一步。
参与度指标:相关性、因果关系还是两者兼而有之?
对于谷歌排名,参与度指标很可能是部分相关性和部分因果关系。
当我们说参与度指标时,我们指的是代表搜索者如何通过搜索结果与您的网站互动的数据。这包括以下内容:
点击次数(来自搜索的访问)
页面停留时间(访问者在离开页面之前在页面上花费的时间)
跳出率(用户仅查看一页的所有网站会话的百分比)
Pogo-sticking(点击一个自然结果,然后快速返回 SERP 以选择另一个结果)
许多测试,包括Moz 自己的排名因素调查,都表明参与度指标与更高的排名相关,但因果关系一直受到激烈争论。良好的参与度指标是否仅表明排名较高的网站?还是网站排名靠前是因为它们拥有良好的参与度指标?
谷歌所说的
虽然他们从未使用过“直接排名信号”一词,但谷歌已经明确表示他们绝对使用点击数据来修改特定查询的 SERP。
根据 Google 前搜索质量主管Udi Manber 的说法:
“排名本身会受到点击数据的影响。如果我们发现,对于一个特定的查询,80% 的人点击 #2,只有 10% 的人点击 #1,一段时间后我们会发现 #2 可能是人们想要的,所以我们会切换它。”
前谷歌工程师 Edmond Lau 的另一条评论证实了这一点:
“很明显,任何合理的搜索引擎都会在自己的结果中使用点击数据来反馈给排名,以提高搜索结果的质量。如何使用点击数据的实际机制通常是专有的,但谷歌很明显它使用点击数据及其专利系统,如排名调整的内容项目。”
由于谷歌需要维护和提高搜索质量,参与度指标似乎不可避免地不仅仅是相关性,但谷歌似乎没有将参与度指标称为“排名信号”,因为这些指标用于提高搜索质量,而单个 URL 的排名只是其中的一个副产品。
哪些测试证实了
各种测试已经证实,谷歌将调整 SERP 顺序以响应搜索者的参与:
Rand Fishkin 的 2014 年测试在让大约 200 人点击 SERP 中的 URL 后,将排名第 7 的结果上升到排名第一的位置。有趣的是,排名提升似乎与访问链接的人的位置无关。在许多参与者所在的美国,排名位置飙升,而在谷歌加拿大、谷歌澳大利亚等页面上的排名仍然较低。
拉里·金(Larry Kim)对排名靠前的页面及其在 RankBrain 前后的平均停留时间进行的比较似乎表明,谷歌算法的机器学习组件降低了人们不会花费太多时间的页面的排名位置。
Darren Shaw 的测试也显示了用户行为对本地搜索和地图包结果的影响。
由于用户参与度指标显然用于调整 SERP 的质量,并将位置变化列为副产品,因此可以肯定地说 SEO 应该针对参与度进行优化。参与度不会改变您网页的客观质量,而是相对于该查询的其他结果而言,您对搜索者的价值。这就是为什么在您的页面或其反向链接没有更改后,如果搜索者的行为表明他们更喜欢其他页面,则排名可能会下降。
就网页排名而言,参与度指标就像一个事实检查器。链接和内容等客观因素首先对页面进行排名,然后如果 Google 做得不对,参与度指标会帮助 Google 进行调整。
搜索结果的演变
当搜索引擎缺乏今天的复杂性时,“10 个蓝色链接”一词被创造出来来描述 SERP 的扁平结构。每次执行搜索时,Google 都会返回一个包含 10 个自然结果的页面,每个结果都采用相同的格式。
在这个搜索领域,保持第一名是 SEO 的圣杯。但后来发生了一些事情。谷歌开始在他们的搜索结果页面上添加新格式的结果,称为SERP 功能。其中一些 SERP 功能包括:
付费广告
精选片段
人们也问盒子
本地(地图)包
知识面板
附加链接
谷歌一直在添加新的。他们甚至尝试了“零结果 SERP”,在这种现象中,知识图谱中只有一个结果显示在 SERP 上,下面没有结果,除了“查看更多结果”的选项。
这些功能的添加引起了一些最初的恐慌,主要有两个原因。一方面,其中许多功能导致有机结果在 SERP 上被进一步推低。另一个副产品是,更少的搜索者点击有机结果,因为更多的查询正在 SERP 本身上得到回答。
那么谷歌为什么要这样做呢?这一切都可以追溯到搜索体验。用户行为表明不同的内容格式可以更好地满足某些查询。请注意不同类型的 SERP 功能如何匹配不同类型的查询意图。
查询意图 | 可能触发的 SERP 功能 |
---|---|
信息性 | 精选片段 |
一个答案的信息 | 知识图/即时答案 |
当地的 | 地图包 |
事务性的 | 购物 |
我们将在第 3 章中详细讨论意图,但就目前而言,重要的是要知道答案可以以多种格式传递给搜索者,以及您如何构建内容会影响它在搜索中出现的格式。
本地化搜索
像谷歌这样的搜索引擎拥有自己的本地企业列表专有索引,并从中创建本地搜索结果。
如果您正在为具有客户可以访问的物理位置的企业(例如:牙医)或旅行以访问其客户的企业(例如:管道工)执行本地 SEO 工作,请确保您声明、验证和优化免费的 Google 我的商家信息。
在本地化搜索结果方面,谷歌使用三个主要因素来确定排名:
关联
距离
突出
关联
相关性是本地企业与搜索者所寻找的内容的匹配程度。为确保商家尽其所能与搜索者相关,请确保商家信息填写完整且准确。
距离
Google 使用您的地理位置来更好地为您提供本地搜索结果。本地搜索结果对邻近度极为敏感,邻近度指的是搜索者的位置和/或查询中指定的位置(如果搜索者包括一个)。
有机搜索结果对搜索者的位置很敏感,但很少像在本地包结果中那样明显。
突出
以知名度为一个因素,谷歌正在寻求奖励在现实世界中知名的企业。除了企业的线下知名度外,Google 还会参考一些在线因素来确定本地排名,例如:
评论
本地企业收到的 Google 评论数量以及这些评论的情绪对其在本地搜索结果中排名的能力有显着影响。
引文
“企业引文”或“企业列表”是在本地化平台(Yelp、Acxiom、YP、Infogroup、Localeze 等)上对本地企业“NAP”(名称、地址、电话号码)的网络引用。 .
本地排名受本地商业引用的数量和一致性的影响。谷歌从各种来源中提取数据,以不断构成其本地商业指数。当 Google 发现对企业名称、位置和电话号码的多个一致引用时,它会加强 Google 对该数据有效性的“信任”。然后,这导致谷歌能够以更高的信心展示业务。Google 还使用来自网络上其他来源的信息,例如链接和文章。
有机排名
SEO 最佳实践也适用于本地 SEO,因为 Google 在确定本地排名时还会考虑网站在自然搜索结果中的位置。
在下一章中,您将学习有助于 Google 和用户更好地理解您的内容的页面最佳实践。