当完全相同或几乎完全相同的内容出现在两个或多个页面上时,称为重复内容。重复内容的最大问题是搜索引擎不知道要索引或显示在搜索结果中的内容版本。也很难弄清楚在哪里直接链接指标,如权威和信任。并且当其他站点需要在重复的内容版本之间进行选择以链接回时,可能会选择许多链接中的任何一个,这会稀释链接的公平性。
这就是规范URL(Canonical URL)的用武之地。它们用于清除重复内容带来的问题,从而提高您的搜索引擎排名。
什么是规范URL?
由于HTML标记rel=”canonical”而引用的规范URL是搜索引擎在同一网站或不同网站上有多个版本的页面时用来查找内容的主版本的方法。
例如,假设您在自己的网站上发布了一篇博文。然后,您还想在您的LinkedIn和Medium帐户上发布该博客文章。使用规范标签,您可以让搜索引擎知道,即使同一篇博客文章出现在多个网站上,您网站上的文章也是主版本,应该出现在搜索结果中。
请记住,从技术上讲,规范URL并不是真正的 URL — 它更多的是附加到URL以将其含义传达给搜索引擎的标签。如果实际URL看起来像http://example.com/blogpost,那么规范版本将如下所示:
您不能像访问主URL那样访问该规范URL。相反,规范化版本被放置在页面的HTML代码中(或通过插件为页面指定)。
为什么应该使用规范URL
URL的规范化告诉搜索引擎哪个是页面的主版本,这是应该出现在搜索结果中的 页面,而不是页面的其他副本。当人们在寻找要链接回的内容时,规范化的页面会出现,他们会选择那个建立链接公平性的页面。此外,一条内容的指标会合并到一个页面中,这使您的指标报告更加可靠。
如何正确使用规范标签
假设您的网站(或两个不同的网站)上有重复的内容,但您希望将搜索引擎指向的主要版本是http://example.com/blogpost。
添加到博客文章源代码(页面HTML的头部)的规范标签将如下所示:
如果您使用的是WordPress,则不必像其他一些CMS平台那样摆弄HTML代码。相反,您可以使用插件并为每个页面设置规范URL。我们稍后会详细介绍。
规范URL和复制的内容
复制的内容可能是个问题。规范URL让任何要复制内容的人都知道要在其页面标题中使用哪个标签。但是,复制者有责任通过将 rel=”canonical” 放在其网站的标题中并指向您的内容来告诉搜索引擎他们复制了内容。
其他时候,您可能想成为复印机。例如,这在新闻稿中很常见。您可以先在公司网站上发布新闻稿,但将内容的原始来源归于联合网络。这将使您成为联合组织者,而不是原始出版商——至少根据搜索引擎。
但是,我们应该注意,在复制的内容中包含规范URL并不总是必要的。或者有时会被忽略。搜索引擎在寻找内容的真正原始来源方面做得很好。因此,如果您要使用规范URL指向非原始URL,就像上面的新闻稿示例中一样,只需知道搜索引擎可能会忽略它。自行决定使用该策略。对于SEO来说,它处于一种令人讨厌的灰色区域,如果不是全面的黑帽策略的话。
选择URL结构
即使您认为在线任何地方都没有重复内容,您的URL结构也可能会意外创建重复内容。例如,即使以下URL显示相同的内容,并且您将它们视为同一页面,搜索引擎也会将它们视为单独的:
- http://www.examplesite.com – 包含“www”
- http://examplesite.com – 这不包括“www”
- https://examplesite.com – 这有“https”而不是“http”
- http://www.examplesite.com/ – 末尾有一个斜线
HTTPS和尾部斜杠和www也有变化。根据搜索引擎,它们都被视为单独的页面。
这意味着您需要对URL的结构做出最终决定。然后,在任何地方使用该结构——在您的网站上以及在您引用网站的任何地方。如果您必须更新URL,请使用您最常使用的结构,以减少此过程的繁琐。但是,如果您通过网站获取敏感信息,例如信用卡信息,则需要使用HTTPS。
您的 WordPress 类别和标签也可能意外创建重复的内容。例如,这两个URL可能指向同一个页面,但搜索引擎会将它们视为具有重复内容的两个独立页面:
- http://examplesite.com/store/candy/chocolate-truffles
- http://examplesite.com/store/foods/chocolate-truffles
您可能希望用户在您的网站上查找“糖果”或“食品”类别时都能找到松露巧克力。但是搜索引擎仍然需要知道要在搜索结果中排名哪一个。这就是为什么大多数SEO插件(例如Yoast和Rank Math)都提供了对您的档案页面取消索引的选项。这样一来,这些重复项就不会显示给Googlebot及其同行。
何时不使用规范URL
当涉及301重定向时,您可能不想使用规范标签。以这种方式思考不同之处:重定向意味着内容只出现在一个地方,并且您强制所有访问者转到该页面。另一方面,使用规范URL,可以存在和查看包含相同内容的多个页面,其中一个原始来源指定用于搜索引擎。
此外,rel=”canonical” URL元素并不是所有重复内容问题的解决方案。SEO是一个复杂的话题,有时更合适的解决方案是使用robots文件对页面进行无索引。建议您对那些不适合进入您的网站的入口点的无索引页面,以及对大多数访问者不是很有用的页面。例如,您真的需要您的条款和条件页面出现在搜索结果中吗?可能不是。但是你的博客文章、产品描述和销售页面呢?确实。
在使用规范标签时,查看Google的文章中的五个常见错误也是一个好主意。你不能比谷歌直接说的更好。
规范URL如何影响SEO?
现在,虽然我们绝对建议您使用规范URL清除重复内容问题,但重要的是要注意Google在技术上不会因发布重复内容而惩罚网站。但是,它可能会损害您的搜索引擎排名——这有点像受到惩罚。当搜索引擎很难确定哪个是内容的主版本时,没有一个版本会获得很高的排名。
搜索引擎也可能会选择错误的版本并链接到不可信的站点,这意味着如果用户不喜欢 URL 的外观,它可能根本不会被点击和阅读。此外,当您的网站上有重复的内容时,您的抓取预算就会被吃光。搜索引擎抓取并重新抓取网站以查找新内容,如果您的网站上有重复的内容,则需要更长的时间才能全部抓取。这意味着搜索引擎将花费更长的时间来索引这些新页面并在搜索结果中对它们进行排名。
您可以通过阅读我们的SEO终极指南来深入了解该主题。Google还有一个关于合并重复URL的详细介绍。
如何设置规范URL
在本节中,我们将引导您了解如何在WordPress和非WordPress网站上设置规范URL。
使用WordPress设置规范URL
虽然您可以在没有WordPress插件的情况下设置规范URL,但我们认为最好、最简单、最灵活的选择是使用插件。对于本演练,我们使用的是Yoast SEO。
安装并激活Yoast SEO后,打开WordPress页面或文章。向下滚动到文章底部,直到到达Yoast SEO框。选择SEO选项卡(默认情况下),向下滚动到底部,然后单击Advanced。在出现的菜单底部,您会看到一个标有Canonical URL的插槽。
在此框中输入完整的URL,然后将更改保存到文章或页面。
All in One SEO和Rank Math SEO是您可能需要考虑的另外两个插件。
其他平台设置规范URL
如果您不使用WordPress,您仍然可以设置规范URL。首先,您需要访问网页HTML。每个Web构建器都有自己的流程,但应该很容易找到。例如,以下是向Wix站点添加代码的方法。对于大多数非WP构建器和CMS平台,该过程是相似的;你只需要找到他们让你编辑页面/发布HTML的地方。
然后,您需要将带有rel=“canonical”标记的URL添加到head部分。使用下面的示例,将http://example.com/blogpost替换为您的URL:
HTML head部分是代码的第一部分。它打开和关闭。这是一个例子:
要将代码添加到head部分,您必须将其放置在打开和关闭标记之间的某个位置。最好在结束标签上方添加一个链接,以保持一切井井有条。
如何查找规范URL
如果您想查看网页是否有指定的规范URL,这非常简单。打开页面,然后右键单击,将弹出一个菜单。选择Show Page Source(或任何接近该选项的选项,例如View Page Source)。这将打开一个带有HTML代码的源页面。在顶部,您应该看到head部分。检查该部分的rel=“canonical” 标签。
如何删除规范URL
删除规范URL也很容易。您只需采取与添加URL相同的步骤,但这次将其删除。如果您使用了Yoast之类的插件,您可以进入该页面并从相关字段中删除规范URL。如果您直接将它添加到页面的HTML中,您可以简单地删除它然后更新页面。这也是为什么总是在同一个位置添加您的规范URL是一个好主意,例如直接在结束的head标签上方。
小结
您网站上的页面越多,制定规范URL策略的劳动强度就越大。这就是为什么最好尽早处理此问题并密切关注您的内容在何处在线重新发布的原因。借助Yoast SEO等有用的WordPress插件,设置规范URL比访问每个页面的HTML和手动编辑代码更容易。
原文地址:https://www.wbolt.com/canonical-urls.html