什么是重复内容?
重复内容是指与其他网站或同一网站上不同页面上的内容相似或完全相同的内容。
补充:
重复内容是指与另一个页面上显示的内容相同的内容。
但是,“重复内容”也适用于与其他内容相似的内容,甚至稍作改写也是如此。
内容重复如何影响SEO?
通常,Google不想对包含重复内容的页面进行排名。
特别,Google声明:
“ Google努力索引和显示具有独特信息的页面”。
因此,如果您网站上的网页没有明显的信息,则可能会损坏您的搜索引擎排名。
具体来说,这是包含大量重复内容的网站遇到的三个主要问题。
有机流量减少:这非常简单。Google不想对使用从其他页面复制的内容进行索引的页面进行排名。
(包括您自己网站上的页面)
例如,假设您的网站上有三个页面,它们的内容相似。
Google不确定该页面是“原始”页面。因此,所有三页都将很难排名。
罚则(极度稀有): Google表示重复的内容可能会导致罚则或对网站进行完全索引删除。
但是,这种情况很少见。仅在网站上从其他网站上抓取或复制内容的情况下,才执行此操作。
因此,如果您的网站上有一堆重复的页面,则可能无需担心“重复的内容惩罚”。
索引页面更少:这对于具有很多页面的网站(例如电子商务网站)尤其重要。
有时Google不仅会降低重复内容的排名。它实际上拒绝索引它。
因此,如果您的网站上的页面没有被索引,那可能是因为您的抓取预算浪费在重复的内容上。
最佳实践
注意不同URL上的相同内容
这是出现重复内容问题的最常见原因。
例如,假设您经营一个电子商务网站。
并且您有一个出售T恤的产品页面。
如果一切设置正确,则该T恤的每种尺寸和颜色仍将位于相同的URL上。
但是有时您会发现您的站点为产品的每个不同版本创建了一个新URL……这导致成千上万的重复内容页面。
另一个例子:
如果您的站点具有搜索功能,则这些搜索结果页面也可以被索引。同样,这可以轻松将1000多个页面添加到您的站点。所有这些都包含重复的内容。
检查索引页
查找重复内容的最简单方法之一就是查看您的网站在Google中建立索引的页面数。
您可以通过在Google中搜索site:example.com来做到这一点。
或在Google Search Console中签出索引页面。
无论哪种方式,此数字都应与您手动创建的页面数量一致。
确保您的网站正确重定向
有时,您不仅拥有同一个页面的多个版本,而且拥有同一个SITE。
尽管很少见,但我已经多次看到它在野外发生。
当您网站的“ WWW”版本未重定向到“非WWW”版本时,就会出现此问题。
(或相反亦然)
如果您将站点切换到HTTPS…并且未重定向HTTP站点,则也可能发生这种情况。
简而言之:您网站的所有不同版本都应该位于同一位置。
使用301重定向
301重定向是解决网站上重复内容问题的最简单方法。
(除了完全删除页面外)
因此,如果您在网站上发现了一堆重复的内容页面,请将其重定向回原始页面。
一旦Googlebot停下来,它将处理重定向并仅索引原始内容。
(这可以帮助原始页面开始排名)
留意相似的内容
重复的内容不仅意味着从其他地方逐字复制的内容。
实际上,Google将重复内容定义为:
因此,即使您的内容与现有内容在技术上有所不同,您仍然会遇到重复的内容问题。
对于大多数网站而言,这不是问题。大多数站点都有几十个页面。他们为每个页面编写独特的内容。
但是在某些情况下,“相似的”重复内容可能会出现。
例如,假设您经营一个网站,该网站教人们如何讲法语。
您将服务更大的波士顿地区。
好吧,您可能有一个围绕关键字“学习法语波士顿”而优化的服务页面。
另一个页面试图将其排名为“ Learn French Cambridge”。
有时内容在技术上会有所不同。例如,一页上列出了波士顿位置的位置。另一页上有剑桥地址。
但在大多数情况下,内容超级相似。
从技术上讲,这是重复的内容。
为网站上的每个页面编写100%唯一的内容会很痛苦吗?是的。但是,如果您认真考虑对网站上的每个页面进行排名,则必须这样做。
使用规范标签
在相对=规范的标签告诉搜索引擎:
“是的,我们有一堆内容重复的页面。但是此页面是原始页面。您可以忽略其余部分。”
谷歌表示,规范标签比阻止具有重复内容的页面更好。
(例如,使用robots.txt或网页HTML中的noindex标记阻止Googlebot )
因此,如果您在网站上找到一堆包含重复内容的页面,则需要:
- 删除它们
- 重定向他们
- 使用规范标签
使用工具
有少数SEO工具具有旨在发现重复内容的功能。
合并页面
就像我提到的,如果您有很多页面,其中包含重复的内容,那么您可能希望将它们重定向到一页。
(或使用规范标签)
但是,如果您的页面具有相似的内容,该怎么办?
好吧,您可以为每个页面磨出独特的内容……或将它们合并为一个大页面。
例如,假设您的网站上有3篇博客文章在技术上有所不同……但是内容几乎相同。
您可以将这3篇文章合并为文章100%独特的惊人博客文章。
由于您从网站中删除了一些重复的内容,因此该页面的排名应超过其他3个页面的总和。
Noindex WordPress标记或类别页面
如果您使用WordPress,您可能已经注意到它会自动生成标签和类别页面。
这些页面是重复内容的巨大来源。
因此它们对用户很有用,我建议在这些页面上添加“ noindex”标签。这样,它们可以存在而无需搜索引擎为它们建立索引。
您还可以在WordPress中进行设置,以使这些页面完全不会生成。