某人发表了一篇针对某新闻事件的原创博客,随后被新浪转载到了新闻频道。从描述的内容上讲,这是一种重复。但这种重复仅仅是主体内容上的重复,一方面它的转载带来了访问速度、稳定性等方面的增益,并且之后的检索用户还有可能用“新闻事件新浪”来检索此新闻。这可以被称之为站点增益。因此即使主题内容没有任何变化,新浪的这次转载也是有价值的,其稀缺度也是较高的。
同样,反过来说,如果转载的网站相当不知名,则其无法带来站点名、稳定性、速度等的增益。更有甚者,转载之后在页面上加入大量广告妨碍阅读,或者只转载了内容中不完整的一部分,这样的转载,或者说采集,就是纯重复的,与采集源相比,就是没有检索价值的了。
谷歌seo是收录重复内容的,只是说随着收录重复内容量的不但增加,合格的附加价值也在增加,想要继续被收录就会变得更加困难,除非你能有更好的附加价值,所以搜索引擎对于重复内容的收录也是有上限的,价值越高的内容肯定上限越高,当重复收录量越接近这个上限,想被收录就越难,这就是之后再选择伪原创的原因,因为内容的改变加大了收录的可能。