复制内容也可以称为重复内容,复制内容指的是两个和多个url内容完全相同、或者非常相似,复制内容既可能发生在同一个网站内、也可能发生在不同网站上;
1 产生布置内容的原因
- 网址规范化的问题会产生复制内容
- 代理商和零售商从生产商哪里转载产品信息、所以一些电子商务网站充斥这大量的复制内容
- 打印版本
- 网站结构造成的各种页面版本、
- 网页内容由RSS生成
- 使用session ID
- 网页实质内容太少、每个网页上都不可能避免地有通用部分、比如导航条、版权声明、广告等、
- 转载和抄袭、有时候是其它人抄袭你的网站内容、有时候是善意的转载、有时候是作者在不同平台发布的文章、这些都会造成复制内容
- 镜像网站、
- 产品或服务类型之间的区别比较小
- url任意加字符还是返回200状态码;有的网站由于技术原因、用户在url后加上任意字符的参数或字符、服务器还能正常的返回200状态码、并返回与没有加上任意字符时一样的重复内容页面
2 复制内容的害处;有的时候很多seo对复制内容有误解、认为网站上有复制内容、搜索引擎就会惩罚,其实搜索引擎并不会因为站点有少量的复制内容而对其进行惩罚降权,搜素引擎做的只是从多个页面中尽量去选出原创版本、或者用户体验最好的版本、给予其应有的排名,其它复制版本不在搜索记过中返回或排名比较靠后的位置;
既然交给搜索引擎去判断、就有可能出现判断失误的情况;把原来原创的页面当做转载或抄袭复制内容,因而给予不好的排名,这对原创页面来说确实像是惩罚、不过不是因为复制内容本身、而是因为搜索引擎判断原创失败;
同站出现复制内容看似没有那么严重、不管搜索引擎判断哪个版本是原创、都是自己网站上的页面、问题是、搜索引擎认为的最合适url与站长自然认为的最合适的url有可能不一样、站点优化和做链接的时候吧精力都放在页面A,搜索引擎却认为页面B最好(a和b的内容相仿或一致)则站长花在页面A上的精力就浪费了
同一个网站内的复制内容会分散权重、既然页面在网站上出现、就必然有链接链向这些页面、如果一篇独特内容只出现在一个网址、网站上的链接就能集中这一个网址、使其排名能力提高、链接到多个网址、会使得每一个网址排名能力都不突出、外部链接也是一样、很可能分散到不同的url
同站复制也会造成搜索引擎收录了过多没有意义的页面、在域名权重不高的情况下、很可能挤占了其它独特内容的收录的机会;如果网站上存在大量复制内容、尤其是从其他网站抄袭来的内容、可能会使搜索引擎对网站质量产生怀疑、导致惩罚;
3 消除复制内容;
- 网址规范化造成的复制内容、最好的解决办法就是,一篇文章对应一个url,不要出现多个版本,网站所有内部链接统一连到这个url,不是由于网址规划话造成的同站复制内容、解决的最好办法就是选取一个版本允许收录,其它版本禁止引擎抓取和收录,
- 另一个解决复制内容的方法是使用canonical标签,
- 不同网站之间的复制内容解决起来就比较麻烦,因为其它网站上的内容是无法控制的,能做的只有两点,一是页面中加入版权声明、要求转载的网站保留版本声明及指向原出处的链接、一般来说、原创版本的外部链接会比转载多一些,在中文互联网这个对版权其不重视的环境下、也还会有一些站长转载时保留原出处链接;
- 最后一点就是原创,假以时日必定能够增加网站权重、是网站上内容被判断的原装的几率增加;如果有其它网站大量抄袭、造成原创内容不能获得排名、可以考虑联系对方、要求加上版权链接或删除抄袭内容、或者想对方主机、域名提供商投诉、想搜索引擎投诉,最后一步就是使用法律手段、