百川瑜伽培训机构学校网站建设 - 专业的瑜伽培训机构学校网站建设

资讯热点
SEO如何减少网站复制重复内容过多的问题?

发布时间:2024-2-26 分类: 行业资讯

重复内容也可以称为重复内容。复制内容意味着两个或更多的网址具有相同或非常相似的内容。复制内容可能发生在同一网站或不同网站上。

1.复制内容的原因

以下原因可能会导致内容被复制。在曾庆平搜索引擎优化讨论网站的标准化将产生重复的内容。

代理商和零售商转载来自产品制造商的产品信息。这没有错,一般厂家都同意不存在版权问题。但是大部分代理商、零售商、批发商都是不做任何改动就直接复制,而且都是使用相同的产品描述,所以这些电商网站充斥着复制的内容。

打印版本。除了正常的浏览页面外,很多网站还提供了更适合打印的页面。如果不以适当的方式禁止爬行,这些打印页面将成为复制内容。

网站结构导致的各种页面版本。例如,产品列表按价格、评论和保质期排序,博客被分类和存档。

网页内容由RSS生成。许多网站,尤其是新闻网站,使用其他网站的RSSfeed来生成网站内容,这在原始来源和许多其他类似网站中都出现过多次。

使用SessionID。搜索引擎蜘蛛在不同时间访问网页时,会被赋予不同的SessionID。其实网页的内容是一样的。Session1D参数不同,因此被视为不同的网页。

网页内容太少。每个网页都不可避免地有共同的部分,比如导航栏、版权声明、广告等等。如果网页的正文部分太短,内容数量不等于一般部分,则可能被认为是复制的内容页面。

重印和复印。有的时候别人抄袭你的网站内容,有的时候善意转载,有的时候作者在不同的网站发表文章,会导致内容被抄袭。

镜像网站。镜像网站曾经很受欢迎。当网站太忙太慢时,用户可以查看内容或下载内容,而不是镜像,这也造成了复制内容的风险。

产品或服务类型之间几乎没有区别。例如,一些网站按地区对其服务进行分类,但事实上,向每个地区提供的产品或服务是相同的。这些按地区分类的页面只改变地名,其他服务描述都一样。向网址添加字符或返回200状态码。对于一些网站,由于技术原因,用户在URL后添加任意字符或参数,服务器可以正常返回200状态码,返回相同的重复内容页面,没有任何字符。

检查页面是否有重复版本相对简单。在页面正文中拿出一句话,加上双引号,在搜索引擎中搜索。从结果中,你可以看到是否有多页包含这句话。一般来说,随机抽取的一个句子完全出现在另一篇无关紧要的文章中的可能性很小。

2.复制内容的危害

很多SEO对抄袭内容有误解,认为如果网站上有抄袭内容,搜索引擎会惩罚。事实上,搜索引擎不会因为网站上的少量复制内容而惩罚或减少他们的权利。搜索引擎所做的是尝试从多个页面中选择真正的原始版本,并给它适当的排名,而其他重复的版本则不会在搜索结果中返回或排名在较低的位置。

但由于是交给搜索引擎进行判断,有可能判断失误,将原页面视为转载或抄袭复制内容,所以排名不好。这真的像是对原页面的惩罚,但不是因为抄袭内容本身,而是因为搜索引擎没能对原页面进行判断。

在同一个站抄袭内容似乎没那么严重。无论搜索引擎判断哪个版本是原创,都是自己网站上的页面。问题是搜索引擎认为最合适的网址可能和SEO站长自己的不一样。SEO站长在优化和链接的时候,关注的是页面A,但是搜索引擎认为页面B是最好的(A和B内容相同),所以SEO站长在页面A上花费了很多精力。

同一网站中的重复内容会分散权重。由于网页出现在网站上,因此必须有指向这些网页的链接。如果一个独特的内容只出现在一个网站上,网站上的链接可以集中在这个网站上,提高了它的排名能力。如果链接分散到多个网站,每个网站的排名能力都不会突出。同样,外部链接很可能分散到不同的网址。

在同一个站点复制也会导致包含太多无意义的页面。在低域权限的情况下,其他独特的内容包含机会可能会被挤出。如果网站上存在大量抄袭内容,搜索引擎可能会对网站质量产生怀疑,导致被处罚。

3.删除复制的内容

网站地址标准化导致的重复内容前面已经讨论过了。最好的解决办法是保证一篇文章只对应一个URL,不存在多个版本。网站的所有内部链接都以统一的方式连接到这个网址。有时需要使用301重定向。

解决同站内容复制问题,不是网址标准化造成的,最好的办法是选择一个版本允许收录,其他版本禁止被搜索引擎抓取或收录。

您可以使用robots文件来禁止爬网,或者使用noindexmetarobots标记来禁止索引。指向您不想包含的复制内容的链接使用nofollow标签、JavaScript等。防止蜘蛛爬行。

复制内容的另一个解决方案是使用规范标签。规范标签可以应用于由网址标准化导致的复制内容,也可以用于其他情况。

比如网站上同一款式的鞋子可能会分成不同的型号,型号之间唯一的区别就是颜色。这些型号生成多个网站,产品描述几乎一模一样,只是颜色不同。

此时,可以使用规范标签,用户不会转向或看到不同的页面,但搜索引擎会将权重集中在其中一个模型上,从而避免复制内容。

带有SessionID的页面也可以使用规范标签,例如page: /page-a.html和code :

这样,无论以后生成什么SessionID:

/page-a.html?sessionid=123456

/page-a.html?sessionid=456789

上述网址将由搜索引擎加权为:/page-a.html。

在不同网站之间复制内容很麻烦,因为其他网站上的内容无法控制。只有两件事可以做。首先,在页面上添加版权声明,要求转载网站保留版权声明和指向原出处的链接。

一些联合网站会抓取提要自动生成的内容,因此版权声明和链接也应该添加到提要中。

一般来说,原版的外部链接会比转载的多。即使是在非常重视版权的中文互联网环境下,部分站长在转载时也会保留原出处链接。对于搜索引擎来说,指向原始来源的链接是判断原创性最重要的信号。

还有一点就是坚持原创,久而久之肯定会增加网站的权重,增加网站上的内容被判定为原创的几率。如果其他网站大量抄袭,使得原创内容无法排名,也可以考虑联系对方,请求添加版权链接或删除抄袭内容,或者向对方主机和域名提供商投诉,向搜索引擎投诉等。

本文来源于微信微信官方账号:平哥SEO优化(青平SEO)

« 双十一营销技巧,使促销简单,暴力和强大 | 因为闲鱼没有商品,所以有被动引水的方法 »