最近很多客户朋友都在问:网站里有重复页面,会不利于谷歌SEO么?
首先我们要清楚什么是重复页面,就是指一个网站中出现相似重复的网站页面内容,判断页面是否重复的标准是谷歌搜索引擎,而不是人。谷歌官方虽未明确说重复内容会带来任何惩罚或负面信号,但早已明确不会索引收录重复的内容(没有收录的网站将错失排名机会,更别提流量了)
同样在SEO业界都有这样的共识,URL是页面的唯一标识符,类似身份证ID一样,一个人只能有一个身份证ID,如果出现了多了,这个人,多半是有问题的。同理,在搜索引擎当中,搜索引擎更加青睐标识符明确、并且唯一的页面。这样搜索引擎可以更好地理解你的网站。
为了避免不必要的抓取和索引工作,谷歌会尝试根据网站URL来预测页面可能包含相似或重复的内容。当Google抓取具有相似URL的页面并发现它们包含相同的内容时,它随后可以确定具有该URL结构的所有其他页面也具有相同的内容,进而将这些页面判定为重复页面,不予抓取收录。
01 为什么谷歌不喜欢重复的页面?
无法索引
搜索引擎无法索引,因为搜索引擎不知道,你的这个页面是否有索引的必要。
无法判断
搜索引擎无法判断,究竟是给哪一个页面优先排名。试想内容一样,URL不同,搜索引擎应该如何选择?可能你自己都没有办法选吧?
不利于用户体验
当用户选择分享你的链接(发布外链)的时候,应该选择哪一个呢?
包括大家熟知的阿里巴巴国际站平台,也是非常强调产品查重的,其实也是为了符合谷歌搜索引擎不喜欢重复内容的“偏好”。
02 哪些操作会导致重复页面的发生?
含有很多参数的页面
很多商城网站的产品页面URL可能会配有多个参数。比如一件商品,有尺寸参数,有颜色参数,有型号参数。当你选择不同的产品的时候,URL中的参数可能会不同。
不同的URL,搜索引擎会当作不同的页面去处理。但是,内容(商品图片,商品描述,或者评价部分)却是一模一样的。就很容易导致重复页面的发生。
带3W和不带3W的页面
大多数网站,会将WWW的域名和不带WWW的域名解析到同一个网站上。那么也就是说,在搜索引擎中出现了2个不同URL(带www和不带www的)但是内容相同。你是搜索引擎,应该给那个网站排名呢?谁先谁后?
域名之后的后缀
很多人的网站主域名访问时会有一个后缀(index.html、index.php之类)
像这样:www.globalso.com/index.html其实这个地址和www.globalso.com是一模一样内容的页面。但是对于部分搜索引擎会当作两个页面去处理,同样会导致重复内容的出现。
03 可以采取什么措施来纠正此问题?
找到重复的页面
找到重复页面是很有必要的,可以使用Siteliner以及Copyscape这一类的工具为网站做一个系统的诊断,找到重复度非常高的页面,自己先做取舍,再让谷歌搜索引擎抓取、收录、排名。
301跳转
如果你有4组不同URL但是内容相同,从URL中选择一条标准的,将剩余的3组链接301跳转到第一个页面URL上。因为301跳转属于带权重跳转,可以将4组URL的权重统一。这样,搜索引擎不光可以识别唯一的页面,同时,唯一的那个页面也可以获得更好的排名。
Canonical加以限制
处理重复内容的另一个选择是使用Canonical标签进行标记。这样其实就是告诉搜索引擎,虽然有多个相同页面,但是真实需要参与排名的,只有我选中的那个特定页面。
小结:
Google总是出现这样或者那样的规则、并且不会告知任何人他们的算法排名,其实这都离不开Google的使命┄┄整合全球信息,供大众使用,使人人受益。让用户可以最大限度地检索到最相关、最可靠的信息。