Google已启用语言自适应网页的抓取和索引编入处理

来自Google官方博客称:Googlebot 推出了新的语言感知抓取配置,专门用于抓取内容会根据请求者的语言以及所检测到的地理位置而调整的网页。

具体配置如下:

基于地理位置的抓取:除了 Googlebot 目前使用的位于美国境内的 IP 地址外,Googlebot 还将开始使用位于美国境外的 IP 地址。

基于语言的抓取:Googlebot 将开始在抓取时使用包含 Accept-Language HTTP header的请求。

系统会自动对检测到的语言自适应网页启用这些新的抓取配置,因此您可能会注意到我们的抓取方式和您网站在 Google  搜索结果中的显示效果会有所变化(您无需更改自己的 CMS 或服务器设置)。

建议依然适用:为每个语言使用带 rel=alternate hreflang  注释的单独网址。我们将继续支持并建议使用单独的网址,因为这样仍是吸引用户互动和分享内容的最佳方式,而且能够让您的所有内容版本都尽可能编入索引并获得较高的搜索排名。

扩展阅读:

这个命令似乎网上探讨的很少,HTML 标签的 hreflang 属性指示被链接文档是用简体中文编写的。

假设你有一个英文版网页地址是http://www.example.com/,还有一个中文版则是http://cn.example.com/,现在你可以用两个方式告诉Google这两个网页之间的关系了:

HTML关联元素:在http://www.example.com/网页里,加入以下的标记元素,指向那个中文版网页:

<link rel="alternate" hreflang="es" href="http://es.example.com/" />

HTTP头儿:如果你发布的是非HTML文件,比如PDF,那么可以使用HTTP头来告诉Google不同语言的网页地址:

Link: <http://es.example.com/>; rel="alternate"; hreflang="es"

你的某个语言网页里的URL也必须指向其它语言,所有语言网页里的链接里都必须使用互相指向其它语言的地址:

rel="alternate" hreflang="x"