我试图使用谷歌网站管理员工具来抓取我的网站,但我很好奇我是否正确地设置了我的参数。在我的网站上,我有不同的页面,内容相对于一个日期的url参数。(例如all /date?=5-2-2018),我想抓取所有可能的组合,这样如果有人搜索"example.com 4-2-2018",就会出现相应的搜索网站。我在爬行设置中列出了日期参数,但我不知道它是否能够检测到所有可能的日期组合。我的URL结构也由HTACCESS控制,它将GET格式更改为"Example.com/day/5-2-2018“。有人有什么建议吗?
发布于 2018-03-31 10:23:11
如果所有的页面都有重复或非常相似的内容,那么很难让Google抓取所有的页面,而且Google可能不会将它们全部索引。
您可以使用rel规范标记,但我认为有太多重复的urls是有风险的。谷歌只有这么多的网络能力来抓取网络,而拥有太多的具有相同内容的urls可能会使机器人厌倦了爬行。
如果每个url的内容是不同的和唯一的,那么只需正确地链接到所有的页面就可以允许Google爬行您的站点。
另一方面,如果所有的页面都是重复的,那么我认为用这种方式构建您的站点是有风险的。
https://webmasters.stackexchange.com/questions/114036
复制相似问题