先说一个例子:前段时间我的一个朋友问我,说他自己做了一个网站,创建了几十天了,外链没少发,网站也更新文章了,为什么百度不收录,其他搜索引擎都已经收录了。
网站迟迟不被收录的注意事项
那我给讲了三点:
第一,这个域名以前是否被使用过?有没有黑历史?
第二,有可能并不是不收录,而只是还没更新而已。找找搜索引擎更新的重要时间节点。
第三,重新审视你的外链策略,为未来得到的权重设一个期望。
这上面只是一个简单的概括,对于我们做优化的人来说,网站迟迟没有被收录,需要很多的原因去让我们找。
网站迟迟不被收录的注意事项
第一条我们先了解一下CDN问题
CDN的全称是Content Delivery Network,即内容分发网络。CDN是构建在网络之上的内容分发网络,依靠部署在各地的边缘服务器,通过中心平台的负载均衡、内容分发、调度等功能模块,使用户就近获取所需内容,降低网络拥塞,提高用户访问响应速度和命中率。CDN的关键技术主要有内容存储和分发技术。
CDN简单来说就是一个用来给你网站做缓存镜像的服务器,它在全国有很多的节点,用来提高你网站的访问速度的。
那么我们知道了CDN的工作原理就不难理解,当用户访问了你的域名过后,首先会解析到你的cdn服务器调用缓存文件,然后才是回源到你的服务器上。如果cdn上设置有问题,百度蜘蛛是抓取不到你网站的内容的,所以这点来说就已经足够重要。
网站迟迟不被收录的注意事项
第二条我们了解一下robots协议
Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。
robots.txt文件是一个文本文件,使用任何一个常见的文本编辑器,比如Windows系统自带的Notepad,就可以创建和编辑它 [1] 。robots.txt是一个协议,而不是一个命令。robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。
robots了解之后,我们再说后面的,应该有许多小伙伴在优化的时候,都见过首页收录有这么一句“由于该网站的robots.txt文件存在限制指令,系统无法提供该页面的内容描述”的提示,这是由于网站robots文件屏蔽操作导致的。所以不管你的文章内容质量怎么高,你不去修改,最终也是无法收录的原因。
原文地址:
https://www.wdw99.com/yingxiaozixun/seo/136.html
领取专属 10元无门槛券
私享最新 技术干货