——————————————————————————————
基于python实现天眼查采集,文末附采集程序。
——————————————————————————————
效果如下gif展示:
运行程序后,自动将事先需要查询的企业名称输入天眼查查询,并采集详情页信息。
一、程序实现步骤
1、登录页输入账号密码登录;
切换到“密码登录”,用手机号、密码登录,点击登录后有拖动滑块验证,这边需要人工拖动验证下。登录后就能愉快的采集了;
2、输入公司名称查找并点击进入详情页
从待采集的excel中读取“待查企业名称列表”,循环查询;
3、详情页信息采集
查询到后点击进入详情页,采集详情页信息
4、采集结果存入excel
二、程序运行环境
1、请务必是win7 以上64位系统,xp安装python环境非常麻烦,还会经常出现意想不到的安装包不可用的错误;
2、python 3,基本上要用的包python已经全面升级到3+版本了,所以果断python3。python需要另外安装下selenium等包;
3、webdriver,python下的浏览器自动化测试工具,用来做爬虫采集数据,简直无所不能。将ChromeDrive.rar解压复制chromedriver.exe到python安装目录下
三、采集程序使用
领取专属 10元无门槛券
私享最新 技术干货