首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python爬虫实战

原作 | 行云流水 编辑 | alany

做了三年的测试,开发的知识学了不少,心血来潮,在测试空闲期写一个小项目消遣一下。

项目的整体构思和流程如下:

1. python 爬虫爬取糗事百科,将需要的元素取出来插入到数据库中;

2. java 开发一个接口,以json的形式展示,并分页;

3. android 写一个apk,解析json接口,用listView展示数据,并分页。

本篇讲解第一部分,利用python爬虫爬取糗事百科的数据。

环境准备:

python环境,安装lxml,pymysql,可以进入到python环境下的script目录下用 pip install安装

数据库:安装MySql,并创建数据库表

上代码:

1> 建表语句:

2> 分析URL:

打开糗事百科网站,并翻页,我们可以发现page后面的参数表示页数:

3> 爬虫代码:

爬取完成之后查看数据库是否有数据写入:

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180326G1LNVD00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券