前言
本篇继续lxml.etree学习,在线访问接口,通过接口返回的html,解析出想要的text文本内容
环境准备:
python 3.6
lxml
requets
定位目标
爬取我的博客首页https://www.cnblogs.com/yoyoketang/左侧栏个人基本信息
先f12抓包,找到该接口地址https://www.cnblogs.com/mvc/blog/news.aspx?blogApp=yoyoketang
运行结果
提取内容
运行结果:
总结
1.获取当前节点标签名称.tag
print(block[0].tag)
2.获取当前节点文本
print(block[0].text)
3.获取当前节点元素全部属性dict
print(block[0].attrib)
4.获取当前节点某个属性
print(block[0].get(“id”))
5.所有子节点
6.获取当前节点下全部文本
print(block[0].xpath(‘text()’))
7.获取本节点和子节点所有文本信息
print(block[0].xpath(‘.//text()’))
8.获取父节点
print(block[0].getparent().tag)
《python3自动化接口+selenium》10月07号开学!(包教会)
主讲老师:上海-悠悠
上课方式:QQ群视频在线教学
报名费2000一人(周期2个月)
领取专属 10元无门槛券
私享最新 技术干货