首页
学习
活动
专区
工具
TVP
发布

Python爬虫与数据挖掘

专栏成员
851
文章
938484
阅读量
62
订阅数
Python网络爬虫headers的字典总是出现换行符 这个要怎么处理呀?
前几天在Python钻石交流群【大写一个Y】问了一个Python网络爬虫的问题,问题如下:大佬们 问个问题,我写了一个能把源请求头和cookies转换成字典格式的函数,运行之后cookies是成功了的,但是hesders的字典总是出现换行符 这个要怎么处理呀 研究2天了。
Python进阶者
2024-06-24
590
爬取同样内容,xpath方法会比bs4要慢很多吗?
前几天在Python白银交流群【沐子山树】问了一个Python网络爬虫的问题,问题如下:爬取同样内容,xpath方法会比bs4要慢很多吗?
Python进阶者
2024-06-24
510
Python代码解压的中文文件名是乱码,怎么解决?
前几天在Python白银交流群【fashjon】问了一个Python自动化办公的问题,问题如下:
Python进阶者
2024-06-24
860
请问我用cpca三方库解析地址,但是总会漏一部分解析不出来?
前几天在Python钻石交流群【逆光】问了一个Python数据处理的问题,问题如下:请问我用cpca三方库解析地址,但是总会漏一部分解析不出来,请问这个咋整呀?我处理了,就是还剩这14个,请问要咋处理呀?
Python进阶者
2024-06-24
1050
Python爬取同样的网页,bs4和xpath抓到的结果不同?
前几天在Python白银交流群【沐子山树】问了一个Python网络爬虫的问题,问题如下:刚好遇到另外一个问题,请教下大佬。就是我爬取同样的网页,用xpath的时候会将图上这样的script标签里面的内容当成text取出来,但是用BS4就不会。导致两种方法取出来的text不一样。这种情况应该如何处理?
Python进阶者
2024-06-24
700
input的时候, 我输入一条链接可以运行,但输入两条会报错?
前几天在Python交流群【Cappuccino】问了一个Python基础的问题,问题如下:再問一個沒那麼複雜的問題,請教一下,當我改成input 的時候, 我輸入一條鏈接可以運行,但輸入兩條就會報錯,請問多於一條鏈接的輸入格式是怎樣呢?
Python进阶者
2024-06-24
760
盘点一个Python自动化办公的问题
前几天在Python铂金交流群【逆光】问了一个Python自动化办公的问题,问题如下:问题 我现在有两个表a、b ,for 循环a、b ,如果a的条件满足b,则把b的值赋给a ,目前a有7万条数据,b有300条。我写的代码20分钟都没跑完。这是代码,请问改怎么解决?
Python进阶者
2024-06-24
720
Pandas读取excel文件时,有这个报错,应该怎么解决?
前几天在Python最强王者交流群【钟爱一生】问了一个Python自动化办公的问题,问题如下:not well-formed (invalid token): line 3, column 74593各位老师,读取excel文件时,有这个报错,应该怎么解决?
Python进阶者
2024-06-13
810
matplotlib作图不显示3D图,怎么办?
前几天在Python白银交流群【Kim】问了一个Python作图的问题,问题如下:他不显示3D图咋办?
Python进阶者
2024-06-12
500
盘点一个Python自动化办公的实战需求
前几天在Python交流群,有个粉丝遇到了一个Python自动化办公的问题,问题如下:你是一名高级Python自动化办公专家,你现在遇到一个Python自动化办公问题。桌面上有个【省份】文件夹,文件夹内有20多个子文件夹,每个子文件夹下面有若干个文件夹,每个文件夹下有若干个word文件。现在需要你写一份程序,读取【省份】文件夹和子文件夹下的所有word文件,如果读取出来的word文件中存在【nan】这样的关键词,则输出该word文件的文件名。请你写一份Python代码。
Python进阶者
2024-06-11
810
如何用python如何获得别人开发的程序的 这两个控件?
前几天在Python钻石交流群【emerson】问了一个Python网络爬虫的问题,问题如下:老师们请问用python如何获得别人开发的程序的 这两个控件?
Python进阶者
2024-06-11
890
盘点一个Python网络爬虫的实战问题
前几天在Python最强王者交流群【🇿 🇽 🇸】问了一个Python正则表达式处理的问题,问题如下:各位大佬午好,我在使用爬虫时遇到了一个问题,就是在爬取数据时,爬取了多页 但是数据保存时只有最后一页的,请问这个问题该怎么解决啊 下面分别是截图与代码文件。
Python进阶者
2024-06-11
900
这个正则用Python怎么写?
前几天在Python最强王者交流群【刘苏秦🙊】问了一个Python正则表达式处理的问题,问题如下:这个正则怎么写?我有一段文本对吧,现在的条件只有一个江西景德镇。我要匹配出文本中江西景德镇后面的所有数据,而文本中的是江西省景德镇市_。pattern = r'江西景德镇(?:_|\s)?(\d+(?:,\d+)*)'
Python进阶者
2024-06-11
900
盘点一个Pandas数据分组的问题
前几天在Python白银交流群【上海新年人】问了一个Pandas数据分组的问题,问题如下:
Python进阶者
2024-06-11
630
有没有python在flask框架下开发的实际案例?
前几天在Python钻石交流群【进击的python】问了一个Python web开发的问题,问题如下:各位大佬,有没有python在flask框架下开发的实际案例???求分享
Python进阶者
2024-06-11
1030
Python网络爬虫,我目前只能获取单个文件,为啥?
前几天在Python钻石交流群【Jethro Shen】问了一个Python网络爬虫的问题,这里拿出来给大家分享下。
Python进阶者
2024-06-11
770
这里的表名为None不会报错,但是改成了0 ,df.values报错,这是啥意思?
前几天在Python钻石交流群【不争】问了一个Python自动化办公的基础问题,这里拿出来给大家分享下。
Python进阶者
2024-05-30
761
我想把上面的数据使用Pandas转换成下面的样子应该怎么处理呢?
前几天在Python最强王者交流群【群除我佬】问了一个Pandas的问题,这里拿出来给大家分享下。
Python进阶者
2024-05-29
860
我想提取这个发震时刻的年份、月份、小时,怎么破?
前几天在Python钻石交流群【萤火】问了一个Pandas处理的问题,这里拿出来给大家分享下。
Python进阶者
2024-05-28
810
安装笔记本应用商店的pycharm,再安排pandas等模块,说是没有打包工具?
求教大佬:华为笔记本,麒麟系统,安装笔记本应用商店的pycharm,再安排pandas等模块,说是没有打包工具,再安装打包工具冒出来这个故障,求教这是什么故障?怎么解决呢?
Python进阶者
2024-05-28
800
点击加载更多
社区活动
AI代码助手快速上手训练营
鹅厂大牛带你玩转AI智能结对编程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档