腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
删除
python
webscraping
循环
结果
中
不需要
的
元素
、
、
、
article_tags_topics'}) Topics.append(a) print(Topics) 没有代码问题,但以下是我用前面的代码获得
的
内容
的
摘录explore-topics/forests">Forests</a>, <a href="/explore-topics/climate-change">Climate change</a&
浏览 14
提问于2021-01-22
得票数 1
回答已采纳
3
回答
无法从单
元素
列表创建字典。
、
、
我是
python
编程和
webscraping
方面的新手,我能够从网站上获得相关信息,但它只生成一个
元素
,其中包含列表中所需
的
所有信息。问题是我不能
删除
这个
元素
列表
中
不需要
的
东西。我不确定是否有可能从单个
元素
list.Is
中
创建
python
字典,如下例所示:任何帮助都是非常感谢
的
浏览 5
提问于2017-12-04
得票数 0
回答已采纳
2
回答
Python
-3.x简单XPath库
、
、
我正在尝试使用
Python
解析非常简单
的
XML。import xml.etree.ElementTree as ETresult是不
浏览 1
提问于2013-04-03
得票数 3
回答已采纳
1
回答
Python
抓取: soup.select
的
问题
、
我正在开发一个
python
脚本,用于从特定站点( )
中
刮取数据这次我使用soup.select方法,类名为W(100%) M(0),我
的
代码如下所示:import pandas as pdtable = soup.select(table:has(-soup-contains("W(100%) M(0)")))这并
浏览 4
提问于2022-09-13
得票数 0
1
回答
ConnectionError: HTTPSConnectionPool(host='www.google.com',port=443):
、
、
、
我想从google.com
中
抓取网页
结果
。我遵循了这个问题
的
第一个答案,。不幸
的
是,我得到了连接错误。我碰巧也查过其他网站,它没有连接。是因为公司
的
代理设置吗?文件"c:\users\appdata\local\programs\
python
\
python
37\
webscraping
\lib\site-packages\requests\api.py",第75行,在get返回请求(‘get’,url,params=params,**
浏览 1
提问于2018-10-29
得票数 0
1
回答
如何完全
删除
python
中
包含类
的
HTML标记?
、
、
、
我有一个网络刮刀,从CNN,福克斯,和英国广播公司在BeautifulSoup
的
文章。然后,在进行了一些预处理之后,我将原始文章返回给API。但是,我不知道如何完全
删除
包含
Python
中
令人讨厌
的
类
的
HTML标记。我尝试了lxml清理器,但是我可以
删除
标记,但不仅仅是包含某个类
的
标记。如果在本例
中
我试图
删除
“帮助”,我想要一个脚本,该脚本将转换如下所示
的
HTML: <p class="
浏览 1
提问于2022-03-08
得票数 0
回答已采纳
3
回答
有没有一种方法可以使用
python
中
的
selenium在<div>
中
获取值?
、
、
、
、
我是
python
和
webscraping
的
新手,所以我不确定
元素
中
<div>之间
的
值
的
名称是什么。<div class="syllable">value</div> 有没有办法在
python
中使用selenium使用XPath将介于<div>之间
的
值赋给一个字符串变量?例如,
元素
中
的
" valu
浏览 3
提问于2020-12-08
得票数 0
1
回答
同时尝试刮两个页面时出错-
Python
,bs4
、
、
我试图从一个(主要)网站
的
一些电影
的
链接,然后,从这些链接
的
内容刮刮。我得到了一个错误: 文件跟踪(最近一次调用):文件"/Users/calinap/PycharmProjects/
WebScrapin
浏览 1
提问于2020-04-15
得票数 0
1
回答
如何将文件保存到包含“&”等特殊字符
的
路径
中
?(“&”与英文键盘中键入
的
“&”不同)
、
、
我需要将一个文件写入包含R中一个特殊字符
的
特定路径,路径类似于:C:/Users/Technology & Innovation/
Webscraping
files/US_data/data我发现“&”和“&”
浏览 2
提问于2020-11-12
得票数 2
2
回答
如何创建一个for
循环
来填充DataFrame?
、
、
我已经开始学习
python
,并偶然发现了一个利用
python
的
机会,这是我在工作
中
的
优势。这是我试图运行
的
代码Traceba
浏览 4
提问于2022-05-27
得票数 0
1
回答
我如何从一篇文章
中
抓取所有段落,而不仅仅是一个段落?
、
、
这里
的
初学者。 我刚刚开始学习
Python
,我正在学习网络抓取,我想抓取每一段,然后将它们写在文本文件或csv上。每个段落都有相同
的
标签名,所以我认为for
循环
会遍历该名称
的
每个标记,并从每个标签和中提琴
中
获取文本!除了它只显示第一段15+次数..。我认为它这么做
的
原因是因为它抓住了第一个标签,就像我告诉它
的
那样,并且打印相同
的
标签,和它
的
名字一样
的
其他标签。我试图用.find替换.find_all
浏览 11
提问于2021-01-02
得票数 0
回答已采纳
21
回答
如何从数组
中
删除
空白
元素
?
、
我有以下数组我希望从数组
中
删除
空白
元素
,并希望得到以下
结果
:有没有像compact这样
不需要
循
浏览 14
提问于2011-05-04
得票数 312
回答已采纳
3
回答
如何使用
Python
使用Selenium从多个div类中提取文本
、
、
我试图从中获取文本类
的
价格值for ratevalue in rateText:未发现
结果
: 回溯(最近一次调用):文件"D:\project\totempop\
webscraping
\asrPOP.py",第22行,在rateText=WebDri
浏览 11
提问于2022-04-21
得票数 1
1
回答
块
中
的
python
webscraping
抓取
结果
、
、
、
、
我想编写一个
python
工具,它可以自动下载给定
的
固定站点
的
HTML。我试着使用漂亮
的
汤,然而,解析
的
HTML没有显示内容,而是询问我是否是一个机器人等等,这意味着我
的
网络刮刀被检测到并被封锁(我可以访问火狐
的
网站很好)。我还能做些什么来避免被检测到(例如旋转代理,随机点击,无头铬,,其他没有被检测到
的
网络抓取工具.)?我在网上发现
的
一些东西可能是造成这一现象
的
原因: 缺少javasc
浏览 2
提问于2020-12-04
得票数 1
1
回答
如果满足条件,如何在
python
中
只重复函数
的
某一部分?
、
我正在写一个网络抓取脚本,它做不同
的
事情,取决于什么是从网站上
删除
。问题是我不知道该怎么做。我在谷歌上搜索了一下,似乎使用while
循环
是解决方案。但是我不知道如何在我
的
代码
中</
浏览 7
提问于2022-10-10
得票数 0
回答已采纳
2
回答
为什么这个CSS选择器不返回
结果
?
、
、
、
我正在跟随一个自动使用
python
的
webscraping
示例,但是我
的
CSS选择器没有返回任何
结果
。for i in range(numopen):谷歌是否修改了搜索链接
的
存储方式通过检查搜索页面
元素
,我发现这个选择器没有理由不能工作。
浏览 6
提问于2020-06-01
得票数 0
回答已采纳
6
回答
删除
python
列表
中
的
元素
并避免移位
、
我在
python
中有一个列表,每次
元素
满足一定条件时,我都会
删除
该
元素
。问题是,for
循环
似乎跳过了一些
元素
。我认为这是因为列表在
删除
后移到左边。那么,如何正确
删除
列表
中
的
项?这是我
的
密码 if elem == 0: print(l
浏览 8
提问于2019-11-20
得票数 2
回答已采纳
1
回答
Soup.find和findAll在hockey-reference.com上找不到表格
元素
、
、
一般来说,我只是
webscraping
和
python
的
初学者,所以很抱歉答案是显而易见
的
,但我不知道我在上找不到任何表
元素
。我最初
的
想法是,这是整个soup.text被注释掉
的
结果
,所以按照我在另一篇类似文章中找到
的
一些建议,我替换了注释字符,并确认当我将div保存到文本文件并进行搜索时,它们已被
删除
。在尝试进一步搜索时,我从我
的
.find
中
取出了ID,并执行了一次findAll,
浏览 1
提问于2018-08-20
得票数 0
3
回答
提高NumPy阵列上
的
操作性能
、
我使用numpy.delete从while
循环
内
的
数组
中
删除
元素
。仅当数组不为空时,此while
循环
才有效。这段代码运行得很好,但是当数组中有超过1e6个
元素
时,速度会大大减慢。ix = where((array >= x) & (array <= y))[0]我试着让这段代码更高效,但是我找不到一种好
的
方法来加速while
循环
。我认为,这里<
浏览 0
提问于2012-05-15
得票数 9
回答已采纳
4
回答
从另一个字典
python
中
删除
一个字典
、
如果A和B是两个字典,使用
python
,有没有办法从字典B
中
删除
字典A
中
的
元素
?dictB
的
所有
元素
。for
循环
的
东西,那么很好。也
不需要
在
删除
之前检查父字典是否有密钥,因为子字典是从父字典派生出来
的
。因此,不必考虑keyError。父字典是一个静态字典,不应受该方法
的
影响。相反,返回
的
字典应该存储在另一个简化
的</em
浏览 2
提问于2011-07-18
得票数 3
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券