腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
用于
删除
标签
的
字符串
操作
python
(
webscraping
)
、
, '') n5 = n4[1].replace(')', '') print(f) 所以我现在用这个从n变量中
删除
\n
标签
和空格,但我觉得似乎有一种更好
的
优化方式来做到这一点,我想知道是否有人可以帮助我,谢谢。
浏览 16
提问于2019-12-07
得票数 0
回答已采纳
2
回答
AttributeError:“”module“”对象没有“”whois“”属性“”
、
、
我尝试执行以下代码:w = whois.whois('
webscraping
.com')我得到了上面的错误。为什么?
浏览 3
提问于2016-12-15
得票数 1
2
回答
更改URL
字符串
中
的
单个值
、
、
我正在学习网络抓取,我正在example.
webscraping
.com上练习。我可以从一个页面中提取我想要
的
信息,但我想知道如何以最简单
的
方式遍历多个页面。我采用了只使用格式化
字符串
的
方法,因为页面之间唯一
的
区别是URL "“末尾
的
值。然而,即使创建一个整数并尝试将其作为
字符串
输入到URL中,该url上有一个计数器,以便在每个完整
的
循环周期后更改url,我也没有任何运气。作为将来
的
参考,如果我想浏览像eb
浏览 2
提问于2019-11-06
得票数 0
1
回答
Python
抓取: soup.select
的
问题
、
我正在开发一个
python
脚本,
用于
从特定站点( )中刮取数据这次我使用soup.select方法,类名为W(100%) M(0),我
的
代码如下所示:import pandas as pd File "/Users/ryanngan/PycharmProjects/
Webscr
浏览 4
提问于2022-09-13
得票数 0
1
回答
如何完全
删除
python
中包含类
的
HTML标记?
、
、
、
我有一个网络刮刀,从CNN,福克斯,和英国广播公司在BeautifulSoup
的
文章。然后,在进行了一些预处理之后,我将原始文章返回给API。但是,我不知道如何完全
删除
包含
Python
中令人讨厌
的
类
的
HTML标记。我尝试了lxml清理器,但是我可以
删除
标记,但不仅仅是包含某个类
的
标记。如果在本例中我试图
删除
“帮助”,我想要一个脚本,该脚本将转换如下所示
的
HTML: <p class="help">Her
浏览 1
提问于2022-03-08
得票数 0
回答已采纳
1
回答
无法使用多个html标记刮取网页
、
、
、
我对堆叠溢出进行了彻底
的
搜索,但没有找到合适
的
解决方案。我正在刮一个遗留
的
网站,我想提取所有的
标签
和输入名称。旧网页
的
html格式如下所示<INPUT class="input-l" name="firstname"> <div<input name="useraccount" val
浏览 2
提问于2016-11-22
得票数 1
2
回答
Python
方法
删除
指定标记内
的
所有文本
、
、
我正在处理
Python
中
的
超文本标记语言代码,我想
删除
所有注释(开始标记<!--和结束标记-->。有没有函数、方法或库可以帮助我实现这一点?
浏览 9
提问于2020-04-22
得票数 1
回答已采纳
2
回答
将大
字符串
输出转换为字典
、
、
、
return w.textDomain name: Amazon Europe Holding因此,只要看一下它,我就能看到布局是用来把它变成字典
的
,但我不知道如何用尽可能有效
的
方式来实现它。我需要
删除
不想要
的
文本底部,并
删除
所有的换行符和缩进。单独做并不是很有效率。我希望能够将任何url传递给函数,并有一个可以使用
的
字典。任何帮助都会很感激<e
浏览 2
提问于2017-05-10
得票数 0
回答已采纳
3
回答
有没有一种方法可以使用
python
中
的
selenium在<div>中获取值?
、
、
、
、
我是
python
和
webscraping
的
新手,所以我不确定元素中<div>之间
的
值
的
名称是什么。<div class="syllable">value</div>
浏览 3
提问于2020-12-08
得票数 0
1
回答
如何将文件保存到包含“&”等特殊字符
的
路径中?(“&”与英文键盘中键入
的
“&”不同)
、
、
我需要将一个文件写入包含R中一个特殊字符
的
特定路径,路径类似于:C:/Users/Technology & Innovation/
Webscraping
files/US_data/data我发现“&”和“&”有细微
的<
浏览 2
提问于2020-11-12
得票数 2
1
回答
如何使用<p>标记查找BeautifulSoup4
的
内容?.content和.string对此标记无效。
、
、
、
我一直在用
webscraping
在
Python
中使用BeautifulSoup4进行实验,而且我很难找到我已经能够使用<p>很好地找到tag = soup.find('p', attrs={'class':'uppercase', 'data-message-lang-key':'statusMessageKey
浏览 0
提问于2018-12-27
得票数 0
回答已采纳
1
回答
用于
天气值
的
Python
,
WebScraping
、
、
文件"weather.py",第9行,在request =urllib2.Request(站点,headers=headers) NameError:名称'urllib2‘未定义 # import librariesfrom bs4 import BeautifulSoup
浏览 0
提问于2018-10-23
得票数 0
1
回答
了解在
python
中是否访问了外部url。
、
、
、
我想用
python
构建一个
webscraping
应用程序,以了解我
的
域之外
的
url是否被访问。我是否可以使用flask端点执行此
操作
?
浏览 0
提问于2020-05-03
得票数 0
2
回答
如何在此处从<sup>text文档批量
删除
整个html
如何从<sup>text here</sup>文档中批量
删除
整个上标
字符串
。<sup>
标签
用于
脚注,有900多个,但我想从文档中完全
删除
它们。我使用
的
是Linux和Windows,所以哪种
操作
系统都能完成这项工作。
浏览 16
提问于2020-06-30
得票数 0
回答已采纳
1
回答
我如何从一篇文章中抓取所有段落,而不仅仅是一个段落?
、
、
这里
的
初学者。 我刚刚开始学习
Python
,我正在学习网络抓取,我想抓取每一段,然后将它们写在文本文件或csv上。每个段落都有相同
的
标签
名,所以我认为for循环会遍历该名称
的
每个标记,并从每个
标签
和中提琴中获取文本!除了它只显示第一段15+次数..。我认为它这么做
的
原因是因为它抓住了第一个
标签
,就像我告诉它
的
那样,并且打印相同
的
标签
,和它
的
名字一样
的
其他
标
浏览 11
提问于2021-01-02
得票数 0
回答已采纳
6
回答
如何使用正则表达式在
python
中
删除
字符串
中
的
标签
?(不是HTML格式)
、
、
我需要在
python
中
删除
字符串
中
的
标签
。<FNT name="Century Schoolbook" size="22">Title</FNT>
删除
两端
的
整个
标签
,只留下"Title“
的
最有效
的
方法是什么?我只看到过使用HTML标记来实现这一点
的
方法,而这在
python
中并不适用。我特别将其<e
浏览 0
提问于2010-09-08
得票数 15
回答已采纳
2
回答
用
Python
和selenium抓取URL
、
、
、
我正在尝试让
python
selenium脚本工作,它应该执行以下
操作
: url = scrape_url() boo
浏览 0
提问于2019-09-08
得票数 2
回答已采纳
1
回答
如何将音乐上传到像spotify,itunes这样
的
网站
、
、
我想编写一个
Python
应用程序,它可以自动化音乐或播客到iTunes、Spotify和其他流平台
的
上传过程。它应该把音乐放到我
的
目录中,然后上传到这些平台上(最终让这些媒体赚钱)。我已经检查了iTunes和Spotify
的
官方API,但它们似乎没有上传功能。然而,我见过像这样
的
网站,它声称上传(到多个平台)并将音乐货币化。 如果有人能帮忙解决这个问题,我会很感激
的
。或者告诉我是如何完成这个任务
的
。
浏览 2
提问于2020-08-29
得票数 1
回答已采纳
2
回答
防止WCF调用中
的
XSS攻击
、
、
、
我有一个公开了basicHttp端点
的
WCF服务。在PEN测试中报告了该问题,该服务接受包含脚本
标签
的
字符串
,并返回带有脚本
标签
的
字符串
,当直接
用于
使用它
的
web应用程序时,会导致XSS攻击。我能做
的
就是在每个
操作
实现中写一段代码,使
字符串
成为脚本证明。但是,有没有什么简单有效
的
方法,让我可以编写一段代码,从脚本标记中清除WCF调用中
的
所有传入<
浏览 5
提问于2017-02-09
得票数 0
4
回答
网络抓取NBA比赛结果
、
、
我想在
python
中学习
webscraping
,但我不知道如何或从哪里开始。我
的
代码运行,但它只返回一个空
字符串
。
浏览 9
提问于2021-10-22
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券