腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2446)
视频
沙龙
1
回答
利用
漂亮
汤
从
网页
表格
中
提取
文本
信息
、
、
我有一个来自
网页
的
表格
,我正试图
从
其中
提取
文本
数据。 HTML
表格
的一个片段如下所示: ? 你可以看到下面的
表格
标题‘生效日期’,‘类型’,‘备注’,我想要从中
提取
文本
数据。我使用了以下代码来尝试
提取
数据: content = driver.page_source
浏览 20
提问于2021-01-20
得票数 0
1
回答
如何在python
中
获取html页面中
文本
的偏移量
、
、
我正在做一个
网页
抓取,以
提取
一些
文本
使用美丽的
汤
。请提供您的想法和建议... 谢谢
浏览 5
提问于2016-06-08
得票数 2
1
回答
美丽的
汤
获取图片和谷歌表单
、
、
、
我试图使用
漂亮
的
汤
解析以下站点:如果有
漂亮
的
汤
,这有可能吗?
浏览 3
提问于2017-04-01
得票数 0
回答已采纳
1
回答
Python是包装器吗?
简单地
从
网页
中
提取
信息
的Python脚本(例如,使用
漂亮
的
汤
)会被称为包装器(参见https://en.wikipedia.org/wiki/Wrapper_(数据)_(采矿) )吗?
浏览 0
提问于2017-03-13
得票数 2
2
回答
无法输入世界人口数字('https://countrymeters.info/en')‘
、
我试图
从
网站的中导入世界人口数据,但无法使用Python导入 感谢和非常感谢帮助!
浏览 10
提问于2022-06-02
得票数 0
回答已采纳
1
回答
抓取和比较与Web页面数据
、
、
我有一个
网页
,数据在不同的
表格
中
。我想
提取
一个特定的表,并与excel表进行比较,看看是否有任何差异。请注意,该
网页
位于内部域中。我尝试了请求和
漂亮
的
汤
,但我得到了401错误。
浏览 11
提问于2020-01-23
得票数 1
1
回答
JSON行中断Python
中
的空白
、
、
version), params=payload) return json_data 我请求的数据返回得很好,我已经知道了如何像我想要的那样
提取
文本
参数唯一的问题是我想保留段落中断,但是下面的article_text只是忽略段落中断的所有
文本
。是否有一种使用json的标准方法,或者它完全依赖于我正在使用的API?谢谢你的帮助,我刚认识蟒蛇!
浏览 1
提问于2015-03-17
得票数 1
回答已采纳
1
回答
如何通过API
从
维基百科页面中
提取
WikiTables?
、
我试图
从
维基百科页面中
提取
每个
文本
内容,包括
表格
,使用上的维基百科页面的应用编程接口沙箱。https://en.wikipedia.org/w/api.php?action=query&format=json&prop=extracts&titles=Ballon_d%27Or&explaintext=1&exsectionformat=wiki 但它只提供
文本
内容,而不提供来自wiki表的内容,如下所
浏览 1
提问于2017-03-18
得票数 2
1
回答
查找两组字符串之间的字符串(python / urllib2 /
漂亮
汤
)
、
、
我有以下
网页
网页
的源代码,我正试图
从
<a href="...Reviews-WHATIWANT-City..." target="_blank"onclick="XX;">1,361 reviews</a>编辑(用
漂亮
的
汤
): 为了
提取
这些
信息
,我使用
浏览 2
提问于2016-01-07
得票数 0
回答已采纳
2
回答
抓取特定
文本
的
网页
(字符串)
我试图抓取
网页
的
信息
,只有当一个特定的
文本
字符串存在。我只是使用了
漂亮
的
汤
,但找不到包含我正在寻找的
文本
的元素。经过更多的研究,我尝试使用selenium,因为我知道一些动态加载的元素在
漂亮
的
汤
中
是找不到的。到目前为止,我仍然找不到
文本
字符串。当我检查元素时,
文本
是可定位的。TLDR:我想要抓取这个
网页
的每股价格,因为我可以找到‘公开发行价格’的
文本
。我不能找到字
浏览 0
提问于2020-06-06
得票数 1
1
回答
缺少一些html
表格
标记的
漂亮
汤
、
我正在尝试从一个网站中
提取
数据,使用
漂亮
的
汤
来解析html。我目前正在尝试
从
以下
网页
获取
表格
数据: soup = BeautifulSoup(fh, 'html.parser你知道它是
从
哪里来的吗? 谢谢
浏览 22
提问于2016-09-12
得票数 0
1
回答
如何在网络刮刀
中
获取POST请求的结果?
、
、
、
我正在尝试从中
提取
数据。因此,不可能仅仅通过跟踪链接来获取
信息
有什么解决办法来执行javascrip
浏览 2
提问于2016-08-08
得票数 0
回答已采纳
1
回答
可以使用优美的
汤
找到隐藏的其他包装元素吗?
、
、
我想
提取
的
文本
数据,作者从属关系在这个
网页
上使用美丽
汤
。是否有一种方法只使用
漂亮
的
汤
来
提取
这些
信息
,还是需要selenium或类似的东西来显示HTML代码
中
的元素?
浏览 3
提问于2021-12-23
得票数 2
回答已采纳
1
回答
从
刮过的HTML
中
删除重复的子字符串/元素?
、
、
、
、
我
从
Kindle的书中
提取
了一大堆HTML。它有很多重复的元素和重复的子字符串。 长话短说,Kindle删除了我90%的注释,我使用了它没有删除的位置数据来将其全部取回。
浏览 4
提问于2015-06-25
得票数 0
回答已采纳
3
回答
我不能使用不同的函数
从
美丽的
汤
蟒中
提取
数据并过滤掉
、
、
、
我试图
从
网站获得请求
文本
,并使用美丽
汤
过滤掉数据。但是当我编写这段代码时,它给了我一个错误,我无法运行它,请帮助。 print soup.title return bs4() 我想从网站中
提取
数据,
利用
不同的功能通过
漂亮
汤
运行数据。
浏览 1
提问于2019-04-02
得票数 0
回答已采纳
1
回答
如何使用python和
漂亮
汤
从
嵌入到html
中
的excel
表格
中
提取
数据?
、
、
所以我有了
从
网页
上的
表格
中
提取
数据的想法,这样我就可以对它进行平均,直观地表示它,并使用它。我尝试过使用python和
漂亮
的
汤
来获取数据,但我最终还是会遇到像这样的请求
中
奇怪的excel格式化代码:<meta name=Generator content="Microsoft Excel 14"> 如何才能以一种有意义的方式
提取
浏览 0
提问于2013-11-21
得票数 1
2
回答
如何
从
Json中
提取
信息
、
我想知道如何使用请求库
从
Json
中
的字段中
提取
文本
?我就不需要
漂亮
的
汤
了对吧?
浏览 6
提问于2015-03-28
得票数 0
回答已采纳
1
回答
有没有可能用
漂亮
的
汤
刮出一个“动态
网页
”?
、
、
、
我现在开始用
漂亮
的
汤
来抓取网站,我想我已经掌握了基本的知识,虽然我缺乏
网页
的理论知识,但我会尽我最大的努力来表达我的问题。我所说的动态
网页
是这样的:一个网站,它的HTML会根据用户的动作而改变,在我的例子
中
,它是可折叠的
表格
。我想获得一些"div“标签
中
的数据,但是当你加载页面时,数据在html代码
中
似乎是不可用的,当你点击
表格
时,它会展开,这个"div”的"class“
从
类似于&quo
浏览 1
提问于2016-11-22
得票数 4
1
回答
从
网站上的
表格
中
获取数据
、
、
、
、
我需要帮助
从
网页
上的
表格
中
提取
或报废数据。我正在用
漂亮
的
汤
。无法
提取
第6号表的
表格
。如有任何帮助,将不胜感激: 需要表-6
中
的所有行数据。在一个
网页
中有几个表,但是我需要数据,因为只有法规
信息
不知道怎么做。
浏览 1
提问于2018-05-16
得票数 1
回答已采纳
1
回答
一个页面的源代码和firebug可以看到的数据之间有什么区别?
、
我试图从一个
网页
上抓取数据,而firebug显示了我想要
提取
的数据,但是当我右键单击“显示源代码”时,它没有显示在源代码
中
。casper有casper.GrabHTML方法吗,比如机械化和
漂亮
的
汤
?,它将获得所有dom元素,如clsses、href、链接、按钮、
文本
等。
浏览 2
提问于2014-05-22
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python抓取网页数据的终极办法
一款C#开发的窗口文本提取开源软件
AAAI 2017 牛津大学:网络事件提取中结构和文本特征的联合学习
python教程|如何批量从大量异构网站网页中获取其主要文本?
一文看懂什么是文本挖掘
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券