腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
Beautifulsoup
中
按
部分
文本
搜索
python
、
beautifulsoup
我正在尝试写一个刮板对于网页目录,但在不同的规格表
中
,尺寸是用不同的测量值编写的。例如,长度以米或厘米为单位。Length, m 或者 Length, cm
在
完全匹配的情况下,我可以通过
文本
找到元素: length = props_table.find('span', text='Length, m') 如何修改它
浏览 48
提问于2020-07-21
得票数 0
回答已采纳
2
回答
从HTML页面获取带有特定关键字的<li>
python
、
html
、
beautifulsoup
有没有一种方法可以根据Python
中
包含的单词从HTML页面中提取特定的<li>?例如:让我们使用这个页面:opener = urllib2.build_opener()<li><a href="/wiki/February_21"
浏览 0
提问于2015-06-16
得票数 2
1
回答
如何有效地从使用python的xml中提取<![CDATA[]>内容?
python
、
xml
、
python-2.7
、
pandas
、
lxml
[CDATA[内容]]>解析并提取到列表
中
的最有效方法是什么。让我们说:这就是我试过的:x='/Users/user/PycharmProjects/TratandoDeMejorarPAN/test.xml'o
浏览 2
提问于2015-06-22
得票数 2
回答已采纳
4
回答
BeautifulSoup
查找特定
文本
的所有匹配项
python
、
html
、
parsing
、
beautifulsoup
我将分析许多网站与不同的
BeautifulSoup
,我试图找到所有行,其中包含特定的
文本
(
在
html内)使用html。r = requests.get(url)for text in soup.find_all(): print text 这种方法不起作用(即使
在
html中提到了超过40倍的“
浏览 0
提问于2015-10-17
得票数 2
1
回答
BeautifulSoup
中
的匹配逗号
python
、
regex
、
beautifulsoup
我的审判官:当与一起使用时,它会选择我要查找的区域,该区域位于段落
中
的两个逗号之间: print HTML.body.p.find_a
浏览 2
提问于2013-10-24
得票数 2
回答已采纳
2
回答
BeautifulSoup
:
在
HTML的
文本
部分
中
搜索
和替换
python
、
html
、
regex
、
beautifulsoup
我想对HTML元素的
文本
部分
进行
搜索
和替换。
浏览 7
提问于2022-10-31
得票数 -1
回答已采纳
1
回答
BeautifulSoup
看不到nobr标签
python
、
beautifulsoup
然而,当我尝试执行col[6].string时,nobr标记似乎会导致问题,并且不返回值for r_index,row in enumerate(table.findAll('tr'
浏览 4
提问于2013-03-16
得票数 0
2
回答
在
BeautifulSoup
中
,如何在一个元素
中
搜索
另一个元素?
python
、
django
、
python-3.x
、
beautifulsoup
我使用的是Django 2,Python3.7和
BeautifulSoup
4。headers=settings.HDR)bs =
BeautifulSoup
在
一个元素
中
搜索
另一个元素的正确方法是什么?
浏览 20
提问于2020-03-03
得票数 0
回答已采纳
1
回答
BeautifulSoup
-
在
标签
中
搜索
文本
python
、
html
、
beautifulsoup
from bs4 import
BeautifulSoup
import requestsdef main(): soup =
BeautifulSoup
我设法得到了链接,但是如果没有
在
标签
中
,我如何才能得到它的名字呢?
浏览 4
提问于2022-06-11
得票数 1
2
回答
如何指定所需
文本
并在正则表达式匹配
中
显示该
文本
?
python
、
regex
我一直
在
尝试制作一个简单的Python网络爬虫,并使用正则表达式来查找相关链接。我正在试验的站点是一个wiki,我只想查找URL以/wiki/开头的链接。我可能也会将其扩展到站点的其他
部分
,因此我要求我的代码尽可能地动态。<a\s+href=[\'"]\/wiki\/(.*?)[\'"].*?> 但是,它找到的匹配项
中
不包括/wiki/。我不知道正则表达式的这个属性。理想情况下,因为我可以将其扩展到站点
浏览 0
提问于2012-02-13
得票数 0
回答已采纳
1
回答
无法使find.all(string=‘to’)与
BeautifulSoup
一起工作(Python3.x)
python
、
html
、
python-3.x
、
beautifulsoup
我能够获得页面并解析它,但是当我尝试使用find.all()甚至find()
搜索
string='television'时,import urllibfrom bs4 import
BeautifulSoup
page_link =
浏览 6
提问于2020-01-17
得票数 1
回答已采纳
1
回答
按
文本
正则表达式的
BeautifulSoup
4
搜索
标记
python
、
parsing
、
beautifulsoup
、
html-parsing
我有两个场景,我想要使用正则表达式
按
文本
搜索
标记。soup =
BeautifulSoup
("<B><A NAME="toc96446_13"></A>TEXT </B></P>", "html5lib")我假设这是不起作用的,因为里面的标签实际上包含我的
浏览 0
提问于2018-08-04
得票数 0
1
回答
BeautifulSoup
从
按
标题
搜索
的标签
中
获取
文本
python
、
web-scraping
、
beautifulsoup
我正在废除一个提供不同文档的python网页,我想从它们
中
检索一些信息。文档以两种方式给出了信息,其中一种是这样给出的:Company name: Company name,
在
问题中得到解决;另一种,类似于Title:,然后是一个单独的
文本
块上的所有
文本
,下面是第二个htmldenomination</p> </div> <
浏览 8
提问于2022-11-14
得票数 -1
回答已采纳
4
回答
如果对象也有其他类,Beautiful找不到CSS类
python
、
screen-scraping
、
beautifulsoup
如果一个页面有<div class="class1">和<p class="class1">,那么soup.findAll(True, 'class1')会同时找到它们。
浏览 2
提问于2009-08-07
得票数 40
回答已采纳
1
回答
使用selenium、精美的汤、python进行网络抓取--查找特定
文本
时遇到困难
python
、
html
、
beautifulsoup
我是python和webscraping的新手,我正在尝试从网站上拉出以下
文本
($1.74),以及页面上所有其他相关的赔率: 对于类似的情况,我以前成功地
在
另一个For循环中使用了for循环,但在这些情况下,我是通过“class”进行
搜索
的。我不能在这里
按
类
搜索
,因为有很多其他的‘td’具有相同的类类型,而不是我想要的概率。在这里,我想(我不确定是否可能)通过'data-bettype‘进行
搜索
。我之所以尝试通过它
搜索
,而不是'data compi
浏览 11
提问于2020-06-06
得票数 1
回答已采纳
1
回答
使用
BeautifulSoup
解析<tr>标记,
在
提取值时遇到问题
python
、
beautifulsoup
td></tr>soup =
BeautifulSoup
(data, convertEntities=
BeautifulSoup
.HTML_ENTITIES) print repr(ro
浏览 6
提问于2013-03-14
得票数 0
回答已采纳
1
回答
使用
BeautifulSoup
按
部分
文本
查找HTML元素
web-scraping
、
beautifulsoup
我必须找到包含特定
部分
文本
的所有段落。我发现段落
中
的整个
文本
是这样的每次都会有一个新的日期,所以我必须给出
部分
文本
,比如 element
浏览 0
提问于2018-11-19
得票数 3
2
回答
使用
BeautifulSoup
和Python
中
的lxml删除xml
中
的标记及其内容
python
、
xml
、
parsing
、
beautifulsoup
、
lxml
我正在使用Evernote数据-提取到一个xml文件
中
。我已经使用
BeautifulSoup
解析了数据,这里是我的xml数据的一个样本。</reminder-order><resource>我想在这里探讨两种方法: 1.查找和删除特定的标记(
在
本例
中
) 2.定位一组/多个标记以提取到另一份文档 这是我当前的代码,它解析xml,美化它并输
浏览 0
提问于2013-11-22
得票数 0
回答已采纳
1
回答
如何识别css内联属性
python
、
django
、
beautifulsoup
在
我正在抓取的网页
中
,有很多标题,我需要识别它们,以便在我的数据库
中
设置一个值。问题是这些标题没有特定的ID或类。这是我目前的代码:for tag in soup.findAll(): if tag.name in ['a',
浏览 0
提问于2018-12-12
得票数 0
回答已采纳
1
回答
用
BeautifulSoup
迭代HTML
python
、
html
、
beautifulsoup
我想用
BeautifulSoup
遍历一个超
文本
标记语言文件,找到包含内容的标签“首选名称”这是我要查找的标签:(这是我要
搜索
的文件的一
部分
): <span class="slot_labels"></span>我尝试使用这个(doc是该html文件的名称)进行
搜索
: soup =
B
浏览 0
提问于2013-03-01
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
干了这碗汤,你也可以愉快地爬虫了
2021-09-26:搜索旋转排序数组。整数数组 nums 按升序排列,数组中的值 互不相同。在传递给函数之前,nums 在预
爬虫实战 10分钟爬取当当网所有 Python 书籍
10分钟爬取当当网所有 Python 书籍
Python小项目:答题App小助手
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券