腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
为什么
BeautifulSoup
发现
保持
返回
的
元素
的
类
id
与我
传递
的
不同
?
、
、
、
我正在尝试使用
BeautifulSoup
来解析包含一篇韩国新闻文章
的
iframe,并打印出文章中每个单独
的
正文段落。因为韩语段落内容位于其自己
的
td标记中
的
p标记中,并且
类
id
为"tlTD",所以我想我可以使用该类名遍历每个td并打印p标记,如下所示: link ="https://gloss.dliflc.edu/我尝试使用lambda表达式和正则表达式来使
类
名更具排他性,但我总是得到相同<
浏览 16
提问于2019-06-27
得票数 1
回答已采纳
1
回答
不管CSS
类
元素
输入到
BeautifulSoup
的
find_all()函数,我收到一个空列表作为输出
、
、
、
": "table_result"}) 我试图在Ensembl网站()上搜索我们在测序数据中
发现
的
基因,这些基因是不加注释
的
,然后对它们进行一些后续
的
搜索和数据处理。我只是不能让我
的
刮刀
返回
任何东西,从我
的
find_all()空名单。,也包括多个
不同
的
CSS
类
元素
。如果我只是定义了一个像HTML5那样
的
"div"
元素</em
浏览 1
提问于2020-07-13
得票数 2
回答已采纳
1
回答
用硒和美丽
的
汤刮网却不起作用
、
、
我试图从一个网站获得作者和评论
的
内容,但我
发现
它
的
页面来源和检查
元素
是
不同
的
。我试着使用
BeautifulSoup
,但是我无法从它得到任何东西。我检查网站中
的
元素
,并使用Selenium输入
类
名,但仍然不能
返回
任何内容。这是我写
的
代码。
浏览 3
提问于2021-01-25
得票数 0
回答已采纳
1
回答
如何使用
BeautifulSoup
抓取Instagram
、
、
、
、
使用Chrome上
的
元素
检查器,我注意到图片在无序列表中,李有
类
“照片”,所以我想,到底什么--不可能很难与findAll擦肩而过,对吧?错误:它不
返回
任何东西(下面的代码),我很快就注意到,,
元素
检查器中显示
的
代码和我从请求中提取
的
代码,
与我
从请求中提取
的
代码中
的
AKA无序列表
不同
。 知道怎样才能得到
元素
检查器中显示
的
代码吗?为了记录在案,这是我要启动
浏览 3
提问于2013-08-08
得票数 12
回答已采纳
3
回答
用美丽汤获取“名称”属性
、
、
from bs4 import
BeautifulSoup
<a href="#" name="Two"></a>""" print soup.a['
浏览 4
提问于2013-10-24
得票数 2
回答已采纳
1
回答
oAuth多个
返回
url
、
我正在我
的
网站上做oAuth登录。当我在做facebook时,我
发现
我可以动态地给出一个
返回
的
urls。但是当我使用google时,我
发现
我
传递
给google
的
返回
url必须
与我
在google上所做
的
设置相匹配。谢谢,罗恩
浏览 0
提问于2014-07-10
得票数 0
3
回答
HTML标记之间
的
Selenium
、
、
、
将Javascript创建
的
页面中
的
所有超文本标记语言
传递
给
BeautifulSoup
的
最佳方法是什么?我目前使用
的
是:from selenium.common.exceptions import NoSuchElementExceptionfrom selenium.webdriver.common.keys import Keys from
BeautifulSoup
import
Beaut
浏览 1
提问于2012-10-13
得票数 2
2
回答
添加到Python列表
的
空值
、
只有在第三次迭代时,我想要
的
值才会被添加。仅供参考:这只是一个片段,上面提到
的
一些行可能因此看起来毫无意义。然而,代码
的
这一部分正是我不正确
的
值
的
来源。from bs4 import
BeautifulSoup
bucket = [] stock = ['x','y',&
浏览 1
提问于2015-07-25
得票数 0
1
回答
BeautifulSoup
:如何获得嵌套
的
div
、
、
给定以下代码:<body> <div class="category2"
id
="bar">category5"> test </div></d
浏览 0
提问于2014-10-29
得票数 6
回答已采纳
1
回答
没有提取所有数据
、
、
、
目前,我希望从URL html中提取特定
的
发行者数据,并使用Beautiful从卢森堡证券交易所获得一个特定
的
类
和
ID
。我试过使用
类
-描述-内容-文本,但它似乎找不到任何数据,因为当查看汤时,并不是所有的html被拉出来。from bs4 import
BeautifulSoup
URL = "https://
浏览 3
提问于2021-04-12
得票数 0
13
回答
美汤与按
ID
抽取div及其内容
、
soup.find("tagName", { "
id
" : "articlebody" })soup.prettify() soup.find("div", { "
id
" :
浏览 65
提问于2010-01-26
得票数 188
回答已采纳
3
回答
Python用漂亮汤3抓取:如何从div获取文本
、
、
、
下面是我遇到麻烦
的
HTML,如果我有一个变量里面有汤,如何获得div
的
文本部分?我分别尝试过这些方法中
的
一些。text = div.get_text()text
浏览 7
提问于2017-09-19
得票数 0
回答已采纳
1
回答
我从Python中
的
请求模块获得
的
html代码
与我
从浏览器获得
的
相同网页
的
源代码
不同
。
、
、
、
、
在使用Python中
的
requests.get()方法时,我得到
的
响应对象产生
的
html代码
与我
从浏览器(Chrome)获得
的
源代码
不同
。这使我很难使用
BeautifulSoup
模块解析代码。下面是我
的
python脚本。我从chrome获得
的
网页
的
源代码在r
类
中有一个r
id
,它有一个href链接。所以我想我会得到一个链接。但它一直在
返回
一个空
的
浏览 2
提问于2020-07-31
得票数 0
5
回答
如何将
不同
的
CSS样式应用于两个
类
名相同
的
元素
?
、
我创建了一个有
不同
导航菜单
的
网站。在两个菜单中,我使用相同
的
HTML
类
元素
。 我有一个.css文件,它在1菜单中设置了
类
元素
的
样式。但是,在另一个菜单中,我想以
不同
的
方式设置
元素
的
样式。是的,我知道我可以重命名
类
名,但是为了
与我
现在在标记结构中
的
名称
保持
一致,而且
类
名用于样式多个其他
元
浏览 7
提问于2014-07-16
得票数 13
回答已采纳
2
回答
查找href值,用漂亮
的
汤按
类
过滤
、
、
我有一个有“一个
类
”链接
的
页面源,如下例所示。我想
返回
一个包含所有“href”值
的
列表,所以在下面的"/detail/Request-Technology%2C-LLC-Oakland-CA-94609/napil006/cyberMan”.示例中,我使用了漂亮
的
汤,find_all试图使用‘a class’属性,但是它什么也不
返回
。web-btn-link easy-click" href="/detail
浏览 1
提问于2019-02-24
得票数 0
回答已采纳
1
回答
用Python解析Google文件(lxml,名称空间)
、
、
、
、
我正在尝试使用xml模块将一个文件解析为
BeautifulSoup
(在
BeautifulSoup
中无法实现这一点之后,我使用了
BeautifulSoup
)。由于这是我第一次这样做,所以我遵循了官方
的
,直到我尝试构建一个迭代器来通过根迭代提取数据:tree=etree.parse('kmlfile') 如果您知道您只对单个标记感兴趣,可以将其名称
传递
给getiterato
浏览 5
提问于2016-07-04
得票数 4
回答已采纳
2
回答
我想从
Beautifulsoup
类
继承来完成以下任务
、
、
、
、
我在Python3.5.1和
Beautifulsoup
4上运行。我现在有这样
的
代码:import html5lib print(name) 当我用下面的代码实例化这个
类
时:findmylink = LinkFinder我在我
的</
浏览 18
提问于2016-09-24
得票数 0
回答已采纳
3
回答
使用
BeautifulSoup
4与谷歌翻译
、
、
</span>使用
BeautifulSoup
4,我尝试了
不同
的
选择器,但没有
返回
翻译
的
单词。下面是我尝试过
的
几个例子,但它们根本没有
返回
任何结果:soup.select('span span') 我甚至直接从开发人员工具中复制了选择
浏览 7
提问于2016-07-19
得票数 4
回答已采纳
1
回答
python使用urllib2和cookielib进行身份验证,并获得登录通过/失败结果
、
下面是我用来登录到远程站点
的
代码。我
的
问题是我不知道如何处理身份验证通过/失败
的
结果。self.resp = self.opener.open(self.login_page, self.post_login_data)提
浏览 1
提问于2011-01-16
得票数 1
1
回答
使用ParentElement代替ParentNode
的
实际应用是什么?
、
我正在学习JavaScript,我学习了Node.parentNode属性,它只是
返回
当前节点
的
父节点。然而,JavaScript还有另一个名为Node.parentElement
的
属性,这似乎是一样
的
。我从中
发现
,如果父节点不是
元素
,则parentElement将
返回
null。我理解两者之间
的
区别,但我无法想象这是有用
的
。使用parentElement而不是parentNode是一种好
的
实践吗?如果没有,它
浏览 0
提问于2019-04-26
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python基础入门初识python
使用多个Python库开发网页爬虫(一)
Python爬虫之BeautifulSoup详解
享学课堂浅谈Python3中BeautifulSoup的使用方法
Python爬虫从入门到精通(3):BeautifulSoup用法总结及多线程爬虫爬取糗事百科
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券