腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
LXML.HTML
和
Xpath
的
WebScraping
、
、
我试图从网站上提取信息,但不幸
的
是,我只能获得有限
的
范围。对于接收整个表
的
第一个元素以外
的
其他元素
的
正确
Xpath
,我遇到了问题。为了显示
Xpath
,我
使用
了Chrome DevTools。如何使
Xpath
更通用以获得所需
的
结果?或者有谁知道我怎样才能更巧妙地做到这一点?我
的
目标是稍后获得一个json文件。import requests html
浏览 11
提问于2019-05-03
得票数 0
1
回答
使用
xpath
提取值会产生一些不需要
的
字符串
、
、
、
、
我正在从网页中提取值(
webscraping
)。我可以成功地获得包含所需值
的
行,但是,我希望
的
是值本身。我做得对吗?它真的需要额外
的
分条步骤吗?来自
lxml.html
的
一些方法print (lh.tostring(title[0]))<span class
浏览 5
提问于2019-07-21
得票数 0
回答已采纳
1
回答
webkitbrowser注入javascript修改输入文本值时出错
、
、
、
、
我在
使用
Python2.7中
的
WebkitBrower从网页获取输入文本
的
值时遇到了问题。下面是示例代码:print token 该示
浏览 2
提问于2015-01-01
得票数 1
回答已采纳
4
回答
使用
BeautifulSoup或
LXML.HTML
的
WebScraping
、
、
、
、
我看过一些网络广播,需要帮助才能做到这一点:我一直在
使用
lxml.html
。雅虎最近改变了网站结构。目标页面; //*[@id="main-0-Quote-Proxy"]/section/section/div[2]/section/section/table 然后更多
的
代码如何在所有月份
的
dates....And之间切换。
浏览 0
提问于2011-03-31
得票数 0
回答已采纳
1
回答
python选择没有双斜杠
的
xpath
、
、
然而,在python中尝试
使用
lxml.html
不起作用:import
lxml.html
page= s.get('http://lxml.de/')p=html.
xpath
('p') 这里,p是一个空列表。我需要用p=html.
xpath
('//
浏览 2
提问于2017-09-17
得票数 1
回答已采纳
1
回答
如何
使用
lxml.html
从HTML元素中获取文本
、
、
、
我一直在尝试从<div>页面中获取托管在web元素中
的
全文。的确如此,因为我
的
代码 print(div)Element div at 0x15480d93ac8但是,当我试图
使用
div.text方法获取全文本身时,它返回None 这是一个
浏览 3
提问于2020-05-10
得票数 1
回答已采纳
3
回答
如何
使用
Python
使用
Selenium从多个div类中提取文本
、
、
我试图从中获取文本类
的
价格值for ratevalue in rateText:未发现结果: 回溯(最近一次调
浏览 11
提问于2022-04-21
得票数 1
1
回答
在python 3中找不到含硒
的
元素
、
、
我正在
使用
selenium做一些
WebScraping
,但是检测不到包含
xpath
、完整
xpath
、id或文本
的
元素。<ul></div> 我想从里面获取东西,但是不能,我可以用
xpath
和
id定位到"cbp-vm-switcher“
的
东西。
浏览 10
提问于2021-07-18
得票数 0
1
回答
带有type=html
和
html实体
的
xml
的
scrapy解决方案
、
、
其中一个标签上写着:<p> Some text and stuff </p>此外,我还看到了img
和
一个标记
的
相同
的
是否有泛型
xpath
可以找到img标记或p标记,如:但是很明显,这并不适用于这些ht
浏览 3
提问于2013-10-01
得票数 2
回答已采纳
1
回答
使用
Xpath
单击selenium按钮不起作用
、
、
、
我现在对Selenium
和
webscraping
还不熟悉。我想点击页面上
的
按钮。但是,我
的
程序无法
使用
这个
Xpath
找到它:HTML代码: 我
的
Xpath
有什么问题吗?
浏览 2
提问于2020-04-06
得票数 0
回答已采纳
2
回答
使用
Python通过
XPath
获取元素内容
的
最简单方法是什么?
、
我需要获取此
XPath
的
内容:它是从FireBug复制
的
。我该怎么做呢?我有一个非常大
的
HTML文档,所以我不想(也不知道如何:)对它进行grep。谢谢。
浏览 2
提问于2010-12-24
得票数 0
回答已采纳
1
回答
美丽
的
汤虫?
、
") print type(url)<class 'bs4.element.Tag'> 这意味着,url是标签类
的
对象
浏览 0
提问于2012-07-27
得票数 0
2
回答
如何
使用
选择器获取父标记?
、
、
、
以下是搜索
的
元素:<tr></tr>如果我考虑上面的元素,那么解析父名tr
的
css选择器应该是什么?from
lxml.html
import fromstringitem = root.cssselect("td")[0].text
浏览 2
提问于2017-10-30
得票数 3
回答已采纳
1
回答
刮选器属性
、
、
我
使用
以下网站进行测试:做些测试:response.
xpath
('//div//[@style]/input')[<Selector
xpath
='//div[@style]/inpu
浏览 0
提问于2018-09-24
得票数 0
回答已采纳
1
回答
为什么不能用
lxml.html
解析target.html中
的
所有div元素?
、
、
请下载dropbox中
的
文件并将其另存为/tmp/target.html。 >>> import
lxml.html
>>> d
浏览 0
提问于2018-07-30
得票数 1
2
回答
使用
lxml解析HTML数据
、
、
我是一个编程新手,我
的
一个朋友告诉我
使用
BeautifulSoup而不是htmlparser。在遇到一些问题之后,我得到了
使用
lxml而不是BeaytifulSoup
的
提示,因为它
的
性能提高了10倍。<tr> <td><a href="website1.com">website1<
浏览 1
提问于2011-12-26
得票数 3
回答已采纳
1
回答
如何
使用
python xml.dom.minidom进行getElementsByClassName?
、
、
我想要获得具有特定类
的
所有元素
的
主体。 Python xml.dom.minidom有一个通过id获取元素
的
方法,getElementById(),但我需要获取所有具有特定类
的
元素。注意,如果
使用
minidom不能做到这一点,请提供一个简单
的
替代方案,让我能够获得这个类元素
的
完整内容。我所说
的
完整内容也是指所有的子节点和它们下面的文本,作为一个简单
的
字符串。
浏览 0
提问于2013-06-18
得票数 1
回答已采纳
2
回答
比BeautifulSoup更快/更少资源-从大文件中删除html
的
方法?或者,
使用
BeautifulSoup
的
更好方式?
、
、
、
、
目前,我在输入这个方面有困难,因为根据top,我
的
处理器是100%,我
的
内存是85.7%,所有这些都被python占用了。
浏览 7
提问于2011-01-24
得票数 5
2
回答
XPath
和
html:合并tr-对?(或其文本())
、
这个是可能
的
吗?我有一个<tr>元素
和
XPath
表达式//tr
的
列表。我不想单独返回/匹配每个<tr>元素,而是将第一个元素与第二个元素合并,第三个元素与第四个元素合并,等等。我正在
使用
lxml.html
python包进行html解析
和
xpath
计算。
浏览 17
提问于2022-07-25
得票数 2
1
回答
AttributeError: Web_scraping对象没有属性“_Web_scraping__headless”
、
、
我有一个attributeError AttributeError:'Web_scraping‘对象没有属性'_Web_scraping__headless’import osfrom selenium import webdriver from scraping.browser_manager.automate_browser import Bro
浏览 3
提问于2022-09-11
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券