开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

为什么这个XPath查询不能像我假设的那样工作？(搜索带有一些@的元素，而排除带有其他@的元素)

XPath是一种用于在XML文档中定位和选择节点的查询语言。它使用路径表达式来描述节点的位置，并提供了一些函数和运算符来过滤和选择节点。

在这个问题中，XPath查询不能像假设的那样工作的原因可能有以下几个方面：

语法错误：XPath查询可能存在语法错误，导致无法正确解析查询表达式。在编写XPath查询时，需要确保语法正确，并遵循XPath的规范。
元素属性匹配问题：如果要搜索带有某个属性的元素，可以使用@属性名的语法来匹配。但是如果要排除带有其他属性的元素，XPath并没有提供直接的语法来实现。可以考虑使用其他的逻辑运算符和函数来实现这个需求，比如使用not()函数来排除带有其他属性的元素。
XML文档结构问题：XPath查询的结果受到XML文档结构的限制。如果XML文档的结构与查询表达式不匹配，可能导致查询结果为空或不符合预期。需要确保XML文档的结构与查询表达式相匹配。

综上所述，要解决这个问题，可以检查XPath查询语法是否正确，尝试使用逻辑运算符和函数来实现排除其他属性的元素的需求，并确保XML文档的结构与查询表达式相匹配。如果仍然无法解决问题，可以提供更具体的查询和XML文档示例，以便更好地理解和分析问题。

（以上答案仅供参考，具体答案可能需要根据实际情况进行调整。）

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

如何在Selenium WebDriver中查找元素？（一）

如果任何网站具有非唯一ID或具有动态生成的ID，则不能使用此策略唯一地查找元素，而是将返回与定位器匹配的第一个Web元素。我们将如何克服这种情况，将在XPATH / CSS选择器策略中进行说明。...如果不能通过Id / name / link / className / XPATH / CSS检测到特定的Web元素，则该方法未被广泛使用并用作最后的手段。...让我们继续前进，看看如何使用LinkText查找元素通过链接查找文本/部分链接使用这种方法，可以找到带有链接名称或具有匹配的部分链接名称的“ a ”标签（ Link ）的元素。...相反，我们必须使用CSS选择器或XPath选择器。 XPATHSelector XPATH使用标准的XML查询语法，因此更具可读性，学习曲线也不那么陡峭。...但是，CSS选择器虽然具有更简单的语法支持，但不像XPATH和其他文档支持那样是标准的，与XPATH不同。

6K1 0

【Python爬虫实战】XPath与lxml实现高效XMLHTML数据解析

XPath 是一种查询语言，能够通过路径表达式从结构化文档中轻松提取节点和元素；而 lxml 是一个高效的 Python 库，专注于解析和操作 XML 和 HTML 文档。...一、为什么学习xpath和lxml 学习 XPath 和 lxml 的原因主要在于它们在处理和解析 XML 和 HTML 数据方面的强大功能。...以下是详细原因：（一）高效解析和提取数据 XPath 是一种用于在 XML 和 HTML 文档中定位节点的查询语言。它使得我们可以用简单的路径表达式从文档中提取出特定的元素或文本内容。...（五）xpath总结 XPath 是一种功能强大的查询语言，通过路径表达式快速准确地从 XML 或 HTML 文档中选择节点和元素。...通过路径表达式和一些特殊操作符，XPath 可以快速、精准地提取所需的内容。以下是 XPath 的基本语法和常用表达式：（一）基本路径表达式 /：选择根节点。

1381 0

Python：非结构化数据-XPath

bookstore 元素的后代的所有 book 元素，而不管它们位于 bookstore 之下的什么位置 //book 选取所有 book 子元素，而不管它们在文档中的位置 //book/....在下面的表格中，我们列出了带有谓语的一些路径表达式，以及表达式的结果：路径表达式结果 /bookstore/book[1] 选取属于 bookstore 子元素的第一个 book 元素。.../bookstore/book/title | //price 选取属于 bookstore 元素的 book 元素的 XPath 高级用法模糊查询 contains 目前许多web框架，都是动态生成界面的元素...Blog节点值中带有 cn 字符串的Person节点 Xpath表达式：/Root//Person[contains(Blog,'cn')] 2.查询所有Blog节点值中带有 cn 字符串并且属性ID值中有...假设网页的源代码在selector中： data = selector.xpath('//div[@id="test1"]/text()').extract()[0] 就可以把“大家好！”

2.3K3 1

用测试用例设计的路子去学习新知识点。

然后我继续提问：那我们现在开始研究其他用例了，刚刚是 * 作为目标元素排在了xpath表达式的末尾，那我现在如果给移动到中间呢？...，不能总被眼前的一个demo而局限住，要时刻关联到实际场景才行。...知道了这点后，我们可以试着再去推断xpath的搜索原理和一些事实：原理1：xpath的搜索就是在html 中由上至下，一个元素一个元素的拿出来看是不是复合xpath表达式，符合就塞到最终结果列表中...原理2：xpath的复合表达式(复合语句) 中，是没有进行拆开成俩段或多段，然后单独搜索，再把结果汇总到一起的。而是本身就支持这种复合写法，能直接判断一个元素是否符合这个复合语句，并没有拆开。...这样的话，从上到下的搜索只需一遍即可，而不是多遍。事实3：这种复合表达式写法，并非selenium自创，而是xpath本身就支持的。如果是自创，那么底层原理一定是拆开单独筛查然后汇总。

2662 0

Java---XML的解析(2)-DOM4J解析Xpath

目前很多开源框架如struts,hibernate都使用dom4j做为解析其xml的工具。支持文档的读写功能和Xpath快速查询操作。这个需要我们自己把它的包导入myeclipse中的。...Element的一些方法 Element.element(“name”) –此元素下的第一个name元素。...name元素的值转成小写 //book[contains(fn:lower-case(name),’oracle’] 这个稍微了解一下： Xpath处理带有命名空间的XML文档： ?.../xml2/a.xml"); //然后使用带有命名空间的前缀查询即可。...dom.selectNodes(“//a:book”); //带有属性的查询同前 dom.selectNodes(//a:book[@id] //带有元素的查询必须要添加命名空间的前缀 dom.seletNodes

1.5K1 0

Python总结-----爬虫

参考链接网络爬虫是一种按照一定的规则，自动地抓取网络信息的程序或者脚本爬虫有什么用？ ① 网络数据采集 ② 大数据分析 ③ 网页分析什么工作原理？...、python式的函数用来处理导航、搜索、修改分析树等功能。...//book 选取所有 book 子元素，而不管它们在文档中的位置。...bookstore//book 选择属于 bookstore 元素的后代的所有 book 元素，而不管它们位于 bookstore 之下的什么位置。...实例在下面的表格中，我们列出了带有谓语的一些路径表达式，以及表达式的结果：路径表达式结果 /bookstore/book[1] 选取属于 bookstore 子元素的第一个 book 元素。

1.5K1 0

为什么react元素有个$$typeof 属性

，我们把这个对象叫做React元素。...为什么会有个Symbol作为值？这个也是你在写react的时候不需要知道的一件事，但是如果你知道了，那感觉会很棒。在这篇文章中还有一些你可能想知道的安全性的提示。...这就是为什么像React这样的现代库在默认的情况下为字符串转义文本内容的原因： {message.text} 如果message.text是带有或其他的标签，则它不会变成真正的标签...React有一些有效的用例来支持像我刚刚上面所做的那样编写的普通元素对象。当然，你可能不希望像这样编写它们 - 但这对于优化编译器，在工作程序之间传递UI元素或者将JSX与React包解耦是有用的。...因此，即使服务器具有安全漏洞并返回JSON而不是文本，该JSON也不能包含Symbol.for('react.element')。

1.8K3 0

Python带你薅羊毛：手把手教你揪出最优惠航班信息

它会搜索一个“弹性”的日期范围，以便查找在你首选日期前后 3 天内的航班信息。尽管这个脚本一次只能查询一对目的地（出发-到达），但你很容易就能对它进行调整，以在每个循环内运行多次。...当我第一次开始做网络抓取工作的时候，我对这个方面……并不是太感兴趣。没错，这是真心话。我那时候更希望搞些预测性的建模，或是金融分析，甚至一些语义情绪分析之类的“高级”项目。...在这个过程中，我也考虑过 Momondo、Skyscanner、Expedia 以及一些其他的网站，不过对初学者来说，这些网站的人机验证实在是……比较无情。...没错，已经有更先进的方法来寻找更便宜的机票，然而我只希望我的文章能给读者带来一些简单而实用的东西。...请记住，带有 A 的变量与行程第一段相关，而 B 与第二段相关。让我们看看下一个函数吧。 06 什么，还有其他函数？是的。

1.3K2 0

年轻人的第0条爬虫 | 如何最快理解工具思维_以八爪鱼为例

XPath教程 https://www.w3school.com.cn/xpath/index.asp 0.3 勇敢的心 • 善用搜索引擎有问题先尝试查询可能已有的解答，你踩过的坑大概率有前人踩过。...而八爪鱼模仿人的视野选择判断哪些数据是要收集的，再用人的方式完成滚动加载、点击按钮、翻页等操作。本质上爬虫只是代替人意志的工具人，任劳任怨地帮你把重复性工作高效完成。...自动识别网页主要是总会在一些比较奇特的结构部分出错，这时候就需要手工改正，主要会观察xpath的路径是否被软件识别错。自动识别得到的xpath一般是用固定序号编写的，比较死板。...列表中的每一项使用 • 以下直接引用定义 HTML元素是块级元素，它是可用于组合其他 HTML 元素的容器。元素没有特定的含义。...一个 HTML文档中不能存在多个有相同 id 的元素。

9531 0

12306自动刷票下单-查票

当然Chrome我也没卸载，因为Chrome上有个很赞的功能，在元素界面查找元素的时候可以用css和xpath，可不是右键copy里面的css和xpath哦 ?...图片.png 在这个查找框里你就可以写自己的css和xpath，看实时效果，这个真是太棒了，不用装额外的插件。...图片.png 卧了一个槽，忽略我上面说的吧，要写博客了，有一个请求Firefox竟然不给显示了，还是虚拟机吧 ---- 后记后记为什么要加载前言后面，而不是在文章最后，我怕你不看。...图片.png 看到了车次G101，8、9是开车时间和到达时间，10是历时，商务座特等座9张余票，32行显示9，一等二等座都是有票，对应30、31，就不能具体确定了，暂时先不管，至少我们确定了这个请求是查询出我们需要的车票信息了...图片.png 然后把大部分我们需要的参数都对应出来，这样就看到像我上面写的函数那样，取出我们需要的信息其实有一种更简单的方式，就是你查询了余票信息以后，会看到余票几张几张，然后去对应的信息参数中去找

1.3K8 0

软件测试|AppCrawler 自动遍历测试实践

图片上两篇文章介绍了自动遍历的测试需求、工具选择和 AppCrawler 的环境安装、启动及配置文件字段基本含义，这里将以实际案例更加细致的说明配置文件的用法和一些特殊场景的处理。...='true']", action: click }blackList：黑名单，将不想要被点击的元素加入黑名单中配置文件原始写法如下，表示将带有2位数字的排除在外，可能是App中包含了很对关于股价展示的...，这个就可以借助lastList来完成，让元素在点进标签页后的内容为最后遍历lastList: - { xpath: "//*[contains(@resource-id,'ti_tab_indicator...tag 页内部来找标志控件了，我们发现在“股票”和“用户”页中搜索出来的结果名称的 id 是不同的：图片图片3）上面介绍过了 defineUrl 是取的 text 属性值作为标志区分，所以这里取股票页的第一个元素...答：顺序是这样排列的firstList[0]firstList[1]排除lastList firstList之后剩下的元素lastList[0]lastList[1]backbuttonAppclawer

9483 0

Xml基础03

SelectNodes(string）选择匹配 XPath 表达式的节点列表适用于： XmlDocument XmlElement XmlAttribute XPath Xml文档查询语言用于从...XML 文档中选择节点集目标（假设当前节点是book节点） XPath 举例选择当前节点 ....) text() 在当前文档中选择带有特定名称的所有节点，例如选择所有 author节点 //author 在当前文档中选择带有特定名称和特定父节点名称的所有节点，例如选择所有父节点是book，节点是author...XmlTextReader：提供了对XML文件的快速，只向前的访问。XmlTextReader的技术类似于读取其他任何文件，先打开文件，读取文件，直至文件结尾，后关闭文件。...适用于处理数据流，即随着数据的流动而依次处理数据。

1821 0

利器 | AppCrawler 自动遍历测试实践(三)：动手实操与常见问题汇总

='true']", action: click } blackList：黑名单，将不想要被点击的元素加入黑名单中配置文件原始写法如下，表示将带有2位数字的排除在外，可能是App中包含了很对关于股价展示的...，这个就可以借助lastList来完成，让元素在点进标签页后的内容为最后遍历 lastList: - { xpath: "//*[contains(@resource-id,'ti_tab_indicator...tag 页内部来找标志控件了，我们发现在“股票”和“用户”页中搜索出来的结果名称的 id 是不同的： 3）上面介绍过了 defineUrl 是取的 text 属性值作为标志区分，所以这里取股票页的第一个元素...'true']//*", action: click } 5）另外我们之前在 selectList 中写了 clickable=true, 而 clickable=true 通常只是布局元素，布局元素一般是没有任何属性的...答：顺序是这样排列的 firstList[0] firstList[1] 排除lastList firstList之后剩下的元素 lastList[0] lastList[1] backbutton Appclawer

7171 0

Python的Xpath介绍和语法详解

选取当前节点的父节点 @ 选取属性 //div[@id] 选择所有带有id属性的div元素 <div id="sidebar" class="sidebar" data-lg-tj-track-code...模糊匹配 //div[contains(@class,'f1')] div的class属性带有f1的通配符 * //body/* body下面所有的元素 //...div[@*] 只要有用属性的div元素 //div[@id='footer'] //div 带有id='footer'属性的div下的所有div元素 //div...也可以百度搜索XPath语法 ....这个是C编写的库，直接pip3 install lxml可能会有一些显示问题，但是不影响使用。

4K4 2

XPATH定位(基础篇)

，我们真正需要熟练掌握的是通过xpath和css定位，一般只要掌握一种就可以应对大部分定位工作了下面总结一下xpath的定位方法，结合自己练习的实例加深一下了解 xpath的概念和基本语法网上关于.../xpath/index.asp XPATH中一些常用的路径表达式 · 图片来源 w3cschool 一些路径表达式实例及对应的结果 · 图片来源 w3cschool 一些带有谓语的路径表达式及对应的结果...标签名[contains(@属性, '属性值')]" 4.如果一个元素无法通过自身属性直接定位到，则可以先定位它的父(或父的父，它爷爷)元素，然后再找下一级即可例如定位『百度搜索框』，可以按照此种方式试验一下...(主要是看一下这个思路) 百度搜索框对应标签，定位标签的话，可以先定位标签，再定位标签的子元素标签，最后找到标签...还有当定位失败时不要慌，找下原因，眼见不一定为实像上面定位百度搜索框时，通过id属性没有定位到标签，查看通过webdriver打开的网页元素时，发现标签的id属性没了，只有

5641 0

一键自动化博客发布工具,用过的人都说好(公众号篇)

点击图文消息到了首页之后，我们就可以点击图文消息这个按钮，开始我们的创作了。公众号的图文消息实现的比较复杂。我们只能通过xpath来定位到这个元素。...这里的文章内容居然是一个嵌入的iframe：说不上为什么，但是总是感觉怪怪的。...当然，这种就不能像传统方式那样来设置内容了。我们只能使用拷贝粘贴的方式。另外，微信公众号不能识别markdown，所以我们必须把markdown转换成为html。...time.sleep(2) # 等待2秒 driver.switch_to.window(driver.window_handles[-1]) time.sleep(1) # 等待1秒 # 不能用元素赋值的方法...]')send_button.click()总结公众号的基本功能完成了，实际上还有一些细节内容并没有实现。

3310 0

【译】为什么React元素里拥有$$typeof属性？

为什么他的属性是一个Symbol值？这是另一件你使用React时不需要知道的事情，但是当你知道了你会收获良多。这些也是一些你可能想知道的安全相关的贴士。... {message.text} 如果message.text是带有或其他标记的恶意字符串，则它不会变成真正的标记。...React有一些有效的例子来支持像我刚刚在上面做的那样编写的普通元素对象。...因此，即使服务器具有安全漏洞并返回JSON而不是文本，该JSON也不能包含Symbol.for（'react.element'）。...React仍然在元素上包含$typeof字段以保持一致性，但它将被设置为一个数字 ---- 0xeac7。 为什么会是这个数字？因为0xeac7看起来有点像“React”。。。

7631 0

从零开始学XML(修订版)

元素中需要值得注意的地方： XML元素中的出现的空格和换行都会被当做元素内容进行处理每个XML文档必须有且只有一个根元素元素必须闭合大小写敏感不能交叉嵌套不能以数字开头看起来好像有很多需要值得注意的地方...---- 查询现在我要做的就是：读取guangzhou这个节点的文本内容！...而SteamResult实现了Result接口，有人也会想，DomResult也实现了Result接口啊，为什么不用DomResult呢？...：读取XML文档的数据，都是通过Document获取根元素，再通过根元素获取得到其他节点的，从而进行操作！...这个OutputFormat就可以让我们更新XML文档时也能带有格式！

2K2 0

爬虫0040：数据筛选爬虫处理之结构化数据操作

例如，“o{1,3}”将匹配“fooooood”中的前三个o。“o{0,1}”等价于“o?”。请注意在逗号和两个数之间不能有空格。 ? 当该字符紧跟在任何一个其他限制符（*,+,?...，{n}，{n,}，{n,m}）后面时，匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串，而默认的贪婪模式则尽可能多的匹配所搜索的字符串。例如，对于字符串“oooo”，“o+?”...预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始。 (?!...*l') # 展示数据 >>> r.search(s).group() # 展示得到的数据，显然匹配的数据中包含了其他数据 'lelo worl' # 那么，下面这个例子，貌似更加实际 >>> html...较低那么为什么要用BS4呢？

3.2K1 0

数据技术|爬虫一下，百度付费文档轻松得，不用花钱，不用花钱，不用花钱！！！

而另一些勤勤恳恳的人，则会选择上传文章，慢慢攒下载券。任劳任怨的人，则会自己一点一点的复制粘贴，复制到word里文字太大，那就复制到txt文件里。...而既不想花钱又不想攒下载券，也不想一点一点复制粘贴的人，会选择“冰点文库”这样的下载软件，不过貌似现在“冰点文库”已经不能使用了。但这些都太麻烦了，用爬虫就可以轻松搞定付费文档的文字部分内容。...然后我们输入文本再模拟点击了回车，就像我们敲击键盘一样。我们可以利用Keys这个类来模拟键盘输入。最后也最重要的一点是可以获取网页渲染后的源代码。通过输出page_source属性即可。...不过我还是太小看百度文库的前端工程师了，这个继续阅读的按钮并不能通过selenium访问，因为它调用了js代码里的功能，而js代码我们很难找到是哪一个。...();' driver.execute_script(js) 这样就搞定了，如果大家写其他爬虫时不能直接模拟一些操作，那么就可以考虑是不是要调用js,这个方法还是屡试不爽的。

57.5K9 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭