首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

五、XPath实战:快速定位网页元素

分析网站本节我们来爬取豆瓣电影,在实战开始前,我们需要搞懂爬取的流程,在清楚爬取的步骤后,我们方可事半功倍导入需要的库分析获取网站URL获取HTML页面etree解析使用Xpath插件进行测试标签编写Xpath...start={}'.format(i) urls.append(url)获取每页URL中的影评URL接下来我们需要获取每页中影评的具体URL右击鼠标点击检查,我们就会看到具体的URL,为了测试Xpath...语法,我们需要打开Xpath插件(本文结尾我会奉上下载链接)不难分析此URL可以从,总的h2标签下的,a标签中的,href属性下手detail_urls = []for d_url in urls:...,原因如下,前面有一些无用的数据,需要清除获取评论者和评分commenter = html.xpath('//header/a/span/text()')[0]rank = html.xpath('//...提取数据返回结果是列表,后续操作需要使用列表操作总结Xpath的主要流程可以用下图表示Xpath插件链接:https://pan.baidu.com/s/1Pn3dmJgJADIUKcjsDs8cJw?

27680

xpath定位随机元素之starts-with的用法

相信有一部分朋友在做UI自动化的时候,会遇到有些元素,明明这次定位到之后,到时重新进入页面,里面的元素值就变样了。...下面我们来看看如何定位随机生成的元素~~ starts-with 如图,这个是我们公司的项目,在处理一个勾选框的时候,里面的id元素是随机生成的,我们可以使用xapth中提供的starts-with方法...//标签名[starts-with(@元素名, '元素值')] //div[1]/div/div[3]//li[starts-with(@id, "cascader-menu")][1] 我们可以看到...找元素内容从“cascader-menu”开始的元素 ends-with xpath中也提供了ends-with的方法,使用方法跟starts-with相同,它是以某字符串结尾的元素。...conatins //div[1]/div/div[3]//li[contains(@id, "cascader-menu")] [1] 使用xpath中的contains方法,也是可以的~大家可以根据需要结合使用

1.7K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    web自动化02-常见元素定位(不含xpath和css)

    1、熟悉前端基础 代码和元素是一一对应关系,程序需要通过代码中的某些特征,获取目标元素并进行操作 标签名     key = value      元素的属性和属性值 2、浏览器开发者工具 目的:获取目标元素在页面内代码的相关信息的时候使用...XPath(通用) CSS(通用) ① 元素定位方法—id方法   id定位就是通过元素的id属性来定位元素,id必须是唯一的,前提:元素有id属性   当元素存在id属性时,优先使用id方法定位元素....send_keys("内容") ②元素定位方法—name方法   name定位就是根据元素name属性来定位,name的属性值是可以重复的,前提:元素有name属性   由于元素的name属性值可能存在重复...1、使用name定位,输入用户名:admin 2、使用name定位,输入密码:123456 3、3秒后关闭浏览器窗口 注意:当页面内有多个元素的特征值是相同的时候,定位元素的方法执行时,默认只会获取第一个符合要求的特征对应的元素...元素定位方法—class_name方法   class_name定位是根据元素class属性值来定位元素,class定义元素的样式   前提:元素有class属性   注意:如果class有多个属性值,

    20830

    XPath元素定位常用的5种方法(相对路径)

    一、XPath定位 定位 说明 //ul/* ul的所有子元素 //input[2] 第2个input元素 //input[last() 最后一个input元素 input[position()< 3]...=属性值]1、使用标签名+节点属性定位 2、组合元素索引(下标)定位 find_element_by_xpath("//*[@id='J_login_form']/*/*/input[2]") 3...二、XPath定位验证 1、验证XPath定位元素是否正确,可以在Google Chrome的elements或console中进行验证 在需要定位的页面,按F12后,切换至elements列下,按下Ctrl...+f键,输入XPath表达式 在需要定位的页面,按F12后,切换至console列下,输入表达式。...语法是:$x("your_xpath_selector") 2、表达式正确,元素定位正确时,会查找出该元素,如下图: 3、未定位准确,找不到该元素,查找结果为空,如图: 4、表达式不正确,无法正常识别情况

    6.3K30

    XPATH讲解

    简介 遇到了好几次'XPATH'这个词,近日在学习ChormeDev(谷歌浏览器开发者工具)又遇到,故特意了解学习。 XPath 是一门在 XML 文档中查找信息的语言。...XPath 用于在 XML 文档中通过元素和属性进行导航。(摘自w3school) 通俗说,是XML语言中通过路径(特俗的路径)寻找标签的方法。...XPath 使用路径表达式在 XML 文档中进行导航。 XPath 包含一个标准函数库。 XPath 是 XSLT 中的主要元素XPath 是一个 W3C 标准。...注释:假如路径起始于正斜杠( / ),则此路径始终代表到某元素的绝对路径! body/div 选取属于 body 的子元素的所有 div 元素。...div//input 选择属于 div 元素的后代的所有 input 元素,而不管它们位于 input 之下的什么位置。

    69910
    领券