社区首页 >问答首页 >从xpath @属性中剥离html标记

问从xpath @属性中剥离html标记
EN

Stack Overflow用户

提问于 2014-06-08 21:35:01

回答 1查看 2.2K关注 0票数 0

我正在尝试使用lxml和xpath从网页中提取一些文本--我需要两个部分

正文：

page = requests.get(url)
pageopen = lxml.html.fromstring(page)

body_one = pageopen.xpath('/html/body//div/div/div//div/p[@class="body"]/text()')

效果很好

第二个文本体(只在鼠标单击后显示)我已经成功地使用了

pageopen.xpath('/html/body//div/div/div//div//span/@data-description')

但返回的文本中仍然含有html垃圾。

使用上述语句上的/text()函数返回一个空列表。

我花了几个小时阅读lxml文档，但这对我来说都是希腊语。

如何从xpath @属性中删除html标记？

python

xpath

lxml

CDN&音视频通信出海专场

提供游戏出海、社交娱乐等方案，助力企业抢占出海市场

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-06-08 21:48:58

但是返回的文本中仍然有html垃圾。

如果您的意思是字符串是HTML，请使用您已经理解的技术从HTML中提取文本：

descriptionHtml = pageopen.xpath('/html/body//div/div/div//div//span/@data-description')
descriptionBody = lxml.html.fromstring(descriptionHtml)
descriptionText = descriptionBody.xpath('text()')

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/24114225

复制

在Ubuntu中修改hosts配置

bash 指令 bash ubuntu linux

最近在使用ubuntu开发,难免需要配置hosts，下面介绍以下使用命令进行配置的操作流程。

程思扬

2022/01/11

20.5K0

在docker-compose.yml中定义命令修改hosts文件

容器镜像服务容器镜像网络域名

因为使用了他人提供的docker镜像，想对其中某个网络操作修改一下，需要修改某域名指向的IP，这就要修改容器内的/etc/hosts文件。又觉得每次重创建docker后手动去修改很麻烦，所以想到在docker-compose.yml中定义该操作。

用户2135432

2023/10/21

7540

Kubernetes在pod中配置hosts解析域名

DNS 解析 DNSPod dns

当 DNS 配置以及其它选项不合理的时候，通过向 Pod 的 /etc/hosts 文件中添加条目，可以在 Pod 级别覆盖对主机名的解析。在 1.7 版本后，用户可以通过 PodSpec 的 HostAliases 字段来添加这些自定义的条目。

聂伟星

2020/09/11

7.2K0

在Ubuntu 20.04中禁用motd欢迎消息

ubuntu root 登录脚本框架

本篇文章重点讲解一下在Ubuntu 20.04中禁用motd欢迎消息具体方法，有需要的小伙伴可以参考一下。

会长君

2023/04/25

2.6K0

Android – 在Gradle中更改APK文件名

android gradle

默认情况下，Android Studio中的Gradle构建命名为.apk文件app-release.apk。对应用程序build.gradle文件进行了一些小的更改，可以将.apk名称更改为<app name>-release-<version>.apk。需要在app的目录下面修改build.gradle文件。第一步是将project.archivesBaseName设置为您的应用程序名称。 android { compileSdkVersion 25 buildToolsVersio

code_horse

2018/07/02

2.9K0

在 .NET 应用程序中运行 JavaScript

.net c#api javascript node.js

前几天我在做一个副业，意识到我需要使用一些 JavaScript 功能。一想到要再次处理 Node.js 和 npm，我就完全放弃了，所以我决定研究一下在 .NET 应用程序中运行 JavaScript 的可能性。很疯狂吧？实际上，这出乎意料的简单。

独立观察员

2022/12/06

2.6K0

在vmware中安装Android

build debug menu vmware 虚拟机

首先可以前往https://osdn.net/projects/android-x86/下载自己喜欢的镜像，这里以安卓9的镜像为例

阿龙w

2022/12/25

2.7K0

Android模拟器修改hosts文件详解

android sdk ide http https

在开发中遇到这样需求，需要在hosts文件中将某个网址域名与其对应的IP地址建立一个关联，比如关联这样一个ip：

全栈程序员站长

2022/11/01

4.1K0

在Android中调用WebService

android php

某些情况下我们可能需要与Mysql或者Oracle数据库进行数据交互，有些朋友的第一反应就是直接在Android中加载驱动然后进行数据的增删改查。我个人不推荐这种做法，一是手机毕竟不是电脑，操作大量数据费时费电；二是流量贵如金那。我个人比较推荐的做法是使用Java或PHP等开发接口或者编写WebService进行数据库的增删该查，然后Android调用接口或者WebService进行数据的交互。本文就给大家讲解在Android中如何调用远程服务器端提供的WebService。既然是调用WebService

欢醉

2018/01/22

2.3K0

【DB笔试面试727】在Oracle中，如何禁用HAIP？

oracle

说明，ora.cluster_interconnect.haip的ENABLED属性的原始值为1：

AiDBA宝典

2020/01/20

1.8K0

在Android中调用WebService

网站 android https java http

全栈程序员站长

2022/07/05

1.9K0

[译] 在 Android Instant App（安卓即时应用程序）中启用 ProGuard （混淆）

android

原文地址：Enabling ProGuard in an Android Instant App 原文作者：Wojtek Kaliciński 译文出自：掘金翻译计划本文永久链接：github.com/xitu/gold-m… 译者：JayZhaoBoy 校对者：hanliuxin5 Instant Apps（即时应用）和 4 MB 字节的限制把一个已经存在的应用程序转换成 Android Instant App（安卓即时应用程序）是很有挑战性的，但对于模块及结构化你的项目而言却是一个很好的练习，更

Android 开发者

2018/05/31

2.6K0

Hosts文件修改

tcp/ip dns github git 开源

有时访问某些国外网站很卡（不包括无法访问的网站），很大的原因是这些网站的 CDN 的域名遭到 DNS 污染了。这时就可以选择直接访问源网站 IP ，绕过 DNS 解析，即通过修改主机 hosts 文件的方式，将域名和 IP 的对应关系直接记录下来，来加速对这些网站的访问。

hotarugali

2022/03/01

6.1K0

mac 技术篇-修改hosts文件，hosts文件位置

insert ip sudo vi 终端

hosts 文件就在 /etc/hosts 路径里，我们直接是无法编辑的，需要通过下面的方法来修改我们的 hosts 文件。

小蓝枣

2020/09/23

43.7K0

ssh 协议中known_hosts文件

ssh

A通过ssh首次连接到B，B会将公钥1（host key）传递给A，A将公钥1存入known_hosts文件中，以后A再连接B时，B依然会传递给A一个公钥2，OpenSSH会核对公钥，通过对比公钥1与公钥2 是否相同来进行简单的验证，如果公钥不同，OpenSSH会发出警告，避免你受到DNS Hijack之类的攻击。。

用户8418197

2022/02/14

3.2K0

在IPA中重签名iOS应用程序

tcp/ip xcode swift 腾讯云测试服务打包

当我们在对iOS应用程序执行黑盒安全测试时，我们一般只能从AppStore来访问和获取iOS应用程序。但是在大多数情况下，客户都会给我们提供一个IPA文件。在黑盒测试过程中，我们无法访问目标应用的源代码，因此通过Xcode将其部署到设备并进行测试，几乎是不可能的。但是有一种可行的解决方案，即使用我们手头上的配置文件来重新启动应用程序，并将其部署到我们的测试设备上。

FB客服

2020/03/10

2.3K0

在Flutter中制作指纹认证应用程序

flutter

现在许多手机都配备了指纹传感器，这使得用户登录和本地身份验证更容易，而且比使用密码更安全。

徐建国

2021/07/31

2.5K0

hosts文件是什么？hosts文件有什么作用？

tcp/ip 网站

对网络比较熟悉的朋友应该都知道hosts文件，在windows系统中和手机中，hosts文件有非常多的作用，但是具体来说有哪些作用呢？很多人却并不清楚，下面来为大家具体介绍一下hosts文件是什么、hosts文件有什么作用，希望能够为各位用户提供更多有关hosts文件的经验。

用户8715145

2021/07/02

5.6K0

Android 判断是否在通话中

state 博客权限

转载请以链接形式标明出处：本文出自:103style的博客最后的判断代码： /** * 是否正在电话通话中 */ private boolean phoneIsInUse() { TelephonyManager mTelephonyManager = (TelephonyManager) activity.getSystemService(Context.TELEPHONY_SERVICE); int state = mTelephonyManager.getCallSt

103style

2022/12/19

1.3K0

点击加载更多

相似问题

关于dlib::frontal_face_detector优化

再现dlib frontal_face_detector()训练

116

使用python dlib时导入错误

无法使用全局安装的Dlib编译Dlib示例

使用pip安装Dlib时出错

活动推荐

助力在校大学生快速入门云计算，畅游云端

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问从xpath @属性中剥离html标记
EN

CDN&音视频通信出海专场

回答 1

Stack Overflow用户

关于dlib::frontal_face_detector优化

再现dlib frontal_face_detector()训练

使用python dlib时导入错误

无法使用全局安装的Dlib编译Dlib示例

使用pip安装Dlib时出错

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从xpath @属性中剥离html标记EN

CDN&音视频通信出海专场

回答 1

Stack Overflow用户

关于dlib::frontal_face_detector优化

再现dlib frontal_face_detector()训练

使用python dlib时导入错误

无法使用全局安装的Dlib编译Dlib示例

使用pip安装Dlib时出错

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从xpath @属性中剥离html标记
EN