腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

社区首页 >问答首页 >用python在html源代码中搜索字符串(3.3.1)

问用python在html源代码中搜索字符串(3.3.1)
EN

Stack Overflow用户

提问于 2013-07-06 11:30:13

回答 3查看 18.1K关注 0票数 4

我正在做一个从网页上获取信息的项目。在html源代码中，我有以下内容：

Resultado de Busca: Foram En禁忌de 264 casais

我要知道"encontrados“和"casais”之间的号码

Python中也有这样的功能吗？我应该使用什么字符串函数？在这种情况下，我希望o避免使用正则表达式。

import urllib.request
f = urllib.request.urlopen("http://listadecasamento.fastshop.com.br/ListaCasamento/ListaCasamentoBusca.aspx?Data=2013-06-07")
s = f.read()

print(s.split())

到目前为止，我已经知道了，但现在我很难找到我需要的号码。

import urllib.request
f = urllib.request.urlopen("http://listadecasamento.fastshop.com.br/ListaCasamento/ListaCasamentoBusca.aspx?Data=2013-06-07")
s = f.read()

num = int(s[s.index("encontrados")+len("encontrados"):s.index("casais")])

这给了我错误的答案

TypeError: str类型不支持缓冲区API

python

string

split

媒体处理1元起

智能、强大、全面的多媒体数据处理服务，助您提升媒体质量、降低成本，媒体处理套餐低至1元

回答 3

Stack Overflow用户

回答已采纳

发布于 2013-07-06 11:38:39

如果美汤是您要解析的HTML，我建议您使用它这样的库。不需要regex

编辑

使用您刚才添加的URL，这是获取HTML对象的示例代码：

import BeautifulSoup
import re
import urllib

data = urllib.urlopen('http://listadecasamento.fastshop.com.br/ListaCasamento/ListaCasamentoBusca.aspx?Data=2013-06-07').read()
soup = BeautifulSoup.BeautifulSoup(data)
element = soup.find('span', attrs={'class': re.compile(r".*\btxt_resultad_busca_casamento\b.*")})
print element.text

这将在具有类span的页面上找到HTML元素，我相信这是您试图提取的数据。在这里，您可以解析.text属性以获得您感兴趣的确切数据。

编辑2

噢，刚刚意识到使用正则表达式..。BeautifulSoup中的类匹配似乎并不完美！这一行应该可以工作，至少在站点更改HTML之前是这样的：

element = soup.find('div', attrs={'id': 'ctl00_body_uppBusca'}).find('span')

票数 5

Stack Overflow用户

发布于 2013-07-06 11:33:45

考虑到不能使用正则表达式解析html，如果将文件视为一袋文本，则必须使用regex或类似的方法：

a = 'Resultado de Busca: Foram encontrados 264 casais' #your page text
num = int(a[a.index("encontrados")+len("encontrados"):a.index("casais")])

票数 1

Stack Overflow用户

发布于 2013-07-06 11:32:28

你肯定那个字符串的格式吗？如果您有这样的字符串(而且总是这样)，您可以使用：

s = "Resultado de Busca: Foram encontrados 264 casais"
items = s.split()

您的号码将按项目5编制索引。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/17506355

复制

JAVA中调用CMD命令，并输出运行结果

java https 网络安全

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/119104.html原文链接：https://javaforall.cn

全栈程序员站长

2022/07/09

1.9K0

nohup命令–linux后台运行程序并实时查看输出

python

前言前台运行程序十分的不稳定，当xshell断掉之后，程序也就断掉了。然后同学向我推荐了nohup命令，于是我就非常愉快的使用起来啦～

kirin

2021/03/15

5.2K0

java jps_java11教程–jps命令

jvm jar java

抑制类名，JAR文件名和传递给该main方法的参数的输出，从而仅生成本地JVM标识符的列表。

全栈程序员站长

2022/11/05

1.2K0

在 Linux 上使用 jps 命令检查 Java 进程

java linux

在 Linux 中，有一些用于查看系统上运行进程的命令。进程是指由内核管理的正在进行的事件。每启动一个应用程序时，就会产生一个进程，但也有许多在计算机后台运行的进程，如保持系统时间准确的进程、监听新文件系统的进程、索引化文件的进程等。有一些可以用来监测这些进程的实用程序，比如包含在 procps-ng 包中的程序，但它们往往都是对各种进程通用的。它们会查看计算机上的所有进程，你可以根据需要过滤结果列表。

用户9105998

2021/11/22

2.7K0

在 Linux 上使用 jps 命令检查 Java 进程

java linux

用户8989785

2021/10/13

2.8K0

java jps命令使用解析

java jar linux jdk

在linux环境下显示一个进程的信息大家可能一直都在使用ps命令，比如用以下命令来显示当前系统执行的java进程：

程序新视界

2022/05/06

1.5K0

Windows中jps命令无法查看java进程问题

java windows

{user}为当前登录用户名) 目录下建立一个以该 java 进程 pid 为文件名的文件，用以记录该 java 进程的一些信息。通常是因为没有对这个文件的写入权限而导致jps命令查看不到进程

夹胡碰

2020/10/27

4.5K0

spark (java API) 在Intellij IDEA中开发并运行

spark java

王小雷

2018/01/02

3.8K0

java程序编译命令_使用 java 命令编译运行 java 程序

jar jvm https 网络安全打包

java 编译的过程，就是将 java 项目从源文件变成 .class 文件的过程，而 .class 文件，最后会被加载到JVM 中运行。在 JDK bin/ 目录下，提供了 javac 命令，用于将 .java 源文件编译成 .class 字节码文件，提供了 java 命令，以 Main_Class 为入口，根据运行需要，加载相应的 class 文件到 JVM 中执行。

全栈程序员站长

2022/09/08

3.1K0

Java的jps命令使用详解

java jar ide jvm jdk

jps（Java Virtual Machine Process Status Tool）是JDK提供的一个可以列出正在运行的Java虚拟机的进程信息的命令行工具，它可以显示Java虚拟机进程的执行主类（Main Class，main()函数所在的类）名称、本地虚拟机唯一ID（LVMID，Local Virtual Machine Identifier）等信息。另外，jps命令只能显示它有访问权限的Java进程的信息。

万猫学社

2022/04/22

6.5K0

Java命令学习系列（一）——Jps

java eclipse grep jvm jdk

jps位于jdk的bin目录下，其作用是显示当前系统的java进程情况，及其id号。 jps相当于Solaris进程工具ps。不象”pgrep java”或”ps -ef grep java”，jps并不使用应用程序名来查找JVM实例。因此，它查找所有的Java应用程序，包括即使没有使用java执行体的那种（例如，定制的启动器）。另外，jps仅查找当前用户的Java进程，而不是当前系统中的所有进程。

九州暮云

2019/08/21

3.7K0

jps 命令_jps只有一个jps进程

java https jvm 网络安全

jps（全称：Java Virtual Machine Process Status Tool）是 java 提供的一个用来显示当前所有 java 进程的 pid 的命令。

全栈程序员站长

2022/11/05

3.3K0

JPS 命令演示 & 我们只用 jps -lv

java jdk 腾讯云开发者社区 jvm

jps命令是我们安装JDK内置的指令。jps命令主要查看java进程信息。（只要我们系统配置了JDK的环境变量。我们就可以使用jps命令）

收心

2022/10/31

1.7K0

linux c程序中获取shell脚本输出

shell

　　Unix界有一句名言：“一行shell脚本胜过万行C程序”，虽然这句话有些夸张，但不可否认的是，借助脚本确实能够极大的简化一些编程工作。比如实现一个ping程序来测试网络的连通性，实现ping函数需要写上200~300行代码，为什么不能直接调用系统的ping命令呢？通常在程序中通过 system函数来调用shell命令。但是，system函数仅返回命令是否执行成功，而我们可能需要获得shell命令在控制台上输出的结果。例如，执行外部命令ping后，如果执行失败，我们希望得到ping的返回信息。

阳光岛主

2019/02/19

5.6K0

linux jps 命令

jar java jvm

jps -- Java Virtual Machine Process Status Tool

微风-- 轻许--

2020/04/30

3.6K0

java环境配置及jps命令未找到

centos linux java

最近基于CentOS 7下安装hadoop集群，碰到了java环境变量的问题，同时也出现了jps命令无法找到的情况。简要描述一下基于CentOS 7下Java环境的配置及jps命令未找到的处理。

Leshami

2018/08/06

3.3K0

python 从subprocess运行的子进程中实时获取输出

c++python shell linux

shell =false 意思是command 使用的不是linux shell指令,如果要用shell 指令如ls 要将false 变成true, 通过指定stderr=subprocess.STDOUT，将子程序的标准错误输出重定向到了标准输出，以使我们可以直接从标准输出中同时获取标准输出和标准错误的信息。 p.poll() 返回子进程的返回值,如果为None 表示 c++子进程还未结束. p.stdout.readline() 从 c++的标准输出里获取一行.

多凡

2020/02/11

10.5K0

windows下C与C++执行cmd命令并实时获取输出

bash 网站编程算法

在windows下一般会使用系统的cmd命令或者其他现成的一些命令行可执行程序来完成一些操作，比如：调用ping命令来测试网络是否畅通、调用ffmpeg命令进行视频转码等等。为了能在软件界面上有更好的交互输出，都需要将命令执行的过程拿到，进行处理，然后在界面上进行显示，让用户知道程序正在正常运行，下面就介绍几种输出的获取方式。

DS小龙哥

2022/05/28

6.6K0

jps命令详解_jps用什么文件打开

linux unix java jar c 语言

jps(Java Virtual Machine Process Status Tool)是JDK 1.5提供的一个显示当前所有java进程pid的命令，简单实用，非常适合在linux/unix平台上简单察看当前java进程的一些简单情况。它和linux中的ps有类似的功能。

全栈程序员站长

2022/10/05

1.8K0

点击加载更多

相似问题

包含小计/总计的嵌套网格视图

SSRS总计应与小计和而不是源值

SSRS 2008小计和总计合计不正确

小计和总计

117

查找小计和总计

活动推荐

体验智能媒资降冷，云点播优惠不要错过！

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问用python在html源代码中搜索字符串(3.3.1)
EN

媒体处理1元起

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

包含小计/总计的嵌套网格视图

SSRS总计应与小计和而不是源值

SSRS 2008小计和总计合计不正确

小计和总计

查找小计和总计

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用python在html源代码中搜索字符串(3.3.1)EN

媒体处理1元起

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

包含小计/总计的嵌套网格视图

SSRS总计应与小计和而不是源值

SSRS 2008小计和总计合计不正确

小计和总计

查找小计和总计

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用python在html源代码中搜索字符串(3.3.1)
EN