腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
3
回答
ruby on rails正则表达式查找和删除
html
字符串
中
标记
之间
的
标记
、
、
我
在
ruby on rails中工作,需要以下内容:现在,我要做的不是屏幕
抓取
。我有一个博客,想让人们只
在
评论中使用代码
html
标签。因此,
在
格式化
字符串
时,我通常使用simple_format,但我希望它忽略代码
ht
浏览 1
提问于2009-12-25
得票数 0
回答已采纳
2
回答
在
HTML
标记
之间
抓取
字符串
、
、
、
我有一长串
HTML
代码。我希望
抓取
两个特定
标记
之间
的所有文本:<row>和</row> 例如: str = "<row> hello, this is an example </row> more example text <
浏览 20
提问于2020-07-17
得票数 0
回答已采纳
1
回答
如何在solr中搜索
html
标签?
、
我使用apache nutch
抓取
站点,并将其索引到Apache solr。我不知道如何在使用solr的站点中搜索和
html
标记
之间
的
字符串
?谢谢
浏览 0
提问于2012-08-11
得票数 1
回答已采纳
2
回答
PHP Regex点匹配新行替代
、
、
我提出了一个正则表达式来
抓取
2个
HTML
标记
之间
的所有文本。这就是我到目前为止所知道的:在实践中,这应该是完美的。但是
在
PHP preg_replace中使用选项: /ims执行它会导致匹配整个
字符串
。 如果我去掉/s标签,它可以很好地工作,但是标签
之间
有换行符。有没有更好的方法来解决这个问题?
浏览 0
提问于2011-03-25
得票数 1
回答已采纳
1
回答
抓取
标记
之间
的所有
html
、
我正在尝试返回两个
html
标记
之间
的文本。问题是文本跨越多行。下面是一个例子。如果有人能想出一个正则表达式来匹配
html
标签
之间
的所有内容。</section>Regex.Match(
html
, "<section id=\"mysection\">/s+(.*?)使用上面的例子,我希望它匹配“文本总是从开始部分
标记
之后的行开始。它可以是任何东西,甚至可以跨越多行。结束
标记</
浏览 3
提问于2013-04-27
得票数 3
2
回答
如何使用jQuery遍历此DOM并检索所需的文本?
、
、
、
我
在
一个页面上有一个表单,其中有一堆兄弟h5
标记
。我想使用jQuery检索每个h5
标记
之间
的文本。我更希望有一个回调,或者能够
在
一个简单的循环结构中实现这一点,在那里我可以
抓取
文本并使其成为有意义的
HTML
,然后将最终的
字符串
插入到其他地方。 如何使用jQuery做到这一点呢?
浏览 0
提问于2009-03-13
得票数 4
回答已采纳
3
回答
Gsub和正则表达式
、
HTML
源包含以下文本:John是一个例子,名字可能会有所不同。我确信og:title只会在文本中出现一次。这是我的代码:x = $browser.
html
.gsub( /^.*<meta property="og:title" content="(.+?)".>/m, '\1'
浏览 0
提问于2012-06-01
得票数 0
回答已采纳
4
回答
标记
之间
的C#
HTML
抓取
好的,我正在尝试做一个Skype工具,它有一个“字典”命令,可以从城市字典中检索单词的含义,此时我可以将整个
HTML
文档加载到
字符串
中,如下所示:我尝试了所有的东西,但我不能设法检索"div“标签
之间
的文本。 我怎么能这样做呢?
浏览 4
提问于2015-07-11
得票数 2
5
回答
使用RegEx捕获Python中的重复组(参见示例)
、
、
我正在用python编写一个正则表达式来捕获SSI
标记
中的内容。<!--#include file="/var/www/localhost/index.
html
" set="one" --> 属性值,
在
"
之间
找到。问题是,我对如何
浏览 4
提问于2014-07-02
得票数 3
回答已采纳
1
回答
带可能问号的preg_match URL
、
所以我有一个
字符串
(它是动态的)。这是$url..现在,URL
字符串
有时可能如下所示: preg_match("/site.com\/(.*)/",$info[url],$matches);当有问号时,我如何让它
抓取
斜杠(/)和问号
之间
的所有内容,但当没有问号时,只
抓取
斜杠(/)之后的所有内容
浏览 5
提问于2012-07-21
得票数 0
1
回答
PHP:从两个特定标签
之间
的
字符串
中提取文本
、
、
、
基本上,它将读取给定URL的内容并提取必要的
HTML
代码。然后,它会将代码放入一个新页面。现在,除了一件事之外,我已经把所有的东西都弄好了。我有一个包含URL内容的
字符串
,现在我想提取两个
标记
之间
的文本。假设我想从某个标签开始复制内容。这很简单,因为这些
标记
都有类。 因此,我让函数以"“开头,它只是
在
文档中搜索与此匹配的所有文本。
在
我希望复制的部分中,还有其他
标记
。因此,如果我告诉函数
在
“”处停止提取,那么
抓取</e
浏览 0
提问于2012-02-20
得票数 0
2
回答
从
html
中提取css
、
我正在寻找一种干净的方式来
抓取
和删除<style></style>
标记
之间
的所有css。例如:foobar到流程结束时,我应该有一个带有content\nhere的
字符串
(不是样式
标记
之间
的所有内容),以及样式
标记
['foo', 'ba
浏览 4
提问于2014-08-31
得票数 1
回答已采纳
1
回答
Regex :忽略preg_replace_callback
标记
、
、
我试图
抓取
HTML
标记
之间
的所有文本(如果有),并在其上添加一个函数。我是说..。我现在的代码是 return strtolower($matches);现在我要的是: 如果存在
标记
,则返回===
标记
+strtolower(用于
标记
浏览 1
提问于2011-08-04
得票数 1
1
回答
如何在需要认证的app上使用OpenGraph标签?
、
、
在
更大的范围内,这个问题也会出现在任何需要登录才能查看的页面上。 解决这个问题的最佳方法是什么?
浏览 4
提问于2012-02-22
得票数 0
回答已采纳
4
回答
如何
抓取
HTML
标签的内容?
、
、
、
嘿,所以我想做的是
抓取
第一段的内容。
字符串
$blog_post包含许多段落,格式如下:我遇到的问题是,我正在编写正则表达式,以获取第一个<p>
标记
和第一个关闭的</p>
标记
之间
的所有内容。然而,它正在
抓取
第一个<p>
标记</
浏览 1
提问于2008-09-02
得票数 7
回答已采纳
1
回答
从Vimeo urls中提取拇指
、
、
、
、
我想从Vimeo视频页面中提取图像。我已经浏览过这些链接了 我能够通过上面对这些urls的正则表达式解析视频id (我需要提取缩略图)。
浏览 2
提问于2012-05-06
得票数 1
回答已采纳
1
回答
我可以将lxml div对象转换为
字符串
吗?
、
我正在编写一个从网站上
抓取
文本的程序。是否可以将此div
标记
转换为
字符串
,以便更容易格式化?from lxml import etreeelement = etree.
HTML
(requests.get('a website')).xpath('//div')
浏览 1
提问于2018-07-22
得票数 0
1
回答
如何在QTextEdit中突出显示文本
字符串
、
、
、
、
我正在构建一个公式编辑器,并且
在
尝试突出显示字段中的
字符串
时遇到问题。我有一个解析QTextEdit
字符串
的函数,并返回一个错误所在位置的开始和结束整数。我最初的策略是在这两点使用
HTML
标记
来突出显示错误。不幸的是,
html
标记
和等式语法似乎存在问题。 我认为我需要的是一种策略,它依赖于Qt的库来设置这两个索引
之间
的背景色。我开始寻找;然而,我认为这更多的是为了使用一组预定义的规则来突出显示,而不仅仅是为了
抓取
a&b和设置背
浏览 0
提问于2013-02-15
得票数 6
回答已采纳
1
回答
值
在
浏览器上显示,但在检查元素中不可用。
、
、
我正在从网页中
抓取
元素&我可以
在
灰暗的框中看到在网页上可见的元素(数值),但是当试图检查元素时,我
在
标记
之间
找不到它。我假设URL可能是任何webservice端点&试图从postman获得,但它返回的只是
HTML
代码,而不是JSON响应。通常,我们可以通过查找元素&获取selenium中的innerText属性来获得
标记
之间
的值,因为
标记
之间
没有文本,因此也失败了。 由于
在
浏览 2
提问于2019-10-07
得票数 0
回答已采纳
2
回答
网站不允许右键单击,web
抓取
不显示正文
标记
之间
的文本
、
、
、
、
我正在试着用网络
抓取
网页。但是,网站本身不允许右键单击功能来检查元素或页面源代码。此外,当我打印解析后的
html
文本时,结果只有body
标记
,而不显示body
标记
中的信息。') print(soup) 我希望从soup中获得实际的
HTML
(特别是body
标记
之间
的
HTML
);但是,我只能得到 <
html
xml:lang="en" xmlns="http://www
浏览 19
提问于2019-10-02
得票数 3
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券