首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

巧用正则获取html页面信息

工作中需要获取html网页的部分信息,而通过掌握html网页结构来获取某元素的信息是有一定难度的,只能另辟蹊径来解决。...通过查看html网页,需要获取的关键信息是一个表格的某一列,按 F12 查看,关键信息存储在一个多层的 list 中,其存储样式遵循一定的规律,这不就是正则擅长的工作吗?哈哈哈,瞬间有了方向。...对比html网页和F12信息,可以看到关键信息 application_1642534673102_0995 ,此文本包含了 字母、数字和 _ ,可以使用 `` 进行匹配,而其全部包裹在 > ...(\w+),实际测试时发现把很多无关的内容都匹配出来了,包括 >ApplicationMaster 中的 ApplicationMaster ,仔细查看F12信息发现:> 是html...按照这个思路,监控脚本就上线了,周例会讨论时,有人提出,关注 Apache Flink 类型的任务就可以了,不需要获取全部的 application id。

1.9K10
您找到你想要的搜索结果了吗?
是的
没有找到

PHP压缩html页面

html页面压缩之后,可以大大提升页面的加载速度,下面的压缩代码去掉了页面中的所有空格、注释、制表符、换行符等等比较多余的字符,下面的代码是写以在thinkphp5中为例的,不过在他PHP程序是通用的...view_replace_str'))             ->fetch($data, $this->vars, $this->replace);                  /* 自定义页面压缩...php echo ', $outputHtml)));         }                  return $outputHtml;     } 2、在页面公共部分或者你需要使用页面压缩的模块设置一个宏变量进行标记...,我的如下     //设置开启页面压缩,true为开启页面压缩,false相反     define('IS_PAGE_ZIP', false); 3、最后压缩后的效果如下图:

8.1K10

使用MSHTML解析HTML页面

等脚本然后形成静态的HTML页面,最后才分析这个静态页面。...虽然最终没有采用这个方案,但是我在开始学习MSHTML并写Demo的过程中还是收益匪浅,所以在这记录下我的成果 解析Html页面 MSHTML是一个典型的DOM类型的解析库,它基于COM组件,在解析Html...在GUI程序中很容易就获取这个接口,获取它的方法很容易就可以在网上找到,在这主要说一下如何通过一段HTML字符串来生成对应的IHTMLDocument2接口。...至于如何生成这个HTML字符串,我们可以通过向web服务器发送http请求,并获取它的返回,解析这个返回的数据包即可获取到对应的HTML页面数据。...在控制台下它没有提供一个很好的方式来进行HTML页面的渲染。 4.

3.5K30
领券