首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何用simple_html_dom.php获取类名中有空格的网站的img资源?

simple_html_dom.php 是一个基于 PHP 的 HTML 解析库,可以用于从 HTML 文档中提取特定的内容。要获取类名中有空格的网站的 img 资源,可以使用 simple_html_dom.php 中的相关函数和方法。

首先,需要使用 simple_html_dom.php 解析目标网站的 HTML 文档。可以使用 file_get_html() 函数从给定的 URL 或文件路径中获取 HTML 内容,例如:

代码语言:txt
复制
$html = file_get_html('http://example.com');

接下来,使用 find() 方法和 CSS 选择器来查找符合条件的元素。对于类名中有空格的情况,需要使用引号将类名包裹起来,例如:

代码语言:txt
复制
$elements = $html->find('.class-name-with-space');

上述代码中,.class-name-with-space 表示类名为 "class-name-with-space" 的元素。

接下来,可以遍历找到的元素并提取其中的 img 资源。可以使用 find() 方法和标签选择器来查找 img 标签,然后获取其中的资源链接,例如:

代码语言:txt
复制
foreach ($elements as $element) {
    $img = $element->find('img', 0);
    $src = $img->src;
    // 处理获取到的资源链接
    // ...
}

上述代码中,$img->src 表示获取 img 标签的 src 属性,即资源链接。

最后,可以根据需求进行资源链接的处理,例如下载、保存、打印等操作。

综上所述,使用 simple_html_dom.php 获取类名中有空格的网站的 img 资源的步骤如下:

  1. 使用 file_get_html() 函数获取目标网站的 HTML 内容。
  2. 使用 find() 方法和 CSS 选择器查找类名中有空格的元素。
  3. 遍历找到的元素,使用 find() 方法和标签选择器查找 img 标签,并获取其中的资源链接。
  4. 根据需求处理获取到的资源链接。

推荐的腾讯云相关产品:腾讯云云服务器(https://cloud.tencent.com/product/cvm)、腾讯云对象存储(https://cloud.tencent.com/product/cos)、腾讯云CDN加速(https://cloud.tencent.com/product/cdn)。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

关于Simple_html_dom小应用

今天一同学给我推荐了本书,说是刚出不久,内容还不错,是心灵鸡汤书,于是按捺不住就像在网上下一本,可是木有资源肿么办。...,对吧,咱得学着它Simple_html_dom 专门解析HTML文档一东西,超好用哦~。...(1)首先得引入文件吧 include"simple_html_dom.php";   (2)咱这抓小说比较简单,深度就一层,不涉及到什么图深搜广搜,你只要观察URL规律即可 $url="http...($pattern,"\r\n",$content);     //加空格 $content=preg_replace($pattern1," ",$content);   (7)当然少不了他了...(3)主要是Simple_html_dom.php使用    (4)还得注意php超时问题   当循环太多时会出现超时问题,建议不要修改配置文件

74470
  • JavaScript DOM 操作可以改变网页内容、结构和样式,我们可以利用 DOM 操作元素来改变元素里面的内容、属性等

    获取内容时区别: innerText会去除空格和换行,而innerHTML会保留空格和换行 设置内容时区别: innerText不会识别html,而innerHTML会识别 案例代码...img.title = '刘德华'; } 获取属性值 元素对象.属性 设置属性值 元素对象.属性 = 值 表单元素中有一些属性...主意: 1.如果样式修改较多,可以采取操作方式更改元素样式。...2. class因为是个保留字,因此使用className来操作元素属性 className 会直接更改元素,会覆盖原先。...如果想要保留原先,我们可以这么做 多选择器 // this.className = 'change'; this.className = 'first

    2.8K41

    CSS入门指南-1:css工作原理

    多个放在同一对引号吃,用空格分隔。...要选择同时存在这两个元素可以这样写: .specialtext.featured {font-size: 120%;} CSS 选择符两个直接没有空格。...目的是为了标识一组具有相同特征元素,以便我们为这些元素应用相同css样式。 属性选择符 属性选择符 格式如下: 标签名[属性] 选择任何带有属性标签名。...ICE记分规则如下: 选择符中有一个ID,在I位置上加1; 选择符中有一个,在C位置上加1; 选择符中有一个元素,在E位置上加1; 得到一个三位数。...这一篇我们主要介绍了CSS规则,以及如何用它来为HTML应用样式。 ---- 最后,感谢女朋友支持。

    84320

    巧用简单工具:PHP使用simple_html_dom库助你轻松爬取JD.com

    爬虫技术难度和复杂度取决于目标网站结构和反爬策略,有些网站可能需要使用复杂工具和技巧才能成功爬取,而有些网站则相对简单,只需要使用一些基本工具和库就可以实现。...本文还将介绍如何使用代理IP技术来避免被目标网站封禁或限制。正文1. 安装和引入simple_html_dom库要使用simple_html_dom库,首先需要下载它源码文件,可以从这里获取。...下载后,将simple_html_dom.php文件放到你项目目录下,然后在你PHP代码中引入它,如下所示:<?...我们还需要使用代理IP来伪装我们请求,以防止被目标网站识别和封禁。我们可以从爬虫代理获取高质量代理IP,它提供了多种类型和地区代理IP,以及不同认证方式。...我们可以使用这些方法来根据HTML元素标签、、ID、属性等来定位和获取我们需要数据。

    27800

    实战 | 文件上传漏洞之最全代码检测绕过总结

    借助文件上传漏洞,攻击者可以获取业务信息系统WebShell,进一步通过WebShell对该业务系统以及服务器自身操作系统进行操作,增加、删除、修改、查看文件等敏感操作。...; } } 绕过技巧: 我们可以尝试使用PHP其它扩展绕过,phtml image-20220116210405949 注:PHPStudy环境默认还是不会解析phtml、php3等扩展文件...image-20220117000838259 利用空格绕过 Windows系统文件后缀加空格命名之后是默认自动删除空格。若网站后端过滤时没有过滤空格,便可进行绕过。...目录解析漏洞 IIS 6.0中目录解析漏洞,如果网站目录中有一个 *.asp文件夹,那么该文件夹下面的一切内容都会被 IIS 当作 asp 脚本来执行,/xx.asp/xx.jpg。...这个解析漏洞其实是PHP CGI漏洞,在PHP配置文件中有一个关键选项cgi.fix_pathinfo,默认是开启,当URL中有不存在文件,PHP就会向前递归解析。

    12.7K42

    浏览器特性

    等); 元素内容发生变化(:字数量、图片尺寸); 元素字体大小发生变化; 设置 style 属性; 计算 offsetWidth 和 offsetHeight 属性; 激活 css 伪(例如... http://*.example.com: 匹配从使用 http: example.com 任意子域资源加载。... 协议'http:' 或者 'https:'。必须带有冒号,不要有单引号。 'self' 指向与要保护文件所在源,包括相同 URL scheme 与端口号。...当生成哈希值时候,不要包含 或 标签,同时注意字母大小写与空格——包括首尾空格——都是会影响生成结果。..., 但是限制音频或视频需从信任资源提供者(获得),所有脚本必须从特定主机服务器获取可信代码。

    1.3K10

    「Web编程API」- 01

    例如,C语言中有一个函数fopen()可以打开硬盘上文件,这个函数对于我们来说,就是一个C语言提供打开文件工具。...获取内容时区别:innerText会去除空格和换行,而innerHTML会保留空格和换行 设置内容时区别:innerText不会识别html,而innerHTML会识别 案例代码 ...常用元素属性操作 获取属性值 元素对象.属性 设置属性值 元素对象.属性 = 值 案例代码 刘德华 <button...表单元素属性操作 获取属性值 元素对象.属性 设置属性值 元素对象.属性 = 值 表单元素中有一些属性:disabled、checked、selected,元素对象这些属性值是布尔型...如果想要保留原先,我们可以这么做 多选择器 // this.className = 'change'; this.className = 'first

    65750

    Web API - DOM 第二节(操作元素)

    (注意:这些操作都是通过元素对象属性实现) 改变元素内容(获取或设置) ?...获取内容时区别: ​ innerText会去除空格和换行,而innerHTML会保留空格和换行 设置内容时区别: ​ innerText不会识别html,而innerHTML会识别 案例...// div.innerText = '今天是: 2019'; // 2. innerHTML 识别html标签 W3C标准 保留空格和换行...div.innerHTML = '今天是: 2019'; // 这两个属性是可读写 可以获取元素里面的内容 var p = document.querySelector...获取属性值 元素对象.属性 设置属性值 元素对象.属性 = 值 表单元素中有一些属性:disabled、checked、selected,元素对象这些属性值是布尔型。

    41710

    SpringCloud+Docker+Jenkins+GitLab+Maven实现自动化构建与部署实战

    4.2.5 build.sh文件shell脚本详解 注意点1:经过测试动态变量【等号】不能有空格和tab键置位,否则获取不了值,而且在shell脚本代码里面不支持空格格式化,支持tab置位格式化。...在终端(ssh软件端)或Jenkins客户端shell命令,『位置变量』参数以空格隔开。.../usr/bin/env bash # 动态变量【等号】不能有空格和tab键置位,否则获取不了值,而且在shell脚本代码里面不支持空格格式化,支持tab置位格式化。...或tar压缩文件,语法: docker save 镜像 -o 路径/镜像.tar.gz 或 docker save 镜像 -o 路径/镜像.tar docker load 命令是用于导入使用...5、建议看官方手册更权威,由于随着技术发展与迭代,通常官方文档更新较快,国内网站资料更新较慢。 6、计算机是一门『做中学』学科,不是会了再去做,而是做了才会。多练,常言道熟能生巧。

    9.3K40

    事件基础及操作元素

    (注意:这些操作都是通过元素对象属性实现) 2.1. 改变元素内容(获取或设置) ?...获取内容时区别: innerText会去除空格和换行,而innerHTML会保留空格和换行 设置内容时区别: innerText不会识别html,而innerHTML会识别 案例代码...获取属性值 元素对象.属性 设置属性值 元素对象.属性 = 值 案例代码    刘德华    <button id...获取属性值 元素对象.属性 设置属性值 元素对象.属性 = 值 表单元素中有一些属性:disabled、checked、selected,元素对象这些属性值是布尔型。...如果想要保留原先,我们可以这么做 多选择器            // this.className = 'change';            this.className = 'first

    1.4K20

    SpringCloud+Docker+Jenkins+GitLab+Maven实现自动化构建与部署实战

    等号】不能有空格和tab键置位,否则获取不了值,而且在shell脚本代码里面不支持空格格式化,支持tab置位格式化。...在终端(ssh软件端)或Jenkins客户端shell命令,『位置变量』参数以空格隔开。.../usr/bin/env bash # 动态变量【等号】不能有空格和tab键置位,否则获取不了值,而且在shell脚本代码里面不支持空格格式化,支持tab置位格式化。...或tar压缩文件,语法: docker save 镜像 -o 路径/镜像.tar.gz 或 docker save 镜像 -o 路径/镜像.tar docker load 命令是用于导入使用...5、建议看官方手册更权威,由于随着技术发展与迭代,通常官方文档更新较快,国内网站资料更新较慢。 6、计算机是一门『做中学』学科,不是会了再去做,而是做了才会。多练,常言道熟能生巧。

    7.9K20

    制定自己团队前端开发规范

    如果可以的话,实践过程中有不舒服,麻烦给我进行反馈,这样才能知道这套规则适不适合大部分人去用,根据大家意见,取其精华去其糟粕让这套规范变得更实用。...="single"] { ... } 命名 使用小写字母,以中划线分隔 id采用驼峰式命名 scss中变量、函数、混合、placeholder采用驼峰式命名 /* class */ .element-content...空格 以下几种情况不用写空格: 对象属性后 函数调用括号前 无论是函数声明还是函数表达式,'('前不要空格 数组'['后和']'前 对象'{'后和'}'前 运算符'('后和')'前 以下几种情况一定要写空格...函数注释 复杂函数,所有,都必须进行函数注释,函数注释使用业界统一规范,方便后续使用jsdoc生成文档。...例: /** * 获取任务名称 * @param id {Number} 传入需要获取名称的人物id * @return {String} 返回姓名 * @author shi 2015/07

    89120

    Web前端开发规范手册

    HTML命名原则   主页统一使用index.htm、index.html或index.asp文件(小写)   各子页命名原则首先应该以栏目英语翻译取单一单词为名称。...实际上已经有了这样一整套标准。其中关于网站LOGO,目前有三种规格: 88*31 这是互联网上最普遍LOGO规格。 120*60 这种规格用于一般大小LOGO。...命名: 首字母大写, 驼峰式命名. ITaoLun; 函数命名: 首字母小写驼峰式命名....iTaoLun(); 命名语义化, 尽可能利用英文单词或其缩写; 尽量避免使用存在兼容性及消耗资源方法或属性, 比如eval() & innerText; 后期优化中, JavaScript非注释中文字符须转换成...提高函数重用率; 注重与html分离, 减小reflow, 注重性能. ----  图片规范 所有页面元素图片均放入img文件夹, 测试用图片放于img/demoimg文件夹; 图片格式仅限于gif

    2.7K54

    第一个Python小爬虫

    我选用是Python3.7 安装程序。 一些基础知识暂时没做笔记,基本是参考廖雪峰博客还有网上一些视频网站视频就能明白。 要深入的话最好是买下书籍来看吧。...获取页面 Python对网页访问首先需要引入urllib.request (之前直接用urllib不行好像是版本原因,感觉我都学岔版本了) urllib中有 urllib.request.urlopen...获取其他信息 打开pageCode.txt文件(也可以直接在原网页F12调试获取),查看需要获取数据标签信息。 比如我现在要拿图片 写出图片正则表达式: reg = r'src="(.+?...: print(img) 输出结果 然后将图片下载到本地 urllib库中有一个 urllib.request.urlretrieve(链接,名字) 方法,它作用是以第二个参数为名字下载链接中内容...' #根据网站样式匹配正则:(.*?)

    56130

    网页加速特技之 AMP

    据AMP官网统计目前已有很多新闻网站和科技网站开始使用AMP,包括Wordpress、YouTube、Twitter、LinkedIn、BBC等。...部分 HTML 标签必须使用 AMP 自定义组件来替换 、 用 、 替换。...分别用 AMP HTML 和 HTML 写了两个一样页面,页面中有33个HTTP请求,包含一个video、28张图片等资源。...6.字体必须有效触发 Web字体非常大,因此Web字体对性能优化是至关重要。在一个普通页面中有一些script和样式表,浏览器需要等待这些资源加载完成后开始加载这些大字体资源。...引入第三方资源受限。 需要遵循严格代码规范指引。 AMP设计初衷就是针对静态内容,用来加速新闻网站,所以对其他交互较多网站可能并不适用。

    4.7K82

    Python实现信息自动配对爬虫排版程序

    如下详解: 1 爬取数据并保存 download.py程序可见。 首先我们流程是从Excel读取数据、然后借助百度图库搜索图片,并爬取保存。 2 Excel排版和拼音注释 xls.py可见。...Time库:用来每次爬取数据适当延迟,以防止网站封掉ip。 Os模块:用来本地文件和文件夹读取和生成等等。...#改文件地方 excel_address="4.xlsx" socket.setdefaulttimeout(20) 为了防止反爬问题,设立请求头 header ={'User-Agent': '...)+"% 判断读取到数据是否是数字,因为其中有些数据是 空格等等多余无效数据: if isinstance(col0[i],float): numm.append(i)...lazy_pinyin,pinyin from openpyxl import load_workbook from openpyxl.drawing.image import Image #改文件地方

    1.3K30

    Web安全Day5 - 任意文件上传实战攻防

    文件上传漏洞是漏洞中最为简单猖獗利用形式,一般只要能上传获取地址,可执行文件被解析就可以获取系统WebShell。...为什么是由于PHP-CGI原因呢,因为在PHP配置文件中有一个关键选项cgi.fix_pathinfo在本机中位于php.ini配置文件中,默认是开启,当URL中有不存在文件时,PHP就会默认向前解析...,它使用资源派生来维持与文件相关信息。...如下上传,显示文件路径中有空格,这并不是真正意义上空格,而是%00截断后显示成空格。...使用一开始创建账号密码登陆,登陆成功后在后侧选择栏处选择工具->附件分类管理。 点击右侧上方创建资源分类,然后在支持附件类型中创建php文件类型。

    2.1K50
    领券