您找到你想要的搜索结果了吗？

是的

没有找到

Python爬虫之BeautifulSoup库的入门与使用Beautiful Soup库的理解Beautiful Soup库的引用BeautifulSoup类的基本元素BeautifulSoup解析实

上篇文章中，Python爬虫之requests库网络爬取简单实战我们学习了如何利用requets库快速获取页面的源代码信息。我们在具体的爬虫实践的时候，第一步就是获取到页面的源代码，但是仅仅是获取源代码是不够的，我们还需要从页面的源代码中提取出我们所需要的那一部分的信息。所以，爬虫的难点就在于对源代码的信息的提取与处理。 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.

微软开源全新的文档生成工具DocFX

微软放弃Sandcastle有些年头了,微软最近开源了全新的文档生成工具DocFX，目前支持C＃和VB，类似JSDoc或Sphinx，可以从源代码中提取注释生成文档之外，而且还有语法支持你加入其他的文件链接到API添加额外的说明，DocFX会扫描你的源代码和附加的文件为你生成一个完整的HTML模版网站，你可以自己通过模版定制，目前已经内嵌了几个模版，包括静态的HTML页面和AngularJS页面。你还可以自己定制模版，具体参考 how to create custom template。源代码： http

安卓开发教程-实战网页源代码查看器，安卓程序员必备

本系列教程致力于可以快速的进行学习安卓开发，按照项目式的方法，通常一篇文章会做一个小程序。提高学习的兴趣。

【JavaWeb】JSP快速入门

JSP 全名是 Java Server Pages ，它是建立在 Servlet 规范之上的动态网页开发技术。在 JSP 文件

JSP页面样式乱掉：JS编码&解码&HTML转义escape , unescapeJSP页面样式乱掉：JS编码&解码&HTML转义escape , unescape原因分析解决方案测试验证

在如下的HTML/JSP源代码中，有特殊字符（比如说，html标签，</textarea>）

最近学习java遇到的几个疑问

小应用程序代码书写和编译完成后，无法独立运行，需要一个载体或者容器。下面的HTML网页代码就是小应用程序载入的容器。

Webpack源代码泄露

Webpack是一个开源的前端代码打包工具，它可以将多个JavaScript、CSS、图片等静态资源文件打包成一个或多个静态资源文件并通过模块化管理打包后的代码以提高前端应用程序的性能和加载速度，Webpack支持CommonJS、AMD、ES6等多种模块化规范并且提供了强大的插件机制和开发者工具，可以帮助开发者进行代码优化、压缩、混淆、实时重载等操作

前端利器！让AI根据手绘原型生成HTML | 教程+代码

这么多环节，任何地方出一点问题，都会拉长开发周期。因此，不少公司，比如Airbnb已经开始用机器学习来提高这个过程的效率。

Python简单爬取图片实例

都知道Python的语法很简单易上手，也很适合拿来做爬虫等等，这里就简单讲解一下爬虫入门——简单地爬取下载网站图片。

Django 模板HTML转义和CSRF4.3

Django对字符串进行自动HTML转义，如在模板中输出如下值：视图代码： def index(request): return render(request, 'temtest/index2.html', { 't1': '

hello

' }) 模板代码： {{t1}} 显示效果如下图：会被自动转义的字符 html转义，就是将包含的html标签输出，而不

HTML CSS 和 JavaScript 中的文本到语音转换器

创建一个将任何文本转换为语音的项目可能是一个有趣且可以提升技能的项目，特别是在学习 HTML、CSS 和 JavaScript 的过程中。在这篇博客中，您将学到如何使用 HTML、CSS 和 JavaScript 构建一个文本到语音转换器。我最近也分享了一个关于如何使用 JavaScript 构建生成 OTP 代码的博客，相信那个项目对你也会有帮助。

用HTML、CSS和JavaScript制作的通用进制转换器

随着编程和计算机科学越来越受欢迎，我们经常需要进行进制转换。本文将介绍一个简洁、美观、适用于移动设备的进制转换工具，并详细讨论其实现。

让模式源代码动起来

每个转数值模式的都逃不了查看源代码的命运。每当看源代码时，总是理不清那复杂的亲属关系。为了在查阅源代码时更好的理清思路，我们可以使用 f90tohtml 构建模式代码调用流程图。

13.14 SpringBoot集成JSP模板引擎：JSP页面样式乱掉13.14 SpringBoot集成JSP模板引擎：JSP页面样式乱掉原因分析解决方案测试验证

在如下的HTML/JSP源代码中，有特殊字符（比如说，html标签，</textarea>）

python编码问题之\"encode\"&\"decode\"

python encode decode 编码 decode的作用是将其他编码的字符串转换成unicode编码，如str1.decode(‘gb2312’)，表示将gb2312编码的字符串str1转换成unicode编码。 encode的作用是将unicode编码转换成其他编码的字符串，如str2.encode(‘gb2312’)，表示将unicode编码的字符串str2转换成gb2312编码。当我们想获取网页源代码，并且希望能够以html后缀或者其他格式保存文件的时候，如果不进行编码，那么保存得到的文件

Python 爬取猫眼电影最受期待榜

主要爬取猫眼电影最受期待榜的电影排名、图片链接、名称、主演、上映时间。　　思路：1.定义一个获取网页源代码的函数；　　　　　2.定义一个解析网页源代码的函数；　　　　　3.定义一个将解析的数据保存为本地文件的函数；　　　　　4.定义主函数；　　　　　5.使用多进程爬取。步骤一：首先，导入相关的库： import requests import re import json from multiprocessing import Pool from requests.exceptions

010

NDoc - .NET 代码文档生成器

NDoc 可以将 C#.NET 编译生成的程序集和对应的 /doc XML 文档，自动转换成如 .NET Framework SDK 类库文档或者 MSDN Library 在线 .NET 类库文档形式的代码文档，让您快速拥有专业级的类库API 文档。(VB.NET 通过第三方插件如 VBCommenter 的支持，也可以生成 XML 文档。) NDoc 代码文档的样式包括 HTML Help 1 (即 *.CHM 格式)，Microsoft Help 2 (即以形如 ms-help://... 的 UR

资源 | 深度学习自动前端开发：从草图到HTML只需5秒（附代码）

选自InsightDataScience 作者：Ashwin Kumar 机器之心编译参与：乾树、李泽南在人们的不断探索下，「使用人工智能自动生成网页」的方法已经变得越来越接近实用化了。本文介绍的这种名为 SketchCode 的卷积神经网络能够把网站图形用户界面的设计草图直接转译成代码行，为前端开发者们分担部分设计流程。目前，该模型在训练后的 BLEU 得分已达 0.76。你可以在 GitHub 上找到这个项目的代码：https://github.com/ashnkumar/sketch-code

node爬虫 -- 网页图片

其实爬虫用很官方的语言来描述就是“自动化浏览网络程序”，我们不用手动去点击、去下载一些文章或者图片。大家或许用过抢票软件，其实就是不断地通过软件访问铁路官方的接口，达到抢票的效果。但是，这类抢票软件是违法的。

python爬虫（四）

一.JSON模块 Json是一种网络中常用的数据交换类型，一个文件要想在网络进行传输，需要将文件转换为一种便于在网络之间传输的类型，便于人们进行阅读，json就是这样应运而生的。Json中的数据是由键值对构成的，与python中字典不同的是，json将数据转换为一种字符串的形式。在电脑上如何安装json呢？打开电脑的cmd，输入pip install json，然后在python命令行中运行 import json,如果没有出现什么错误，说明已经成功安装了。 Json中有许多模块，我目前在爬虫中用到的就两个方法，其他的方法等碰见了再讲解。 json.loads() #把json字符串转换为python类型 def loads(s, encoding=None, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw): 这是loads的源代码，可以参考一下。

5秒钟内将手绘网站线框图转换为可用的 HTML网站

你可以在 GitHub 上找到这个项目的代码：https://github.com/ashnkumar/sketch-code

3-7 sourceMap的配置

sourceMap，顾名思义，就是对源文件的映射。比如打包压缩后的代码对应源文件中的哪一行代码，这能够极大地方便开发者的调试。

Bug or Feature？藏在 requests_html 中的陷阱

在写爬虫的过程中，我们经常使用 XPath 来从 HTML 中提取数据。例如给出下面这个 HTML：

用python实现csdn博主全部博文下载，html转pdf，有了学习的电子书了。。。（附源码）

Pycharm中设置默认字符编码为 utf-8模版

在计算机内存中，统一使用Unicode编码，当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码。

source insight中文注释乱码问题的解决方案

最近使用source insight查看一些开源代码，显示中文就乱码，据说是因为source insight不支持utf-8编码，默认编码方式为ANSI码。所以需要将utf-8等非ANSI码的文件转换成source insight默认支持的ANSI码格式才能显示中文不乱码。

什么是源代码映射？

文篇主要介绍源代码映射，源代码映射（Source maps）是以.map结尾的文件，例如example.min.js.map和styles.css.map。大多数构建工具都可以生成源代码映射文件，例如Vite、webpack、Rollup、Parcel、esbuild等，一些工具默认包含源代码映射，而其他工具则需要额外的配置才能生成它们。

fileinclude-宜兴网信办解题思路--呕心沥血--非常详细!

这上面显示说，flag在这个/var/www/html/flag.php文件中。由此可知，这道题是文件包含题。

一日一技：HTML里面提取的JSON怎么解析不了？

我们在开发爬虫的过程中，经常发现有一些网站，会直接把数据以JSON的形式，通过<script>标签放到页面源代码中。如下图所示：

零代码编程：用ChatGPT批量采集bookroo网页上的英文书目列表

https://bookroo.com/explore/books/topics/ice-skating

基于 Babel 的 npm 包的最小化设置 [每日前端夜话0x2F]

这文描述了通过 Babel 生成 npm 包的最小设置。你可以在 GitHub 中看到 re-template-tag 中的设置。

fileinclude-宜兴网信办解题思路--呕心沥血--非常详细!

这上面显示说，flag在这个/var/www/html/flag.php文件中。由此可知，这道题是文件包含题。

【云+社区年度征文】webpack 学习笔记系列01-基础命令与常见配置

webpack 命令可以在 package.json 中的 script 字段中添加命令，再使用 npm 执行：

HttpServletResponse接口

HttpServletResponse接口是ServletResponse的子接口，HttpServlet类的重载service()方法及doGet()和doPost()等方法都有一个HttpServletResponse类型参数：

听GPT 讲Rust源代码--src/librustdoc

题图来自 Why is building a UI in Rust so hard?[1]

嵌入式软件静态解析工具－CasePlayer2

CasePlayer2是通过解析ANSI C语言，C++，嵌入式C语言（非ANSI），以及汇编语言的源代码，制作包括流程图等的程序说明书的工具。不论是对以往的程序进行逻辑分析，还是为新开发的程序制作说明书，都提供了强有力的支援。作为程序静态分析功能，包括外部变量参照/代入的列表功能，以及C语言的编程标准[MISRA-C]的规范检查功能。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐