源懒由码

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

为了便利化使用selenium驱动浏览器进行操作，遇到一个网页，大部分内容都是通过xhr请求后再通过前端js处理显示，

selenium爬取异步加载的网站

　　简介：处在一个网络隔离，又常需要进行调查分析的环境。常规性需要通过excel进行数据采集，校验，汇总，分析等工作。鉴于此，设计一个基于excel的统计系统。需求通过自身工作的场景进行获取，因此不一定契合用户喜好，所以干脆做出笔记，以便揣摩。

一个基于excel vba的统计报表系统需求设计、详细分析及实现（一）

Request支持HTTP连接保持和连接池，支持使用cookie保持会话，支持文件上传，支持自动响应内容的编码，支持国际化的URL和POST数据自动编码。

python requests

 快速排序法事应用最广泛的排序算法之一，最佳情况下时间复杂度是 O(nlogn)。但是最坏情况下可能达到O(n^2)。说明快速排序达到最坏情况的原因。并提出改善方案并实现之。

快速排序

n个关键字序列Kl，K2，…，Kn称为（Heap），从数组上看就是，ki>=k(2i）且ki>=k(2i+1)(1≤i≤ n/2）

堆排序

    在多指标的综合加权评价中，确定各项指标的权重是非常关键的环节。对各指标赋权的合理与否，直接关系到分析的结论。确定权重系数的方法很多，归纳起来分为两类：即主观赋权法和客观赋权法。主观赋权法是由评价人员根据各项指标的重要性而认为赋权的一种方法，充分反应专家的经验，目前，使用较多的是专家咨询法、层次分析法、循环打分法等。客观赋权法是从实际数据出发，利用指标值所反应的客观信息确定权重的一种方法，如熵值法、银子分析法、主成分分析、均方差法、相关系数法等。本文主要介绍熵值法进行综合评价，并使用Python进行实现。

python 基于熵值法进行综合评价

场景：严格意思上不应存在这种场景，如果存在，说明数据量太小了。举个例子，假设仅有29条数据的情况下，使用LSTM模型，如果直接使用该函数进行归集数据，则会造成验证集数据的一些浪费。

keras.preprocessing.timeseries_dataset_from_array 较小数据集下的充分使用

　　使用消极、积极两类电影评论集，构建对情感分类模型，并后续用于预测。由于只有两类，因此是一个二分类模型。

文本挖掘（四）python电影评论情感分类模型 -- 基于keras的全连接神经网络

简介：遇到一个反爬虫机制，该网页为gbk编码网页，但是请求参数中，部分请求使用gbk编码，部分请求使用utf8编码，还设置了一些不进行编码的安全字符，在爬取的过程中形成了阻碍。

python requests 一种通过编码的反爬虫机制

简介：不同的服务器采用的网页编码可能不一样，如果使用错误的编码发送数据，将不会得到正确的数据。

python requests 网页编码问题

　　简介：文本挖掘中，情感分析是经常需要使用到，而进行主题模型分析之前，对数据集进行文本分类再进行分析具有必要性，因为分类以后，每一类的主题才会更明显。而snownlp是一个python写的类库，可以方便的处理中文文本内容，主要看上了他的情感分类功能(二分类)，分类是基于朴素贝叶斯的文本分类方法，当然也可以选择基于其他方法自己建立一个分词模型。

文本挖掘（三）python 基于snownlp做情感分析

简介：前文python jieba+wordcloud使用笔记+词云分析应用讲到可以自定义Idf文档，所以来处理处理。算法已经有现成，本文讲解基本原理及其使用。

文本挖掘（二）python 基于scikit-learn计算TF-IDF

　　系列介绍：文本挖掘比较常见，系列思路：1-基本情况介绍（分词，词云展示）；2-根据语料库的tf-idf值及创建自己的idf文件；3-基于snownlp语料情感分析；4-基于gensim进行lda主题挖掘分析；

文本挖掘（一）python jieba+wordcloud使用笔记+词云分析应用

　　简介：长短期记忆人工神经网络（Long-Short Term Memory, LSTM）是一种时间递归神经网络(RNN)，论文首次发表于1997年。由于独特的设计结构，LSTM适合于处理和预测时间序列中间隔和延迟非常长的重要事件。

深度学习笔记（一） tf.keras 构建lstm神经网络进行时间序列预测

　　关联规则分析是数据挖掘中最活跃的研究方法之一，目的是在一个数据集中找出各项之间的关联关系，而这种关系并没有在数据中直接表示出来。常见于与购物篮分析。

python数据挖掘 pycaret.arules 关联规则学习

python + selenium 实现快照 （保存整个网页为图片）:https://www.cnblogs.com/shuaichao/p/13176915.html

python selenium chrome option参数摘抄

统计数据来说，有时点数据和时期数据。通常情况下，会进行两期数据的比较，现整理一个两期数据比较的场景应用。主要流程分为：

pandas系列 - （二）关于两期时点数据的比较

实际工作场景中，会遇到需要处理时序表。对于少量的时点时序数据，明细数据+数据透视表，也是很快能处理完成。大量的话，可能会出现有一点慢，同时一些计算字段的每次都要设置，不太方便处理。整理一个思路：将系统的时点时序数据进行汇总整合，并形成时序表。

pandas系列 - （三）关于时点时期数据的处理

官方文档：https://pandas.pydata.org/pandas-docs/stable/user_guide/index.html

pandas系列 - （一）明细数据汇总简单场景应用

python 舆情分析 nlp主题分析 （1） 待续: https://www.cnblogs.com/cycxtz/p/13663895.html

python 舆情分析 nlp主题分析 （3） --gensim库的简单使用

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了源懒由码专栏，为你提供了源懒由码的相关文章，致力于帮助开发者快速成长与发展。

源懒由码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐