首页
学习
活动
专区
工具
TVP
发布

源懒由码

专栏成员
88
文章
129917
阅读量
13
订阅数
selenium爬取异步加载的网站
为了便利化使用selenium驱动浏览器进行操作,遇到一个网页,大部分内容都是通过xhr请求后再通过前端js处理显示,
forxtz
2022-09-07
1.3K0
一个基于excel vba的统计报表系统需求设计、详细分析及实现(一)
  简介:处在一个网络隔离,又常需要进行调查分析的环境。常规性需要通过excel进行数据采集,校验,汇总,分析等工作。鉴于此,设计一个基于excel的统计系统。需求通过自身工作的场景进行获取,因此不一定契合用户喜好,所以干脆做出笔记,以便揣摩。
forxtz
2022-05-10
6260
python requests
Request支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动响应内容的编码,支持国际化的URL和POST数据自动编码。
forxtz
2022-05-10
1.7K0
快速排序
快速排序法事应用最广泛的排序算法之一,最佳情况下时间复杂度是 O(nlogn)。但是最坏情况下可能达到O(n^2)。说明快速排序达到最坏情况的原因。并提出改善方案并实现之。
forxtz
2022-05-10
1230
堆排序
n个关键字序列Kl,K2,…,Kn称为(Heap),从数组上看就是,ki>=k(2i)且ki>=k(2i+1)(1≤i≤ n/2)
forxtz
2022-05-10
1250
python 基于熵值法进行综合评价
在多指标的综合加权评价中,确定各项指标的权重是非常关键的环节。对各指标赋权的合理与否,直接关系到分析的结论。确定权重系数的方法很多,归纳起来分为两类:即主观赋权法和客观赋权法。主观赋权法是由评价人员根据各项指标的重要性而认为赋权的一种方法,充分反应专家的经验,目前,使用较多的是专家咨询法、层次分析法、循环打分法等。客观赋权法是从实际数据出发,利用指标值所反应的客观信息确定权重的一种方法,如熵值法、银子分析法、主成分分析、均方差法、相关系数法等。本文主要介绍熵值法进行综合评价,并使用Python进行实现。
forxtz
2021-05-27
2K0
keras.preprocessing.timeseries_dataset_from_array 较小数据集下的充分使用
场景:严格意思上不应存在这种场景,如果存在,说明数据量太小了。举个例子,假设仅有29条数据的情况下,使用LSTM模型,如果直接使用该函数进行归集数据,则会造成验证集数据的一些浪费。
forxtz
2021-05-27
1.6K0
文本挖掘(四)python电影评论情感分类模型 -- 基于keras的全连接神经网络
  使用消极、积极两类电影评论集,构建对情感分类模型,并后续用于预测。由于只有两类,因此是一个二分类模型。
forxtz
2021-04-01
1.2K0
python requests 一种通过编码的反爬虫机制
简介:遇到一个反爬虫机制,该网页为gbk编码网页,但是请求参数中,部分请求使用gbk编码,部分请求使用utf8编码,还设置了一些不进行编码的安全字符,在爬取的过程中形成了阻碍。
forxtz
2021-03-19
6440
python requests 网页编码问题
简介:不同的服务器采用的网页编码可能不一样,如果使用错误的编码发送数据,将不会得到正确的数据。
forxtz
2021-03-17
1.8K0
文本挖掘(三)python 基于snownlp做情感分析
  简介:文本挖掘中,情感分析是经常需要使用到,而进行主题模型分析之前,对数据集进行文本分类再进行分析具有必要性,因为分类以后,每一类的主题才会更明显。而snownlp是一个python写的类库,可以方便的处理中文文本内容,主要看上了他的情感分类功能(二分类),分类是基于朴素贝叶斯的文本分类方法,当然也可以选择基于其他方法自己建立一个分词模型。
forxtz
2021-03-12
2.6K0
文本挖掘(二)python 基于scikit-learn计算TF-IDF
简介:前文python jieba+wordcloud使用笔记+词云分析应用讲到可以自定义Idf文档,所以来处理处理。算法已经有现成,本文讲解基本原理及其使用。
forxtz
2021-03-11
3.9K0
文本挖掘(一)python jieba+wordcloud使用笔记+词云分析应用
  系列介绍:文本挖掘比较常见,系列思路:1-基本情况介绍(分词,词云展示);2-根据语料库的tf-idf值及创建自己的idf文件;3-基于snownlp语料情感分析;4-基于gensim进行lda主题挖掘分析;
forxtz
2021-03-11
1.8K0
深度学习笔记(一) tf.keras 构建lstm神经网络进行时间序列预测
  简介:长短期记忆人工神经网络(Long-Short Term Memory, LSTM)是一种时间递归神经网络(RNN),论文首次发表于1997年。由于独特的设计结构,LSTM适合于处理和预测时间序列中间隔和延迟非常长的重要事件。
forxtz
2021-03-09
2.9K1
python数据挖掘 pycaret.arules 关联规则学习
  关联规则分析是数据挖掘中最活跃的研究方法之一,目的是在一个数据集中找出各项之间的关联关系,而这种关系并没有在数据中直接表示出来。常见于与购物篮分析。
forxtz
2020-12-16
1.2K0
python selenium chrome option参数摘抄
python + selenium 实现快照 (保存整个网页为图片):https://www.cnblogs.com/shuaichao/p/13176915.html
forxtz
2020-11-04
9140
pandas系列 - (二)关于两期时点数据的比较
统计数据来说,有时点数据和时期数据。通常情况下,会进行两期数据的比较,现整理一个两期数据比较的场景应用。主要流程分为:
forxtz
2020-10-28
9410
pandas系列 - (三)关于时点时期数据的处理
实际工作场景中,会遇到需要处理时序表。对于少量的时点时序数据,明细数据+数据透视表,也是很快能处理完成。大量的话,可能会出现有一点慢,同时一些计算字段的每次都要设置,不太方便处理。整理一个思路:将系统的时点时序数据进行汇总整合,并形成时序表。
forxtz
2020-10-28
9870
pandas系列 - (一)明细数据汇总简单场景应用
官方文档:https://pandas.pydata.org/pandas-docs/stable/user_guide/index.html
forxtz
2020-10-27
1.2K0
python 舆情分析 nlp主题分析 (3) --gensim库的简单使用
python 舆情分析 nlp主题分析 (1) 待续: https://www.cnblogs.com/cycxtz/p/13663895.html
forxtz
2020-10-19
2.8K0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档