击上方
“蓝色字”
可关注我们!
今日分享:API介绍 标准化
在上一篇文章中介绍了如何对数值型数据进行归一化处理,详情点击
数值型数据特征处理之归一化
,可知,归一化处理容易受到数据异常点的影响,效果不是特别好,因此今天分享另一种常用的处理方法:标准化
一:标准化
(公式)
该公式也是作用于数据中的每一列数据,x为该列数据中的某一具体值,mean为该列数据的平均值,std为方差,σ为标准差(该值可以考量数据的稳定性),具体如何计算可参考上面给出的公式。
二:sklearn特征化API
三:StandardScaler语法
四:标准化流程
实例化StandardScaler()
通过fit_transform转换
五:Demo代码演示
主函数
输出结果
六:标准化评价
相较于归一化处理方法,其受异常点影响较小。经过方差标准差处理后,结果比较稳定,适合嘈杂的大数据场景。
公众号QQ群
扫QQ群二维码进交流学习群
领取专属 10元无门槛券
私享最新 技术干货