westat 是一个pyminer开源项目的衍生产品,也可以作为一个独立的开源项目,核心功能是风控评分卡模型开发,功能与Scorecardpy和toad类型,可以实现数据描述统计、基本分箱、决策树分箱、WOE、IV计算,评分卡快速开发、,KS、ROC-AUC计算、模型排序性评估,LIFT计算,模型稳定性评估,PSI计算,模型应用分析,决策树画图等功能。
更多功能演示,可以查看github对应的examples目录——从这里开始.ipynb。
westat/从这里开始.ipynb at main · stat-fit/westat (github.com)
westat 已经上传到pypi官网和github,源码地址:stat-fit/westat: a python package for stat,caculate woe,iv, ks,auc,roc,psi and plot. (github.com)。
PyPi地址:westat · PyPI
二、功能模块
自带UCI数据集
westat自带了数据集uci_credit_card.csv数据集,方便快速上手进行学习和功能验证。
数据探索
数据分布
数据分区
特征分箱
先大致分箱并检查变量的badRate趋势
使用默认的决策树方法进行分箱
按照指定的切分点分箱
查看WoE 和 IV
按照默认的决策树方法,计算WoE 和 IV,并查看WoE的分布
计算WOE 并绘图
计算 IV 并绘图
计算 IV 绘图,并返回数据
WOE 转换
批量计算全部特征的IV
通过最小IV >= 0.02 和最大相关性
逐步回归筛选特征
查看特征相关性图
评分卡开发
使用scorecard.to_csv('scorecard.csv') ,最终生成的评分卡如下
最终生成的评分卡 scorecard.xlsx检查模型共线性
通过方差膨胀系数 VIF可以检查模型的共线性,一般认为VIF取值大于7,则表示模型存在较为严重的共线性问题
预测模型分数
计算AUC 和 KS
AUC 计算
KS 计算
KS计算并返回数据
查看评分卡分数分布 和 提升度
绘制提升度图
模型稳定型 PSI计算
批量计算所有特征的PSI
模型应用分析-决策树分析
导出决策树图片
通过以下命令,可以导出决策树为图片文件 test.svg
领取专属 10元无门槛券
私享最新 技术干货