前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >如何制定有效的模型应用策略?

如何制定有效的模型应用策略?

作者头像
数据派THU
发布于 2022-08-29 02:46:22
发布于 2022-08-29 02:46:22
43200
代码可运行
举报
文章被收录于专栏:数据派THU数据派THU
运行总次数:0
代码可运行
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
来源:DataFunTalk本文约3000字,建议阅读5分钟本文以一位读者在实际业务中遇到的问题为切入点,和大家分享模型策略的分析方法。

[ 导读 ] 做风控的同学都知道,要做好一个模型可能已经有一定的难度:需要我们构建适合于解决问题的样本、清晰定义目标变量、加工并选择好的特征、采用合适的模型方法等,每一步都要避免其中的各种“坑”。然而,当我们做了一系列模型之后,可能又会面临一个更加考验技巧的任务——如何有效地应用好模型,尤其是有多个模型的情况下,如何制定恰当的应用策略方法。

图1 读者遇到的业务难题

01、模型策略分析方法

模型策略是基于已有风控模型制订最优决策的整体方法,它决定了模型价值是否能够被充分发挥,直接影响信贷业务的盈利水平。模型策略分析流程主要包含样本提取、模型策略的制订、模型策略评估、模型策略的上线与验证,以及模型策略回顾,如图2所示。

图2 模型策略分析路程

1. 样本选取

样本选取是指选取制订模型策略所需的样本集,通常包含风控模型开发时的跨时间验证集(OOT)和近期授信样本集(BackScore),如图3所示。在模型策略开发中,我们只需要准备模型分和逾期标签。跨时间验证集包含逾期标签,一般是近期放款且有表现的样本集,主要用于衡量同时期新模型相对于旧模型的模型效果提升度和制订决策点(Cut-off)时的效果预估。近期授信样本集是指近期所有进入模型打分阶段的样本集,包含被模型通过和拒绝的所有样本,主要用于设定新模型在预期通过率下的模型阈值。

图3 模型策略样本划分

跨时间验证集需要包含订单标识、模型分和逾期标签列,近期授信样本集需要包含订单标识和模型分列。

2. 模型策略的制订

模型策略的制订主要决定模型的组合方式和阈值。在制订相关方案时,我们需要在转化率和坏账率之间进行权衡,以实现最大收益。模型策略应用方案可分为单模型策略和多模型组合策略。

(1)单模型策略

单模型策略是指利用单一模型分进行决策,故只需要确定单一模型的最优决策点。单模型适用场景:

  • 信贷业务开展前期,线上只有一个模型。
  • 信贷业务开展中期,虽然线上模型增多,但是模型间关联性较强,此时,大多以单模型决策为主。

单模型策略的制订决策点设定方式如下:

① 基于模型通过率与坏账率的决策点设定

在模型通过率与坏账率之间寻找一个决策点,理想的状态是该决策点的设立可提高通过率并降低坏账率。而在实际使用过程中,可能出现下列情形。

  • 保持目标模型通过率,降低坏账率。迭代后的新模型上线后,其性能(AUC、KS等指标)通常比线上正在决策的模型好。因此,在信贷业务稳定时,我们可使用此方式,在保证当前通过率的情况下,期望新模型降低坏账率。例如,当前模型通过率为30%,我们可利用近期授信样本集找到通过率30%对应的模型分,并将其作为新模型的决策阈值。
  • 提升模型通过率,保持坏账率。由于不同金融机构所处的发展时期不同,故对业务的诉求会有差异。当金融机构的信贷业务高速发展时,金融机构不一定要降低坏账率,而是需要在保持当前坏账率的同时,提升通过率。例如,当前坏账率为5%,我们需要利用跨时间验证集和近期授信样本集评估得到坏账率为5%时的模型分,并将其作为决策阈值。
  • 提高模型通过率,同时降低坏账率。当新模型的效果较旧模型有大幅提升时,新模型可以同时满足目标通过率和坏账率的需求。此时,我们需要绘制决策曲线,横轴表示模型通过率,纵轴表示坏账率。通过观察决策曲线的走势,我们可以选择合适的决策点。

决策曲线示例如图4所示,当前的决策点在A点时,我们可以选择D点为新决策点,模型通过率和坏账率都会有所优化;如果选择B点为新决策点,即保持模型通过率为40%,那么坏账率将从15%优化到5%;如果选择C点为新决策点,即保持坏账率为

如何制定有效的模型应用策略?

15%,那么模型通过率将从40%提升到60%。

图4 决策曲线示例

② 基于lift的决策点设定

lift表示风控模型对预测目标中不良客户的识别比例高于随机识别比例的倍数。以1为标准,lift小于1表示该模型比随机识别捕捉了更少的不良客户,lift等于1表示该模型的表现等同于随机识别,lift大于1表示该模型比随机识别捕捉了更多的不良客户。在通常情况下,lift的值越大越好。

我们将所有客户的模型评分分为10~20箱,从低到高排序,按分数排序累计至该分箱的不良客户占所有不良客户的比例(Cumulative Bad(%)by model)与随机排序累计至该分段的不良客户占所有不良客户的比例(Cumulative Bad(%)randomly)的比值即lift。图5为实际的lift计算示例,图6为对应的lift提升图。

图5 lift计算示例

图6 lift提升图

通过观察图6,我们可以发现,第一箱(序号0)的lift值为3.13,即该模型预测分数最低的10%客户坏账率是随机识别客户坏账率的3倍多。通过lift的大小,我们可以设定模型的决策阈值。

模型策略本质上是通过科学方法选择模型的最优决策点。上面两种决策点设定方法可以帮助我们快速设定模型决策点并上线应用,但它们主要依靠人的经验,没有考虑到决策阈值对通过率、坏账率和其他成本的多重影响。因此,它们未必是利润达到最大的决策方案。下面将介绍最优化算法在模型策略制订中的应用。

(2)多模型组合策略

多模型组合策略是基于两个或两个以上模型分组合生成的模型应用方案。多模型组合策略的优势如下:

  • 能够充分发挥多个模型性能互补的优势。
  • 内外部模型组合的使用能够有效降低数据成本。

多模型组合策略的应用方式如下:

① 多模型融合准入

多模型融合准入是指利用加权或其他方式将多个模型分融合成一个模型分,再划分风险等级上线决策,如图7所示。从本质上来说,融合后的多模型与单模型是一样的。我们通常采用等频或等距方式对模型分进行划分,一般划分为9个等级(RG1~RG8,RGX),RG1的风险等级最低,RG8的风险等级最高,RG1~RG8表示通过,RGX表示直接拒绝。

图7 多模型融合准入

② 多模型串行准入

多模型串行准入是指将多个模型以串行方式按先后顺序依次决策准入,前一个模型决策通过的样本再经过下一个模型决策进行评估,依此类推,由最后一个模型生成风险等级,如图8所示。

图8 多模型融合准入

在实际业务场景中,多模型串行准入较为常用,适用于多个优势互补的模型分,既有助于多个模型分发挥最大价值,又可节省数据成本。通常,无成本模型先于有成本模型决策。

③多模型交叉准入

多模型交叉准入分为两个阶段:

  • 准入阶段,由前置模型完成。
  • 交叉阶段,由后置的两个模型共同生成风险等级,如图9所示。在此方法中,直接由后置的两个模型交叉进行准入。

图9 多模型交叉准入

该方法的优势在于,利用模型分交叉生成的风险等级矩阵更能体现多模型的优势,风险等级的划分也更细。需要注意的是,在生成风险等级的过程中,我们要充分考虑每个交叉格子中样本量,保证其具有统计学意义。

在开发新模型时,在同一OOT样本集上,新模型在相关技术指标(AUC、KS、Gini等)上一定优于旧模型。如果我们贸然使用新模型决策,那么仍然具有潜在的风险:

  • 一是新模型训练样本集的特征一般通过回溯得到,有可能发生特征线上与线下不一致风险。
  • 二是新模型是在旧模型决策后的样本上评估的,相对于将来应用时的样本存在一定的差异,虽然新模型和旧模型是在同一样本上进行对比的,但这依然对旧模型不公平。

因此,即使线下评估新模型的效果更好,在上线初期,我们也不建议使用新模型进行全流量决策。通常情况下,我们需要采用分流测试方式,即在保持相同通过率的条件下,对比新旧模型,观察贷后逾期率的差异,从而选择更优的模型策略。

编辑:于腾凯

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-08-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据派THU 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
如何量化样本偏差对信贷风控模型的影响?
风控是信贷业务的核心,业务实践中经常会出现样本选择性偏差(sample bias),从而影响模型效果,影响信贷业务。而很多风控模型也都只能基于有偏样本建立。对于样本偏差对风控模型的影响,很多模型同学一般只是定性分析,为此,本文将尝试从量化的角度探讨这一点,希望能给大家一些方法论上的启发。
Sam Gor
2021/03/22
1.7K0
如何量化样本偏差对信贷风控模型的影响?
信贷风控中是如何做策略收紧的?
2)微观层面:对某个维度的客群(非整体)进行策略收紧,以达到优化策略效用的目的,具体方法包括了策略收紧、策略替换、策略新增。
Python数据科学
2024/07/15
2140
信贷风控中是如何做策略收紧的?
机器学习在金融风控的经验总结!
由于金融风控场景的特殊性,很多算法同学在刚进入这个领域容易“水土不服”,为了使机器学习项目(也包括图算法相关的应用)落地更加顺利,本文介绍下实践过程的一些经验和踩过的坑。
Sam Gor
2020/09/22
1.9K0
机器学习在金融风控的经验总结!
金融科技&大数据产品推荐:百融信贷决策审批系统
金融科技&大数据产品推荐:百融信贷决策审批系统
数据猿
2018/04/24
2.5K0
金融科技&大数据产品推荐:百融信贷决策审批系统
手绘 | 深入解析风控8大场景中的机器学习应用
本文详细梳理风控领域的基本概念,并将风控模型的使用场景分为8大板块,逐一解析机器学习在其中的应用。
Datawhale
2019/11/28
2.1K0
手绘 | 深入解析风控8大场景中的机器学习应用
漫画 | 深入解析风控8大场景中的机器学习应用
本文整理自《智能风控:原理、算法与工程实践》一书。详细梳理风控领域的基本概念,并将风控模型的使用场景分为8大板块,逐一解析机器学习在其中的应用。
BBBlue
2019/12/23
2.5K0
机器学习在信用评分卡中的应用
互联网金融,特别是P2P信贷在过去几年可以说经历了大起大落的过山车。在经历了2016、2017年的高速发展后,随着整体经济环境遇冷、政策层面监管趋严,行业已进入洗牌周期。特别是随着18年7月P2P暴雷潮的出现,更是为行业前途蒙上一层迷雾。
SIGAI学习与实践平台
2018/11/14
2.8K1
机器学习在信用评分卡中的应用
一文看懂风控模型所有
在当代,金融机构在风险管理的每个环节都尽可能地引入计量分析方法,依托大数据进行后台的分析回顾,不断的优化调整,使得金融机构在风险与收益的博弈过程中更快达到平衡,实现局部甚至更多空间的利润最大化。
全栈程序员站长
2022/09/06
7.1K0
一文看懂风控模型所有
【案例】渤海银行——在线业务自动化信用审核
【案例】渤海银行——在线业务自动化信用审核
数据猿
2018/05/31
1.5K0
在银行担任数据分析师是种什么体验?| CDA持证人专访
大家好,我叫郭畅,安徽大学毕业,目前就职于徽商银行总行大数据部,刚工作一年多,主要参与两项跨部门项目建设,项目中主要负责模型开发,数据分析,模型运营优化等工作。
CDA数据分析师
2022/11/17
5910
在银行担任数据分析师是种什么体验?| CDA持证人专访
互联网公司中,分析师的价值是如何体现的?
作者介绍:蔡主希,目前就职于京东金融-金融科技业务部,哥大统计数据狗,京东金融算法工程狮,可代码可软文的非典型理科男一枚,知乎号: @JovialCai。
1480
2019/08/06
6150
【风控】催收评分和不良贷款市场的机会
本研究的目标是在一家专门从事不良贷款组合的巴西公司254,914名客户的样本中开发一个催收评分模型,使用Logistic回归来识别那些更倾向于偿还不良贷款的客户。 此外,本文还提出了商业应用的建议。
陆勤_数据人网
2018/07/30
1.5K0
【风控】催收评分和不良贷款市场的机会
产业安全专家谈丨中小银行如何发展信贷业务的同时做好风控?
伴随着近期信贷业务的新一波调整,银行的风控能力成为重要的一个考核标准,资金方做“甩手掌柜”的好日子一去不复返了。对于大银行来说建设自主风控能力相对容易,他们不缺用户,不缺数据,有足够的空间和时间推新产品、小步快跑做实验,模型先跑起来,慢慢完善,自主风控能力就算有了。
腾讯安全
2019/11/28
8340
产业安全专家谈丨中小银行如何发展信贷业务的同时做好风控?
风控数据体系-简介
早期传统金融的风控主要利用了信用属性强大的金融数据,一般采用20个维度左右的数据,利用评分来识别客户的还款能力和还款意愿。信用相关程度强的数据维度大概在十个左右,包含年龄、职业、收入、学历、工作单位、借贷情况、房产,汽车、单位、还贷记录等;而互联网金融公司在利用大数据进行风控的同时,会根据需求利用多维度数据来识别借款人风险,维度包括不限于:社交类数据、消费类数据、行为类数据、多源银行账户数据等。
数字悠客
2020/06/29
4.3K0
风控策略中如何制定差异化利率定价方案
一个产品上线后,随着规模的扩大,基于风险收益的匹配原则,以及差异化营销的管理要求,除了授信额度策略之外,我们还需要制定差异化利率、差异化期数、差异化还款方式等一系列的组合拳策略。那么,如何结合模型和决策引擎,设计并上线一版差异化的利率方案,今天我们来讲讲这个项目。
Erin
2021/02/22
1.5K0
风控策略中如何制定差异化利率定价方案
金融科技:业务线
信贷业务,是一种基于信用的贷款业务,属于金融机构的资产性业务。我接触的产品形态,小额信贷、大额信贷、消费贷、小微企业贷、信用卡循环授信等。
陆勤_数据人网
2022/01/20
7040
腾讯安全天御助力打造“零接触银行” ,狙击春节“撸口子”大军
随着金融行业信贷业务的不断拓展,以贷款平台为长期饭票和生活来源的“撸口子”大军也愈加壮大。而网贷平台的蓬勃发展更是让一群伺机而动者有了更多可趁之机,成为困扰银行、金融机构的重要业务风险痛点。 近日,某银行遭受了一波“撸口子”大军的悄然攻击,再次拷问了该金融系统在防御薄弱节点的业务风控安全能力与防线。腾讯安全天御基于在金融科技领域的技术优势和领先经验,构建腾讯T-Sec 天御-星云风控平台,通过对当前进件量、通过率、授信成功及提款客户情况等维度的分析研判,有效地拦截了“撸口子”大军的攻击,获得了客户的认可
腾讯云安全
2020/02/24
1.2K0
腾讯安全天御助力打造“零接触银行” ,狙击春节“撸口子”大军
用户行为序列的特征设计和挖掘思路分享
金融风控,可以是对于信贷类金融风控(银行贷款,花呗,信用卡等),也可以是现金支出(刷微信支付余额和支付宝余额)。
Sam Gor
2021/01/05
2.5K0
用户行为序列的特征设计和挖掘思路分享
风控策略:客户分群策略详解
客户分群策略主要应用在贷前场景中。简单来说就是根据客户的不同维度将客户划分到不同的群体或组中,划分后的群组之间有一定的风险差异性或者业务含义。
Python数据科学
2023/12/12
9460
风控策略:客户分群策略详解
【案例】恒丰银行——基于大数据技术的信用风险预警系统
数据猿导读 恒丰银行基于大数据技术构建的信用风险预警系统,通过整合行内外数据形成统一的行业、地域、客户风险视图,加强风险监测、审查的全面性、准确性、及时性,强化风险预测能力,提高信贷资产质量。 本篇案例为数据猿推出的大型“金融大数据主题策划”活动(查看详情)第一部分的系列案例/征文;感谢 恒丰银行 的投递 作为整体活动的第二部分,2017年6月29日,由数据猿主办,互联网普惠金融研究院联合主办,上海金融行业信息协会、中国信息通信研究院、大数据发展促进委员会、上海大数据联盟、首席数据官联
数据猿
2018/04/24
7.4K0
【案例】恒丰银行——基于大数据技术的信用风险预警系统
推荐阅读
相关推荐
如何量化样本偏差对信贷风控模型的影响?
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验