首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

抛弃爬下来的灰色数据,有门槛的风控怎么做?

大数据文摘作品 作者:魏子敏 金融风控领域的竞争在今年忽然激烈起来。众多初露头角的企业,正在这两个方向展开厮杀--数据获取能力和算法技术。 就在几个月前,前一个赛道开始堵塞。 今年6月,《网络安全法》开始实施。未经授权爬取用户手机或者社保记录,公司法人将依法获刑,最高七年;一批以数据交易为主要业务的公司也正面临调查。 一大波依靠外部数据整合进行风控和反欺诈的企业前景模糊,算法和建模能力在这个领域的重要性渐渐凸显出来,技术起家的一批风控公司开始显露头角。 而失去了灰色数据的金融风控行业,尽管技术上仍旧面临挑

07

金融科技|风控建模技术方案

在银行的传统评分卡建模中,应用的也是逻辑回归模型。逻辑回归本质上是一个线性分类模型。如果特征和标签并不是单调的增减关系,必须要做特征的分箱处理,及把特征值的主值区间划分为若干段,1个连续值特征会变为n个0-1取值的one-hot特征。对于金融科技公司在建模所遇到的大量的弱特征,如何挖掘多个特征之间的互补性,产生组合的分箱特征是一个技术挑战。暴力的NxN组合甚至更高维的特征组合,将导致特征维度的组合爆炸,依赖于模型和算力来进行模型挑选,是一个耗费机器算法的方案。而人工理解特征之间的相关性和互补性后,进行特征的分箱组合的方法,在海量特征维度面前基本不可行。

03
领券