近年来,大数据、云计算、人工智能、区块链等新技术的应用促进商业银行向数字化转型发展,金融科技手段在拓展客户、改进服务、防控风险、增强竞争力等方面发挥着积极作用。风控领域传统手段存在效率低、精度差、成本高等问题,难以满足商业银行业务创新发展的要求,智能风控作为金融科技在金融领域最主要的应用之一,在银行业受到广泛重视。智能风控平台以大数据为基础资源,以云计算和人工智能为技术依托,运用于授信审批、反欺诈等风控场景,可以提升风控效率和精度,降低风控成本,是集数据、模型、规则为一体的风控中枢。目前,国内大多数商业银行正在积极探索搭建智能风控平台,为智能风控的模型开发、决策分析和场景落地提供系统支持,推动风险防控走向智能化时代。
智能风控平台的建设目标
智能风控平台的建设以构建智能化的风险管控能力为核心目标,运用大数据计算处理技术和机器学习、深度学习模型,实现“数据采集和整合->数据加工处理->数据挖掘与分析->模型部署上线->持续优化迭代”的智能风控闭环管理。
实现风险数据整合和可视化管理。大部分商业银行在IT建设的历史过程中,由于前期缺乏数据治理和系统建设科学规划,曾形成多个烟囱式系统,大量数据分散在不同系统中,虽然商业银行通过建设数据仓库、数据集市等基于关系型数据库的系统,一定程度解决了风险数据分散的问题,但受关系型数据库存储成本高、运算能力低、支持数据类型少等方面的限制,仍有大量风险数据尚未集中存储。同时,通过数据仓库、数据集市提取数据流程较长、加工运算能力较低,缺乏便捷、有效的数据管理工具,导致风险数据利用效率不高,对风控决策支持造成制约。因此智能风控平台需要基于大数据技术对内、外部风险数据进一步整合,并实现数据的可视化管理,以便开展便捷、高效的数据处理,为智能风控提供数据支撑。
支持基于人工智能技术的机器学习建模。人工智能模型作为智能风控的“灵魂”,是商业银行应掌握的核心风控能力。人工智能模型构建往往需要复杂的机器学习算法,传统建模工具通常缺少对机器学习算法的直接支持,并且需要大量的人工编码,对于大部分银行建模人员来说使用门槛高。因此智能风控平台需支持基于人工智能技术的机器学习建模,以便银行建模人员实现智能风控模型的便捷开发。
支持风控模型快速、灵活的迭代和部署。真正发挥智能风控的作用需要依靠风控模型及时迭代优化,并进行快速部署运行。商业银行以往使用传统建模工具建模往往效率较低、模型迭代周期较长,同时模型部署通常需要预先部署决策引擎,再使用人工方式进行参数配置,操作繁琐、耗时较长且模型部署的位置不灵活,难以适应新形势下风控模型迅速迭代、快速部署的需要。为保证模型的时效性,快速适应客群风险特征的变化,智能风控平台需具备支持模型及时优化更新的能力,并可以将模型快速、灵活部署到模型运行环境。
智能风控平台建设的困难和挑战
系统架构和技术较为复杂。智能风控平台包括风险数据整合、数据可视化管理、机器学习建模、模型发布和模型应用等多个模块,需要对各模块进行横向、纵向衔接以及技术的融合运用。从纵向看,从底层数据源到上层的风控应用,需要根据数据依赖关系及业务逻辑对系统进行分层设计。从横向看,不同功能模块之间,需要根据相互调用关系进行有效衔接。同时建设过程中还要考虑分布式计算、机器学习、知识图谱、图计算等新技术以及ETL、关系型数据库等传统技术的综合运用和技术兼容问题,这些都对平台建设构成了挑战。
数据处理和数据安全管理难度大。数据问题既是平台建设要解决的问题,也是要面临的难点。通过智能风控平台进行建模的基础条件是所整合的风险数据质量有保障,但商业银行现有数据存在不同程度的数据标准不一、数据定义不明、数据口径不清以及数据缺失等问题,使得智能风控平台建设过程中的数据梳理、口径统一、数据清洗等工作耗时长、难度大。同时,平台整合行内外大量可视化风险数据,为提高数据的利用价值,更多数据需要向用户开放,增加了数据安全管理的复杂性。
自主建设能力存在不足。智能风控平台作为金融科技应用的创新实践方兴未艾,大部分商业银行由于前期缺乏技术积累,专业人才较为匮乏,同类项目建设经验不足等原因,在探索建设过程中对平台的功能边界、风控规则等难免有认知局限。同时,平台建设涉及多种风控应用落地,较难一次性完成,自主实施也存在一定难度。
华夏银行智能风控平台的建设实践
华夏银行智能风控平台通过外部引智和借鉴业内先进经验,克服了架构、技术、数据、应用等多方面的困难,共历时一年多,分两批投产上线,具备了客户风险画像、风控建模、智能风险分析等功能。第一批2019年3月投产,完成了行内多个数据源重要风险数据的整合,并引入工商数据与行内客户数据融合,第二批2019年10月投产,形成了“天机星”企业客户风险画像系统和“天算星”风控建模系统两大核心功能。
建设“天机星”企业客户风险画像系统,建立客户风险全景视图。针对企业客户关联关系存在真实情景复杂、客户刻意隐瞒从而难以充分准确识别等问题,“天机星”系统优先着力解决集团客户风险捕捉不全面、过度授信等业务痛点,力图识别每条客户关联关系的“天机”。一是构建客户谱系。进行关系挖掘分析聚合,从投资、担保、控制人关系等多维度构建关系图谱,网状呈现客户在关系图谱中所处的位置及角色,区分强经济圈、最终受益人圈、最终控制人圈、集团圈,识别企业的实际控制人,有效识别关联风险,预防外源性风险传导。二是生成客户风险画像。以客户为中心整合内外部风险信息,深度刻画剖析企业的内外部风险,形成多维立体的客户风险画像,实现从“人找信息”到“信息找人”的转变。三是提供智能分析报告。基于客户风险画像,引入智能评价策略,构建客户、集团、行业、地域等不同统计维度上的风险分析报告体系。
建设“天算星”风控建模系统,赋能智能风控模型敏捷开发。“天算星”集成了风险数据整合、数据可视化管理和机器学习建模等功能,为开发建设智能化风控模型提供建模平台,可极大地提高算力。一是对内外部风险数据进行整合。涉及内外部多个信息系统数据源,涵盖了客户、业务、担保、财务、征信、工商及银保监会客户风险信息等多种数据。二是实现风险数据分类管理和权限管理。既支持数据资源的可视化访问,提供多种格式的数据导入,大大提高数据提取和数据利用的便利性,也支持数据分类管理,实现精细化的数据分类和不同数据库之间的数据相互调用。同时支持灵活的数据权限管理,对不同用户设置差异化的数据读、写权限控制,采用树状结构配置数据库和表、用户组和用户之间的权限,实现了数据权限的灵活管理以保障数据安全。三是提供了丰富的数据处理功能。既支持数据统计、数据拆分、数据清洗等预处理功能以及特征抽取、特征组合等自动化的特征工程,也支持数据定制化加工,并同时提供菜单式和编码式的数据处理功能,从而大大降低数据处理的难度。四是支持机器学习建模。引入多种高精度的机器学习算法,支持自动、智能、精准、快速的模型开发,同时具有模型直接发布部署和模型翻译功能,大大提高模型开发、优化和部署的效率与灵活性。
采用先进架构和技术,提高智能风控处理能力与效率。一是采用高内聚低耦合的三层系统架构,便于平台管理和扩展。高内聚低耦合系统架构下,每个模块只聚焦特定的独立子功能,模块与模块之间的联系尽量少且接口简单,相比低内聚高耦合的系统架构,显著提高了系统稳定性和独立性,更便于平台管理和扩展。平台的数据整合层专注于构建大容量Hadoop数据集群,整合和存储内外部数据,供“天机星”和“天算星”共享。模型构建层专注于大数据的清洗、加工以及模型构建。模型应用层专注于通过模型运算输出模型结果。各层级功能相对独立,降低了系统各层级间的相互影响,同时又实现了数据共享。二是采用大数据处理技术提升运算性能。采用当今业界前沿的大数据处理技术,在分布式框架下将Hive和MapReduce相结合,用于支撑TB、乃至PB级的大规模数据集并行运算,实现传统技术难以支撑的海量数据批处理运算。前台数据查询采用Redis内存数据库,搜索引擎采用ElasticSearch,大大提升大数据搜索查询和计算速度。三是利用知识图谱技术,提升客户风险全景视图的挖掘探查能力。采用业界领先的Neo4j图数据库和Spark GraphX分布式图处理技术,以图的结构形式存储关联数据,无需全局搜索,仅遍历查询有限的局部数据就可以得到查询结果,并且基于简洁易用、丰富的图计算和图挖掘接口,更加方便地实现对千万级企业客户的关联谱系构建和疑似实际控制人识别,较传统技术大规模关联数据的查询和运算速度可提高数倍乃至数十倍,并提高开发效率。
总结和展望
智能风控平台的建设和运用为商业银行开展智能风控提供了更多的工具和手段。但智能风控并非无所不能,它无法取代数据治理等基础工作,也无法完全脱离建模人员的专家经验,其在金融领域的应用仍处于探索阶段,金融场景的复杂多变也使智能风控面临更多的考验。同时外部数据获取的稳定性、可用性等问题,机器学习算法本身的过拟合问题以及外部“黑产”和团伙欺诈手段的不断升级等因素都可能对智能风控实施产生挑战。未来在合规运营的前提下,商业银行应继续加强数据价值的挖掘,加大风控建模专业队伍的培养,充分利用新技术的优势,因势利导,不断加强智能风控应用的广度和深度,从而完成智能风控“将数据转化成信息,将信息转化成知识,将知识转化成能力”的增值过程。
作者系华夏银行授信审批部总经理
金融大咖“在看”什么
领取专属 10元无门槛券
私享最新 技术干货