00:26
企业数据应用最大的痛点是数据共享需求与数据隐私之间的矛盾。啊,随着科技的发展,业务的创新,很多企业目前产生了非常多的数据,但是在企业之间啊,甚至企业内部啊,数据之间常常都是割裂的,存在着非常明显的数据孤岛的现象。所以无论对于大企业还是小企业来说,为了提供啊,为了提高业务质量,提高基于数据的决策能力,从而取得竞争性优势,就需要在内部和外部进行数据融合啊,这对数据融合呢,产生了非常大的需求。
01:05
但是一个现实的问题是啊,整个社会目前对隐私保护越来越关注啊,也有很多啊,越来越多的啊。这个监管方面的法律啊,投入了这个使用,所以在这种情况下,企业急需有一套比较好的技术方案,在隐私保护和数据合规的情况下,来进行内外部的大数据融合啊,这个也是我们推出联邦学习应用服务的初衷。我们在做传统的联合建模的时候,需要把数据集中在一起,也就是说数据先要可见才能可用啊,这样呢啊,实际上是难以满足数据隐私和合规要求的。联邦学习这个技术可以通过数据加密和分布式机器学习等前沿技术对他们进行综合运用,让数据在不出私有域的情况下就能够和第三方数据进行联合建模。
02:02
数据在融合的过程当中呢,只交换了机器学习的中间值,而没有交换底层变量,所以通过这种方法,我们实现了数据和特征变量的可用啊,不可见啊,有效的解决了数据运用和隐私保护以及数据合规之间的矛盾。联盟学习的本质是要在不同数据生产方之间进行数据融合,来进行联合建模啊,也就是说啊,数据不出各自的数据中心,但是可以实现融合建模的效果。所以单凭一方是无法进行联盟学习的,因为你必须有另外一方来提供数据跟你进行融合建模。同时呢啊,联邦学习技术比较复杂,要求较高,呃,在一开始的时候呢,需要比较大的成本投入,所以选择具有呃技术和数据实力的专业团队,能够更便捷高效的接入联邦学习,降低成本。
03:07
联邦学习建模的最大特点是数据可用不可见,所以在这里啊,首先要说明的是啊,我们虽然跟呃第三方在共享数据,但是我们共享的是呃,直接交换的是机器学习的中间值,而不是底层数据。啊,那么在金融领域,腾讯安全啊和江苏银行达成了首个合作,腾讯安全啊具有大量的信息流维度数据。啊,我们基于丰富的黑灰产啊,沉淀了啊3000多个定义风险种类的特征变量。并构建了相应的特征工程,基于资金流啊,相关维度的数据也沉淀了相应的变量和特征工程啊,我们双方通过联合建模对这些变量进行了融合啊,只交换了机器学习的中间值,也就是误差和低度啊,达到了数据可用不可见的效果。
04:03
那么,通过这次联合建模,江苏银行实现了信用卡的智能化管理,在信用卡介入的规模化、盈利的规模化方面取得了重大的突破。联邦学习的概念最早是2016年由谷歌的研究科学家啊HB麦克等提出啊,随后谷歌英伟达等国外科技公司呢,也相继推出了啊联邦学习的算法框架,并且也发布了相关的产品。呃,比如英伟达,基于联邦学习,他们开发了克拉瓦平台,在医疗领域发挥了巨大的价值。腾讯呢?是国内较早研发联邦学习技术的企业。由腾讯安全研发的联邦学习应用服务,可以兼容微众银行联邦学习的技术框架F和腾讯自研的联邦学习框架power fl。
05:02
我们专注于上层的应用服务啊,帮助呃客户实现业务智能化管理。啊腾讯安全联盟学习应用服务已经申请了多项专利,拥有非常丰富的工程化工具及啊目前的解决方案,我们处于行业领先水平。腾讯安全的联邦学习应用虽然采用了标准化云交付,但实质上我们提供的是个性化的应用服务。呃,在我们标准的技术啊,建议书中,我们进行标准化的部署啊,联邦学习对客户的特定样本进行联合建模,并自动选择对建模效果有显著提升的特征变量作为入模变量。所以说对于每一个客户的具体应用来说呢,联邦学习提供的都是个性化的模型和服务。目前腾讯安全联盟学习的应用服务呢,还在持续的优化当中啊,当前一个200多个特征变量,10万数据量的模型训练,大概在五小时之内能够完成啊,未来这个数据啊,这个时间将进一步缩短。
06:16
我个人认为联邦学习的应用前景非常广阔,只要有数据融合的需求,只要在融合的前提下,我们需要进行隐私保护,每当学习都会找到非常适合的应用前景。
我来说两句