之前明略的吴明辉提了一个AI行业落地的三步走战略,结合对知识图谱产品的研究和设计,这里简单讲讲自己对AI行业落地以及对商业智能产品演化的理解。
一、AI行业落地的三步战略
明略提出的人工智能三步走的战略,具体如下:
第一,把行业的各种数据进行在线化,全部都连接到一起;
第二,把数据连接后做数据挖掘,做人类自己可以力所能及做的分析与研判,行业里也叫做商业智能BI;
第三,形成完整的闭环,实现人工智能落地。
面向AI的数据治理与融合主要完成多源、多模、异构数据的整合,使大量结构化、半结构化、非结构化数据(包括文档、图片、语音、视频)能够形成关联(普通关联与语义关联)、统一的数据结构,包括不带语义关联的图数据结构和带有语义关联的知识图谱。这些海量的关联数据,通过混合存储(三元组存储、事件存储、时态存储;关系型数据库、NoSQL数据库、分布式图数据库)进行管理,以支撑上层的数据分析与挖掘;
数据分析与挖掘主要对关联数据进行关系推演、统计分析、隐含模式挖掘等,这阶段还需要结合业务规则以及分析经验,完成常用业务模型的集成和演示。
到达人工智能的阶段,主要是解放人机交互的操作,减少人机交互的频率,达到人机交互的原有的效果或更好的效果。一方面,结合用户的分析经验以及常用的推演规则,把常见的分析、挖掘过程标准化、流程化、自动化;一方面,结合知识图谱的语义知识,对隐藏的关联关系进行推理、挖掘,获得新知识,完成长链推理、因果分析等复杂的操作。同时,知识图谱的语义特性,还可以给语义搜索、语音交互提供支持。
二、三步战略的关键
人工智能之所以又到了一个新的阶段,出现言必及人工智能的盛况,主要是数据发挥的作用越来越大。大量的数据积累、融合,就算是最简单的算法也能发挥神一样的作用。数据是人类特别重要的武器,帮助人类解决很多信息不对称问题。数据是观察者观察世界后,利用数学的方法或计算机的方法对客观世界发生的客观事实进行记录,这是数据本身的意义。数据本身的信息量很大,记录数据有成本。海量的数据全部存起来不可能,需要把真正有价值的数据提取出来。提取的过程称之为把数据知识化,信息知识化的过程。把这个过程做完以后,再结合行业领域的知识与行业专家,最后变成完整的人工智能智慧系统。
相比传统的数据治理,面向人工智能的数据治理最核心的是引入知识体系。为了面向人工智能,对比传统的数据治理,所有数据储备做的最核心工作要建立知识图谱的系统,需要对数据结构背后建立动态的本体和知识库。我们需要把传统的以表结构为单位的数据真正连接成为以结构化的数据,以行业的知识为基础的所有计算单元,在上面可以做逻辑推理,可以做很多的动态分析。它可以替代人做真正复杂的非统计类的工作,这需要建立知识体系,这是真正人工智能最大的价值。人工智能最大的价值不是替代简单的重复性劳动,更加重要的是替代人类甚至都可能做不到的事情。
因此,面向AI的数据治理,是在传统数据治理基础上,利用知识工程相关技术,对信息按知识结构进行管理、分类和关联,将庞大无序的信息进一步治理为分类有序互相关联的知识,最终形成行业知识图谱。
三、商业智能产品
商业智能产品是一种帮助我们进行分析和决策的系统,能帮我们整理、分析、挖掘数据,提炼数据中隐藏的信息,并通过可视化的形式呈现出来,为我们的决策提供支撑。对于数据的分析应用,一般需要满足如下的几个基本功能:
一是进行对比。其中包括微观形态的数据碰撞形式和宏观形态的整体对比形式。前者类似于小数据集条件下的应用;后者简单的如环比和同比方式,复杂一点是基于时间轴或者区域划分来判断延续性、变量关系和相关关系等。
二是观测分布。对目标数据段的整体分布进行分析,得出发散或集中度,还包括中间值判断或者某个占比的数据集中度等,观测分布的主要目的就是了解数据稳定性和集中度。
三是洞察趋势。即研判目标数据的发展趋势,分析哪个阶段变化较大,预判异常数据点可能何时发生。洞察趋势的目的就是把握工作的整体走向。
随着核心技术的发展,传统的商业智能产品开始不能满足大家的需求,像当初如日中天的I2,最后也走向衰弱。相对于传统的商业智能产品,新型的商业智能产品处理的数据量更大、种类更多、人机交互更强,并且能代替人类做部分的决策。
四、商业智能产品的演化
1、核心技术演化
在技术上,以传统运筹学为主,开始变为以运筹学+机器学习+知识图谱为主,数据转化为知识的能力、数据建模能力、数据挖掘能力都变得更强。
2、产品功能演化
针对目前市场上的相关情报分析智能产品,大致可以分为两类:类I2和类Palantir,其具体特点如下:
从最初简单的关系推演和实体建模,到知识化的关系推演,再到交互形式的更替,商业智能产品从简单到复杂,再从复杂到简单,完成的功能越来越多,也越来越智能化、自动化。
五、商业智能产品策略
从具体的产品分析来说,底层的数据治理方式,决定了其智能化的程度与效果。所以针对以知识图谱为核心技术的商业智能产品,这里提供一个简单的产品规划设计思路。
知识图谱是一种组织好的、带有语义关联的图数据结构,产品对于该种数据结构的使用方式决定了产品的进化路径:
前期:只对已经关联好的、明显的关系进行可视化操作,通过人机交互来进行推演
中期:通过本体、规则、算法推理来补全缺失的链接、属性,获取隐藏的关联关系
后期:通过与业务的结合,把关系推演的过程智能化,减少人机交互的过程
领取专属 10元无门槛券
私享最新 技术干货