国内互联网企业在AI领域的典型应用场景,AI基本概念(如深度学习,训练、推理,主流框架、模型等),Intel在AI领域的相关方案及技术特性。
【课程目标】
了解互联网企业的典型AI场景
了解AI基本概念
了解英特尔AI相关方案
了解第二代英特尔至强可扩展处理器针对AI的新特性
英特尔是半导体行业和计算创新领域的全球领先厂商,以智能互联技术奠定全球创新基石。英特尔创始于1968年,拥有50余年推动技术创新和耕耘产业生态的成功经验。如今,英特尔正转型为一家以数据为中心的公司。英特尔的战略愿景聚焦于三个方面:一是致力于生产世界上最好的半导体芯片;二是引领人工智能与“自能”革命;三是做全球领先的端到端技术平台提供者。英特尔正与合作伙伴一起,共推人工智能、自动驾驶、 5G及物联网等领域的技术创新与应用突破,驱动智能互联世界,从而解决人类面临的重大挑战。 英特尔于1985年进入中国,是在华高科技领域最大的外国投资企业之一,协议总投入约130亿美元。中国是英特尔全球战略之重点,英特尔在中国拥有美国总部之外最为全面的业务部署,覆盖了前沿研究、产品技术开发、精尖制造、产业生态合作、市场营销、客户服务、风险投资和企业社会责任等。英特尔中国现有员工约9,500人。扎根中国三十四年,英特尔见证并深度参与了中国的改革开放,从浦东开发、西部开发到振兴东北等,英特尔一直跟随改革开放的步伐,积极带动区域经济发展,为高端制造持续注入新动力。 2014年12月,英特尔宣布在未来15年将为成都工厂投资16亿美元,首次引入英特尔最先进的高端测试技术( ATT),使成都工厂在原有的芯片封装与测试业务之外进一步升级为英特尔在美国境外唯一的ATT技术工厂;该技术已于2016年11月18日正式投产。 2015年10月,英特尔宣布投资55亿美元,将英特尔大连工厂升级为非易失性存储技术制造基地;该项目已经于2016年7月正式投产, 2017年发布了两款全新的基于3D NAND的数据中心级固态盘;其二期项目已经在2018年9月投产英特尔最先进的96层3D NAND产品。英特尔中国研究院是英特尔全球五大创新中枢之一,而英特尔亚太研发中心已发展成为英特尔在亚洲最大的综合性研发基地之一。 英特尔中国积极履行企业社会责任,涵盖了人才培养、员工关爱、多元化和包容、环境可持续、供应链建设、志愿服务等领域。英特尔连续20多年被教育部评为最佳合作伙伴。我们持续支持英特尔杯嵌入式大赛、英特尔杯软件创新大赛和人工智能人才培养等项目,开展丰富多彩的校园活动,每年都有上万名学生的直接参与,受益青少年数以十万计。英特尔中国员工在2018年参与志愿活动人数达8,636人,贡献志愿服务时间超过12万小时,参与比例为69%; 10年来累计志愿服务时间超过72 万小时。我们把公司运营与环境可持续发展协调并进,积极减少碳足迹;还和政府、产业链以及公益组织深入合作,共同推动绿色可持续发展。全球独立机构声望研究院发布的“中国最具声望的公司”( RepTrak? 100) 2018年百强排行榜中,英特尔荣登榜首。
当前互联网企业的典型AI场景主要可以分为计算机视觉、语音、自然语言处理和推荐这几大部分。在计算机视觉领域主流的分类场景包括图片鉴黄、视频分类等等。目标检测通常应用于人脸检测、细胞检测、围棋黑白子检测、文本检测等等。除此之外,图像增强、去模糊、超分辨率、图像风格化、高级滤镜、看图说话也都是计算机视觉领域的常见AI应用场景。
语音相关场景主要体现在语音和文字的相互转换上,可以分为语音识别和语音合成两类任务。语音合成过程,包括文本分析、页面生成、单元选取、波形串联等步骤。语音识别过程,包括预处理、特征提取、声学模型、语言模型和字典解码等步骤。例如,微信上有语音转换文字的语音识别场景、QQ浏览器上有文字转换成语音的语音合成场景,以及声纹识别、风格转换、语义理解等相关应用。
自然语言处理也是互联网企业的典型AI场景之一,例如语种之间的互相翻译、文本分类、关键字词搜索、文本生成摘要,以及聊天机器人、问答系统等等都是自然语言处理相关的典型AI场景。常见的应用,例如谷歌翻译、百度翻译、搜狗翻译等人工智能行业巨头推出的翻译平台,通过分析文本内容实现的垃圾邮件过滤,通过文本情感分析实现的检测在线评论中的差评信息等等。推荐相关的AI场景更是渗透在我们生活的各方各面里。推荐系统能够快速找到用户感兴趣的内容,并且解决了长尾内容无法被展示的问题,例如电商平台的商品,如果许多商品用户看不到,就会导致卖不掉积压在仓库里面的情况,另外长尾内容得不到展示,很多创作者也会因为无法获得流量而离开。目前主流的App都集成了推荐系统,例如购物平台、新闻推荐系统、推荐歌单等等,那么推荐系统也给互联网公司带来了非常大的收益。
AI即Artificial Intelligence,人工智能。首先我们介绍AI的几种实现方法。认知推理,就是将人的推理功能赋予机器,这类方法通常具有庞大且多样性强的海量数据集,可以检测出其中的相似性和异常。一个典型的应用场景就是反洗钱领域。在反洗钱交易识别中,通过对海量历史交易数据和行为数据的分析,把成千上万维度的和百万级别的数据作为参考,结合过去已有的可疑案宗和业务专家的经验,建立银行的知识库就可以自动的学习资深反洗钱专家对可疑案宗进行等级分类和排序上报的思路。利用专家的审核结果,自动学习并全方位提取与洗钱行为相关的信号,从而实现对可疑案宗的自动分类及排序。通过认知推理,可以识别异常交易行为和异常关系、发现复杂的洗钱行为,提高反洗钱可疑交易识别效率,从而整体提升商业银行的反洗钱技术能力和业务能力。
目前领先的金融科技公司的机器学习模型可以达到资深反洗钱专家的95%的业务水平,辅助人工审核能够节省30%以上的人工审核工作。那么这样就大大增强了总行对整个反洗钱审核流程的把控,降低了人工失误、人才流失、内外勾结等问题带来的危害。类似的场景还有贷款欺诈侦查、预防性维护等等。
机器学习是人工智能的子领域,也是人工智能的核心,它是一门多领域交叉学科,涉及到了概率论、统计学、算法复杂度理论等多门学科。研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能或不断改善自身的性能。机器学习理论主要是设计和分析一些让计算机能够自动学习的算法。机器学习一般具有表格形式,且条目有限的数据集。常见的应用场景,如智能引擎、逻辑回归、异常检测、特征抽取等等,具有参考数据维度多、覆盖全面、分析复杂、评估全面等客观特点。
深度学习是机器学习的一种,属于机器学习的子类。来源于人类大脑的工作方式,是利用深度神经网络来解决特征表达的一种学习过程。为了提高深层网络的训练效果,人们对神经元的连接方法以及激活函数等方面作出不断调整,其目的是在于建立模拟人脑,进行分析学习的神经网络。模仿人脑的机制来解释数据,如文本、图像、声音等等。通过组合底层特征,形成更加抽象的高层表示属性、类别,或者特征,从而学习样本数据的内在规律和表示层次,发现数据的分布式特征表示。深度学习往往具有庞大且类别统一的数据集,具有较高的准确率。常见的应用场景如人脸识、图像,语音识别、自然语言处理、模式识别等等,是目前互联网公司AI应用的典型方法。不过,一个深层的神经网络,每一层都代表一个特征,而当层数越来越多,我们也许根本就不知道它们代表的特征是什么,我们就没法训练出来的模型用于对预测任务进行解释,也就是说深度学习很多时候我们都难以理解。但是机器学习就不一样了,比如决策树算法就可以明确地把规则罗列出来,每一个规则,每一个特征都是可以理解,具有可解释性。
机器学习,能够适应各种数据量,特别是数据量较小的场景,如果数据量迅速增加,那么深度学习的效果将更加突出。这是因为深度学习算法需要大量的数据才能理解和准确分类。深度学习具有许多隐藏层的分级方法,能够对图像、语音和自然语言等数据进行准确的分类,在互联网企业高性能计算领域具有非常广泛的应用。相比之下,其它传统机器学习技术,通过隐藏层、实施集群回归和分类更常见于企业用户。在应用场景层面来讲,机器学习在指纹识别、特征物体检测等领域的应用已经基本达到了商业化的要求。深度学习主要应用于文字识别、人脸技术、语义分析、智能监控等领域。目前在智能硬件、教育、医疗等行业也在快速的布局中。一个完整的深度学习框架包含两个主要部分,训练和推理。
通过训练算法构建模型,通过不断的优化自身参数来让自己变得更加准确,最终得到一个数据结构。其中所有的权重在其从训练数据集中所学到的内容的基础上进行了平衡。但是一般来说,深度学习的训练过程对计算的消耗巨大,需要大量的时间进行训练,建模的时间就显得尤为重要。经过训练后的模型,能够根据新的数据对事物进行猜测和推断,举一反三这种行为,则是推理。推理可被部署用于新数据的分类预测和识别,推理的吞吐量总体拥有成本以及可扩展性都是衡量推理性能的标准。下图为传统机器学习与深度学习的区别示例:
深度学习需要我们思考如何指导模型找出最佳的特征,深度学习对比机器学习,不再需要人工设定指定的特征,分类的特征是模型自己学到的。深度学习会自动的找出这个分类问题所需要的重要特征,并且通过在模型中反复调优参数,提升推理的准确率。
这里举一个图像分类模型的例子。
机器学习,也可以分为监督学习和无监督学习。二者最显著的差别在于监督学习时,我们需要为模型提供一个基本事实,即数据的label。训练模型同时为模型提供正确答案,在学习过程中找到一个最优的模型,从而实现后续对未知输入的预测。而对于无监督模型,我们向模型提供数据,但却并不提供其正确答案,输入的数据没有被标记,那么就需要模型寻找其中的规律性,分析所收到的数据。这样做的优势在于无监督学习可能会为我们提供一些在数据集中尚未知晓的信息,比如数据的内部潜在联系。
左侧为监督学习的例子,输入数据为历史房屋的销售数据,分别有两种label。通过训练分类器得到一个超平面,继而就可以对新的输入进行一个预测,即预测移动新房屋的价值。右侧是无监督学习的例子,可以看到输入数据没有进行分类和标记,但是通过学习,在学习的过程中自动从数据集中发现了隐藏的模式集群或社区。
Intel AI投入了大量的精力和人力。从软件到硬件,我们提出了人工智能全堆栈的解决方案。在解决方案层面Intel能够开发应用,并共享完整的AI解决方案,从而加速客户从数据到洞察结论的推进过程。在平台层面,Intel提供了多种一站式、全堆栈,且用户友好的系统方案。可由用户快速部署并加以使用。
在工具层面,Intel提供了大量的生产力工具,用于加速数据科学家与开发人员的AI开发进程。其中包括OpenVINO的工具包、Intel Movidius软件开发套件等等。在框架层面,Intel立足硬件对最流行的各类开源框架进行优化,同时推动其提加速发展。
目前已经针对业界常用的TensorFlow、Caffe、mxnet等主流深度学习框架做了针对英特尔架构的优化,并且均为开源项目,而且均取得了显著的性能提升。在2016年底,Intel还开源了基于Spark的分布式深度学习框架BigDL。
BigDL是一种基于Spark分析流水线,以有机方式构建而成的分布式深度学习框架。它的优势在于可以直接在现有的Hadoop和Spark集群上进行运行,不需要对集群做出任何的修改。用户可以借助BigDL将Sprak和Hadoop作为统一的分析平台,从数据的获取、清洁、预处理、数据管理、机器学习、深度学习,以及部署于可视化。BigDL可以帮助用户一站式完成所有的工作。
英特尔有很多与AI相关的软件工具和库。
以上都是英特尔架构之上的常用AI相关的软件工具和库,感兴趣的同学可以自行了解细节。
第二代英特尔至强可扩展处理器上,我们引入VNNI指令集,矢量神经网络指令集。该指令集的本质是让AVX-512单元支持8位INT数据的运算。
以下是来自客户的两个真实案例分享。第一个应用场景是视频分析。
第二个案例是非法图像过滤。
课程学习交流
请扫码关注腾讯产业互联网学堂微信公众号