云AI现在已经是极具影响力的话题了,那么腾讯云AI有哪些应用呢?
腾讯云AI目前能够支持的领域比较多。包括各种人脸合成、身份证识别、智能监控、人脸轧机还有语音合成、关键词搜索等方面。同时,腾讯云的机器学习的平台可以帮助开发者们快速去实现模型。
朋友圈爆款背后的计算机视觉技术与应用
图像识别领域的发展经历了CNN,R-CNN,Faster R-CNN等几个阶段。现在图像识别的流行趋势会趋于大自然的发展逻辑,是一个大循环。那么,基于这些科学实验基础,腾讯云是如何支持AI应用的呢?以五四青年活动为例,它是解决图像匹配的一个活动。首先,从训练数据开始,一般是民国时候的老照片,对它进行提取和标注数据,因为每个照片都有标注,就会生成模型。当用户玩游戏时上传照片测试数据时,会进行特征提取和建模,模型会返回一个分类,这个分数不是执行度,不完全可以参考。最后将会把一个分数最大的值返回到前端,生成页面,这是整个流程。
再以人脸融合类的应用来看,比如军装照。它的流程首先会对图像的人脸部分进行关键点的定位,把人脸上的特征提取出来,然后会对图片进行一些旋转,把它跟模版图进行统一化。下一步会把上传图片的人脸部分根据特征值抠出来,它就会跟模版图进行融合。等融合后如果上传照片的各种光线角度不完全一样,再对图片进行优化,把光影、曲线调得比较平缓,这样就呈现了非常好的效果。
对于开发者来说,掌握了这些能力,在开发出一款有趣的应用之后,如何实现商业化落地?直接把它放在网上就可以让用户下载使用吗?实际上远没有这么简单。现在的普遍做法是,都会采用云服务,尽量不在物理集上部署。为什么需要在云上部署AI应用?因为这些应用一般都会有短时间达到特别高的峰值,持续一段时间会有很快的回落。如果通过自己的IT基础设施来响应这些需求,在成本上会非常巨大,难以承担,而利用公有云,可以把一些机器的成本释放掉,这是目前从开发应用到实现收益的一整套通用商业流程。
OCR的应用集锦及背后技术
OCR是近年比较火热的领域。像身份证识别、车牌识别等都需要运用到OCR技术,而像身份证识别的场景又非常多。因此,OCR作为一项通用型的基础技术,有非常广泛的用途及商业价值。在很多需要人力资源来完成文字识别的工作,比如快递行业的运单识别,保险行业的资料识别,通过OCR技术的利用实现了较大程度的生产力解放。对于开发者来说,借助于OCR技术开放的API,即可完成在各种生活场景的应用开发。
腾讯云现在能够提供多个场景中的印刷体OCR服务。在通用型的OCR场景中,除了证件,还能够识别驾照、车牌、银行卡、名片等等。另外,OCR服务要求准确,以及完备,即能够识别中英文和字符。腾讯云正在由常用语言和字符,例如中英文等往外扩散能力,将识别范围更加扩大。
目前,在银行业等对数字高敏度的行业,对OCR的应用广泛且要求极高。腾讯不仅是第一家将手写体应用在实际场景中的,而且数字的识别率也高达90%以上,单字的识别率在15毫秒以内,复杂汉字超过80%。腾讯云的OCR服务在权威测评中表现也非常出众。在国际模式识别协会(IAPR)举办的文档分析与识别、模式识别领域世界上最权威的国际学术会议ICDAR(International Conference on Document Analysis and Recognition,即国际文档分析与识别大会)上,腾讯OCR识别在ICDAR2015 「Focused Scene Text」场景文字识别任务、ICDAR 2015「Robust Reading Competition」的自然场景文本检测项目中均得到第一名。
腾讯云现在可提供基于各种场景下的OCR服务接口,开发者可以免费使用这些服务来搭建自己的应用。比如,开发者实际需要开发的一个具体场景的软件,需要用到手写体识别或者做一个通用的OCR识别时,可以直接在腾讯云上调用对应的服务来完成应用开发。
腾讯云OCR的应用场景很多,目前在快递运单识别以及保单识别上有明确的目标客户。类似于这种项目一般是定制化服务,都是针对性地解决一个具体的问题。腾讯云根据具体场景下的问题和具体的生产流程来开发一套系统,或者开发一套流程来配合实际的业务,来提高生产效率。
以快递运单识别为例,快递手写运单必须入库才能进行投递,人工识别录入的效率很低,在运用腾讯云的OCR系统之后,每日处理量可达到一千万单,相当于三千多个人三班倒的工作效率。另一个案例是泰康核保,在通常的购买健康保险流程中,都会对购买者病史进行审核,审核包括购买者之前的体检资料以及指定医院的体验资料,通过这些资料分析,来判定购买者身体状况。现在的解决方案是使用腾讯云的OCR,同时与泰康的医疗专家共同设计医学知识库加入到定制化系统。
除了以上两个场景,腾讯云在不同的OCR应用中还有江苏银行、小米等客户。包括工商管理总局的广告监督局也在使用腾讯云OCR的多款服务。
智慧工地:履约考勤系统的应用实践
在目前的智慧城市、智慧工地等领域的建设也充分应用了数字化技术。为响应交通运输部公路品质工程建设的号召,工程建设需要加强四新技术的应用,包括新材料、新设备、新技术以及新工具的应用。在工程项目相对灵活的突发的工作环境中,履约考勤系统往往承担着较大的负荷,现在利用AI技术,就可以实现履约考勤管理的智能化。而一般开发者也可以根据一般企业的需求利用AI技术来开发有特点的产品。
当前主流的考勤方案大约有7种,包括指纹考勤、ID卡考勤、纸卡钟考勤、人脸识别考勤、虹膜识别、指静脉识别、摄像考勤机。这些方案在实际应用中,在兼顾效率和避免冒名顶替方面都不是很理想。而因为工程建设与参建方的监督与被监督关系,决定了管理部门对履约人员信息的真实性有更高的要求。
通过用腾讯云的AI技术,增加的云端功能非常重要。比如,在施工现场普遍存在人员变更的情况,人员变更以前需要业主或者项目部自行变更,现在有了AI技术,变更的信息可自动识别出来。目前考勤的智能化主要从六个方面考虑,第一是确保在云端;第二是基于AI;第三是基于云计算;第四是要连接大数据;第五是需要是移动应用;第六是支持智能设备。
同时,它还需要具备五个特点:一是具备人员人脸基本信息的采集和录入功能;二是能够基于人员人脸信息的自动识别、采集、比较;三是支持人员信息与人员身份证信息的核验;四是支持考勤地点的设置及异常考勤位置的判断;五是支持关键岗位的异常考勤信息预警以及关键岗位缺勤信息进行预警,支持对履约人员信息变更进行在线管理。具备这些能力,就能在云端对考勤的结果进行验证,实现智能化的考勤管理。
腾讯云的智慧考勤主要包括四个主要技术方案。第一是人脸对比,腾讯云的人脸对比是根据面部特征计算两张人脸的相似度,自动进行身份鉴别;第二是个人证核身的功能,腾讯云的人证核身也是人脸核身,通过用户自拍视频或者一张自拍照与另外一张用户事先留存的照片进行人脸验证,确认用户身份,主要用来帮助提升业务办理效率,降低人力成本;第三是活体检测,腾讯云的活体检测是通过人脸特征点定位跟踪识别进行3D人脸重建模型,判断是否为真人,它支持多平台,包括CPU、GPU计算模式,灵活部署;第四个是基于LBS的定位服务,通过电信移动运营商的无线电通讯网络,GSM,CDMA网获取移动终端用户的位置信息,包括地理坐标或者是大地坐标。
云检智慧履约考勤系统目前能够实现考勤数据的动态分析,包括对缺岗异常的数据实现实时预警的功能。主要有四个功能:一是人脸识别考勤机,主要作用是前端数据采集,包括人员信息登记,人脸考勤以及数据上传;二是用到移动端的APP,主要用于人脸考勤、人证核身;三是履约考勤管理云平台,主要是针对考勤管理、审批管理、统计分析、系统设置等;四是用到API,提供移动APP调用应用程序的接口,主要是腾讯云技术服务以及人工智能当中的人脸对比,人证核身的这类应用。
除了智慧工地领域,人脸识别解决方案在很多场景中应用非常广泛。随着技术的发展、市场扩大,人脸识别技术在现实生活中发挥的价值及作用也越来越大。
游戏中的AI技术应用
对游戏AI的理解因为身份的差异,其目标各有不同。对游戏开发者而言,运用AI是为了增进用户体验,增加玩家活跃度。现在几乎每款游戏都有运用AI,比如说射击类游戏会有地图,如果有一个非常好的AI帮助玩家去探索地图会非常节省时间,因此AI对于小游戏开发者来说非常重要。
业界的游戏AI技术常用的方法一般是三种。一是行为树;二是基于搜索方法;三是基于学习的方法。今年游戏行业最有影响的是Dota2,它在5个特定英雄等限制条件下的AI能力能够超过90%的玩家,它就是采用强化学习的方法,其它的很多主流游戏都在尝试使用强化学习解决。
以风靡的王者荣耀为例,MOBA游戏AI的做法和遇到的问题有哪些?因为王者荣耀是一款实时对战的游戏,以竞技对战为主,复杂程度表现在英雄角色会非常多,也会带来很多关于AI的复杂问题。第一是MOBA类游戏操作序列及状态空间非常大;第二是游戏包含很多知识,如何去表达;第三是MOBA决策问题复杂度高。
对于这些问题,解决方案方案分为三个方面。一是引入框架进行分层,对任务分层和场景切分;二是引入了多模态的特征表达方式;三是采用多深度学习模型结合。
了解了基本情况后,在游戏AI开发的时候还会遇到很多坑。在游戏开发阶段需要什么样的环境?第一个需要环境是模拟器的问题。目前主要是基于这个环境来调优。AI接入可以使用基于服务器架构,游戏引擎跟算法引擎是分开的,而它们之间是通过通信的方式来进行处理的,它的优点是游戏引擎跟模型进行偶合,并且支持在线学习,因此可以不断强化和更新版本。
就整个游戏AI领域来说,主要是强化学习。与之前最显著的变化就是——以前是基于规则,现在主要基于学习来开发研究。而如果是基于深度学习的方式,就至少要提供相关的环境给开发人员,以及怎么更新迭代。另外,现在的游戏AI还是比较有难度,但同时也充满机会。
腾讯人工智能业务应用
第一是微信。语音输入是腾讯在微信AI的大胆尝试。通过在输入框输入语音,语音就可以转化为文字。看似是一个非常简单的AI应用,背后却隐藏着复杂的语音识别算法。其次是在QQ音乐里的尝试。当我们听到一首歌但却不知道歌的作曲和演唱者的时候,就可以通过简单的哼唱将这首歌在曲库里面找出来。第三是腾讯优图。腾讯优图是基于图象和人脸深入研究的人工智能研发团队。它的应用场景主要是社交中的智能鉴黄,基于过去建立的庞大黄色图库,优图团队研发的智能鉴黄机器人可以达到99.95%的识别率。第四是腾讯的滨海大厦,主要应用技术是刷脸门禁。进门不需要刷卡,只需要小机器人做刷脸,甚至不需要正面,侧面都可以识别出来。
腾讯AI LAB与腾讯云
2016年开始腾讯公司也开始了AI战略布局,其目标是让腾讯的AI LAB成为全世界顶尖的AI研究机构。成立不到一年,腾讯AI LAB就推出了围棋机器人,在3月18日举办的第10届UEC杯世界计算机围棋大赛上,首次亮相的“绝艺”11战全胜夺得冠军,充分体现了腾讯在AI技术研究方面的实力。腾迅云一直以来拥抱开放,主要做连接和生态,把腾迅过去海量的互联网经验、先进的技术通过这个平台开放出来,连接更多的行业和应用。在云上拥有了资源、数据和算法之后,除了应用在腾讯自身的应用上,也通过AI cloud把这些能力分享给客户,以产生更多的市场价值。
腾讯云AI Cloud 服务矩阵
简单来说,腾迅云AI Cloud服务矩阵服务三类目标群体,一个是基础研究。基础研究员可以通过云服务器以及深度学习平台快速搭建一个学习环境,以加速技术研究。其二是对应用开发者,通过对外开放图象识别、语音识别接口,可以让开发者在应用中使用一些具有一定实力的人工智能能力。第三是与行业融合,结合云计算本身的资源优势以及在AI上的技术实力,给大家提供垂直的行业解决方案。
DI-X深度学习平台
DI-X深度学习平台是基于腾讯云强大计算能力的一站式深度学习平台。通过可视化的拖拽布局,组合各种数据源、组件、算法、模型和评估模块,让算法工程师和数据科学家在其之上,方便地进行模型训练、评估及预测。目前支持 TensorFlow、Caffe、Torch 三大深度学习框架,并提供相应的常用深度学习算法和模型。
腾讯云发布的 AI 安全能力矩阵图,以大数据、机器学习、图计算、知识库等核心技术为基础,发展以安全为导向的社交图谱分析、图像自动识别、知识表达与推理、自然语言处理四大当前热门 AI 领域为组合,形成智能身份鉴定、威胁情报分析、异常流量检测、网络攻击溯源、人机行为识别、恶意图片识别、垃圾文本检测等7项技术应用。
腾讯云将上述 AI 安全能力与不同场景结合,便诞生了对应的 AI 安全产品矩阵。目前,腾讯云上应用到 AI 能力的安全产品已经涵盖业务安全(天御)、主机安全(云镜)、数据安全(数盾)、移动安全(乐固)、账号安全(祝融)、网站与流量安全、内容安全、风控安全等8项安全解决方案,实现由技术能力到场景应用的闭环贯通。