作者 |顾钧
5G,物联网,边缘计算,万物互联。这些名词越来越频繁的出现在人们的视野中,话题热度也是不断升高。甚至隐隐有超过云计算的势头。
一个很重要的因素在于,针对人的数据连接已经接近完成。这一点可以从我国放缓的互联网/移动互联网用户数,以及用户平均每日上网时长上有所体现。
于是乎下一波机会,就从连接“人”与“人”转向了连接“人”与“物”,甚至连接“物”与“物”。从某运营商的开放数据上可以发现,以上海为例,物联网的连接数早已超过了整体数据连接的1/4。
然而,这些物联网场景还较为单一,比较典型的无外乎是汽车的智能中控系统与各种智能仪表(水,电,煤)。汽车的智能中控本质上和智能手机没有显著的差异。而智能仪表,一个月才上传一次数据。在降低人工成本以外,很难为企业带来额外的商业价值。因此,人们虽然都意识到物联网中潜在的巨大机会,但提起物联网、边缘计算的时候却往往毫无头绪。
综合业界目前的探索,IoT/Edge的计算场景大体可以分为以下三类:(按相对成熟度由高到低排序)
工业互联网
内容体验分发
智能物联网
工业互联网(IIoT)
现代化工业设施(制造业流水线,发电站等等),会有大量智能传感器不断收集当前信息。事实上,这个类型的数据并不是今天才有的。针对工业数字化场景的实时数据库已经有了较长的发展历史,数据压缩,处理,分析模式也已经较为成熟。
但传统的实时数据库往往数据采集点比较单一,缺乏数据联动处理与分析。今天所流行的时序数据库就是要弥补实时数据库数据点相对单一缺乏联动分析的短板。在这一领域已经有了不少成熟的方案与探索。比如,InfluxDB等。
针对工业互联网场景,各个科技巨头也纷纷推出了自己的技术方案。硬件厂商主要提供形形色色的MCU,ARM终端,边缘ASIC处理器等;而云厂商则主推边缘网关(Edge Gateway)加上云后端的架构。开发人员面对着琳琅满目的方案与架构,有时甚至不知道该从何处开始学习,该选择什么样的方案。
其实,对于以处理传统的结构化数据为主的工业互联网而言,IoT/Edge更多的是一个场景,而不应该是一种新的技术。好的方案应该能方便开发人员重用已有的开发经验与技巧。尤其现在大量涌现的边缘ASIC处理器,编程接口各不相同,应用开发的前期学习成本大增,又很难复用。
而云厂商主推的架构中,IoT/Edge侧几乎只负责数据采集,后续的处理全都交由云平台。姑且称之为“厚云架构”。
在实际的落地场景中,IoT/Edge侧对数据处理的时效性会有较高的要求。厚云架构的效果可能会受到网络稳定性和延时的考验。这也是为什么大家都十分期待5G网络的原因:高带宽和低时延。然而,5G先期普及阶段主要聚焦在高带宽方面,低时延特性可能不会那么快到来。而且,类似风力发电场这样的工业设施往往在较为偏远的地区,移动网络覆盖可能不会像城市区域这么稳定。
越是成功,越容易出现路径依赖。厚云架构,也许符合厂商的利益,但可能并不适合实际落地。混合云也许是个更合适的选择。边缘侧负责数据采集后的汇总、推理计算、实时报表;云端负责数据归档、深加工及模型训练。云/边各司其职,对于开发人员来说,系统建设的难度也会大大降低。
内容体验分发
5G,城市光网,家庭用户的宽带体验一下子上升到了千兆级。如果只是在线看个4K视频,千兆的带宽无法得到充分的发挥。于是,运营商开始考虑推广Cloud Game/VR这样的应用场景。Cloud Game/VR是否能得到用户的认可,还有待观察。但其背后的理念值得关注。
传统的内容分发网络CDN,仅针对简单的图片,视频等内容。用户从CDN节点抓取内容后,在本地进行消费。而Cloud Game/VR的模式则不是简单进行内容分发。而是将游戏/VR在服务器端渲染后形成流式内容再发送给用户端。这样一来,用户可以在比较简单的硬件终端上获得更丰富的体验。这种从内容分发,进化成体验分发的思路,相信会在未来催生相当丰富的应用场景。
智能物联网
以AIoT为代表,主要处理非结构数据,在终端或边缘节点进行一定的AI类计算。
智能手机与3/4G网络带来了移动互联网的大爆发。时至今日,中国移动互联网用户的平均使用时长已经达到了6小时/天。不过使用时长的增长已经进入平台期,可以说6小时基本就是用户通过智能手机来上网的上限。
对于想要进一步渗透用户生活的科技公司来说,AIoT可能是下一个智能手机。2018年的智能音箱热潮就是一个小小的证明。但想要融入用户的生活,AIoT设备的能力绝不能停留在简单的智能音箱上。
AIoT设备会承担更多与人交流,接受指令的工作。从技术的角度来看,AIoT终端会处理大量图片、视频、语音、文本等非结构数据。这些数据之所以称之为非结构,是因为这些数据无法以传统方式进行处理与价值挖掘。从非结构数据中提取有价值的内容与信息,直接催生了现在如火如荼的AI应用大发展。
深度学习目前被认为是最有效的非结构数据处理方式之一。非结构数据经过深度学习模型的处理,会被向量化。于是,非结构数据的分析处理被转化为对向量的处理(近似搜索)。虽然处理图片,视频,语音和文字的深度学习模型各不相同,但最终的向量处理需求却是相通的。因此,向量搜索引擎是AI应用的基石之一。
对于AI应用开发人员而言,开源的深度学习模型大幅度降低了开发成本。而开源的向量搜索引擎Milvus,则降低了AI应用落地的难度。Milvus不但集成了业界成熟的向量相似度搜索技术,更在此基础上对高性能计算框架进行了大幅度优化。在高性能、低成本、易用性、适用场景等方面,Milvus都为用户带来了极大的便利。欢迎大家前往GitHub上搜索并关注Milvus项目。
总结
万物互联已经逐渐从一个口号,一个愿景变成了一个现实。虽然目前IoT/Edge领域依然没有形成统一的标准与最佳实践,但同时也蕴含着巨大的机遇。我相信善用开源和AI,能帮助广大开发者更好的把握下一轮的机会。
Milvus 正在建设线上开发者社区,如果对 Milvus 的技术讨论和试用感兴趣,欢迎扫描下方微信
作者简介:顾钧,ZILLIZ首席架构师,毕业于北京大学。15年数据库相关工作经验。目前在ZILLIZ从事异构众核数据分析引擎的产品化工作。加入ZILLIZ之前,曾就职于IBM、Morgan Stanley、华为等跨国公司。
【END】
领取专属 10元无门槛券
私享最新 技术干货