在算法层面,深度学习算法模型存在可靠性及不可解释性问题。首先是可靠性问题,深度学习模型离开训练使用的场景数据,其实际效果就会降低。由于训练数据和实际应用数据存在区别,训练出的模型被用于处理未学习过的数据时,表现就会降低。其次是不可解释性问题,深度学习计算过程为黑盒操作,模型计算及调试的执行规则及特征选取由机器自行操作,目前尚无完备理论能够对模型选取及模型本身做出合理解释,随着相关算法在实际生产生活中的融合应用,存在产生不可控结果的隐患。
在数据层面,主要存在流通不畅、数据质量良莠不齐和关键数据集缺失等问题。具体来看,
一是数据流通不畅。目前人工智能数据集主要集中在政府和大公司手里,受制于监管、商业门槛等问题,数据无法有效流动;部分有价值数据,如监控、电话客服等数据目前没有合法渠道获得;
二是数据质量良莠不齐。数据标注主要通过外包形式,劳动力水平决定了产出的标注数据质量。
三是关键领域和学术数据集不足。计算机视觉、自然语言处理等领域的数据资源严重不足,同时目前我国产业数据主要供给给产业界,目前学术界数据集数量较少,可能影响科研及前瞻性的技术研究。
在软件框架层面,实现深度学习应用落地的推断软件框架质量参差不齐,制约了业务开展。由于深度学习应用场景众多,相关应用呈现碎片化特点,用于实现后应用落地的开源推断软件框架无论在功能还是性能层面距离实际需求还存在相当距离,与训练软件框架趋同趋势不同,产业界所使用的推断软件框架需要聚力研发,尚未形成具有实际标准意义的优秀实例。
在编译器层面,各硬件厂商的中间表示层之争成为技术和产业发展的阻碍。目前业界并没有统一的中间表示层标准,并且模型底层表示、存储及计算优化等方面尚未形成事实标准,导致各硬件厂商解决方案存在一定差异,导致应用模型迁移不畅,提高了应用部署难度。
在 AI 计算芯片层面,云侧和终端侧对计算芯片提出了不同的要求。对于云侧芯片,随着深度学习计算需求的逐渐增加,业界希望在提升云侧芯片运算效能的前提下,希望针对不同网络实现更优化的性能表现,而功耗比则不是首要关注的因素;对于终端侧芯片,在功耗为首要要求的情况下,更加注重的推断运算的性能,并且不同终端应用场景对芯片提出了更多个性化需求,如在人脸识别摄像头、自动驾驶汽车等场景(部分内容来源于网络如有侵权请联系删除)
欢迎您分享文章,让更多有需要的人看到。
领取专属 10元无门槛券
私享最新 技术干货