深度学习方法的改进

不去幼儿园

发布于 2024-12-03 11:05:07

4900

本篇文章是博主在人工智能等领域学习时，用于个人学习、研究或者欣赏使用，并基于博主对人工智能等领域的一些理解而记录的学习摘录和笔记，若有不当和侵权之处，指出后将会立即改正，还望谅解。文章分类在学习摘录和笔记专栏：学习摘录和笔记（9）---《深度学习方法的改进》

深度学习方法的改进

1 深度学习的成功

深度学习的成功来自于以下 3 个要素：

一是数据： 以 AlphaGo 为例 , 其中 AlphaGo-Zero 通过强化学习自学了亿级的棋局, 而人类在千年的围棋史中 , 下过的有效棋局只不过 3000 万盘。 二是算法： 包括蒙特卡洛树搜索 (Monte-Carlo tree search) , 深度学习和强化学习 (reinforcement learning) 等。 三是算力： 运行 AlphaGo 的机器是由 1920 个 CPU 和 280 个 GPU 组成的分布系统。

早在 2014 年，深度学习的诸多缺陷不断地被发现，预示着这条道路遇到了瓶颈。深度学习为何如此脆弱，容易受攻击，被欺骗和不安全。

基于深度学习的 AI 具有不可解释性和鲁棒性差等缺陷，并针对这两个缺陷展开分析。

2 深度学习的改进分析

2.1 可解释性问题

人类理解机器决策过程的核心难点是跨越数据特征空间和人类语义空间之间的鸿沟。

无论是早期的以手工特征为基础的算法，还是当前以特征学习为代表的深度学习，其核心思想都是将观测样本映射到特征空间中，进而在特征空间进行分析，发现样本在特征空间不同区域内的规律,从而达到算法要实现的任务目标 (如分类、回归等)。

研究主要分为：

（1）模型的后解释技术 (post-hoc explanation)

给定了人工智能的模型，通过可视化、交互技术等方式，分析给定模型的工作机理，为其决策结果寻找解释途径。

（2）可解释模型

通过发展新的网络架构、损失函数、训练方式等，发展具有内在可解释性的新型人工智能模型。

可视分析是人工智能算法可解释的一种直观的思路。既然深度学习是 “黑箱” 学习法, 内部的工作机理是不透明的, “不可解释”, 如果利用可视化, 打开 “黑箱”, 一切不就清楚了吗?
解释模型的另外一个思路是利用部分统计分析的技巧，针对神经网络决策过程中的参数冗余性，神经网络内部最后决策起到关键作用的子成分进行分析，得到复杂模型内部对决策起到最关键作用的核心部分。