近日,荷兰格罗宁根大学理工学院曹明教授在《国家科学评论》(National Science Review,NSR)发表观点文章,总结并展望博弈论、控制论,以及二者之间的相互融合可以在智能学习与决策领域中发挥的关键作用。
信息-物理-社群系统一例:人与自动驾驶并存的交通控制系统中的复杂博弈决策过程。
从高端论坛到坊间巷议,人工智能(AI)与自主机器人都是最近的热门话题。作为领域内的学者与科技工作者,要引领学科发展,尤为关键的一步就是因势利导,推动博弈论和控制论这两大理论工具的融合,在人工智能与自主决策的重大问题上取得突破。
该文简要回顾博弈论与控制论在过往八十年发展中的关键节点,指出博弈论中的纳什均衡和演化稳定的概念,以及控制论中的反馈与最优的观念,可以引导我们洞察智能学习与决策的纷繁现象。
更为重要的是,为回应人工智能的挑战与机遇,两大理论可以也必需相互融合,其突破点有三:
其一,引入动态博弈收益做为反馈,有望解决困扰学界多年的群体决策中个体局部最优策略与集体全局最优收益间的可能冲突;
其二,将人的认知博弈决策过程纳入“信息-物理-社群”混合系统的闭环模型,是处理人与智能机器共融共处的必然趋势;
其三,灵活运用博弈论的预测推理和控制论的收敛性、稳定性分析,最大限度的计入学习、决策过程中的不确定性,借以推动建立以随机博弈与随机控制为核心的理论框架。
这三个突破点,会以点带面,助力人工智能时代学习、优化与控制的全面融合。
领取专属 10元无门槛券
私享最新 技术干货