近年来,强化学习技术在游戏、技术科学领域取得了优异的表现,如 DeepMind 的 AlphaGo Zero 在围棋比赛中击败人类顶尖围棋高手、OpenAI Five 训练的智能体在 Dota2 5v5中击败人类玩家等。但是,作为机器学习的重要分支之一,强化学习也同样面临着可解释性不足的痛点,即在实际应用中“难以被理解”,也因此“难以被信任”,这导致了强化学习在对安全敏感的业务领域(比如医疗、自动驾驶等)发展受到了较大的限制。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货