暂无搜索历史
我们的业务碰到了一个很特殊的场景:用户数量巨大,上亿;物品数目比较少,不超过 500 个。针对这个特点,我们设计了一个小程序 Trick。这个程序 Trick ...
深度强化学习是学术界研制游戏 AI 的主流算法。这篇文章我们将用深度强化学习早期代表算法 DQN 算法探索棋牌 AI。
该文介绍了遗传算法的基本概念、应用和实现方法,特别强调了遗传算法在解决优化问题方面的优势。同时,文章还探讨了遗传算法的发展历史和现状,以及其在实际应用中可能遇到...
目前,我们已经介绍了一些强化学习的算法,但是我们无法在实际问题中运用这些算法。 为什么呢?因为算法估算价值函数 (v(s)) 或者 (q(...
本文介绍了 Metropolis-Hastings 和 Gibbs sampling 这两种常用的 MCMC(马尔科夫链蒙特卡洛)算法,以及如何在技术社区中帮助...
该文介绍了朴素贝叶斯分类器的本质是线性分类器,以及适用于离散和连续特征的场景。
本文介绍了主成分分析(PCA)在降维、特征提取和推荐系统等方面的应用。首先介绍了 PCA 的基本原理和常用算法,然后详细阐述了基于 PCA 的推荐系统设计和实现...
本文介绍了遗传算法的基本概念、发展历程、应用案例以及未来展望。遗传算法是一种基于自然选择和遗传学原理的优化搜索算法,具有高度的并行性、全局搜索能力和鲁棒性。在计...
EM算法是带隐变量概率模型的推断算法。今天我们介绍 EM 算法的原理和应用。我们先介绍推导出 EM 算法的一般方法,再介绍另一种 EM 算法推导方法...
本文介绍了遗传算法的基本概念、工作原理和应用,并分析了遗传算法中的模式定理和马尔科夫链分析方法。作者通过实例讲解了遗传算法在解决实际问题中的应用,并探讨了遗传算...
本文介绍了模型无关的策略学习。模型无关的策略学习主要有三种算法: Monte Carlo Control, Sarsa 和 Q learning。这三种算法都能...
本文介绍了遗传算法在解决复杂问题中的应用,包括在机器人路径规划、神经网络参数优化、机器人视觉系统中的运动物体检测和识别、以及自动化作曲等领域。遗传算法在这些领域...
本文介绍了模型无关的策略评价,包括蒙特卡罗算法和时差学习算法,适用于不知道马尔科夫决策过程转移概率和奖励函数的场景。代码示例基于机器人找金币问题,可以在Gith...
本文介绍了遗传算法的发展历程、应用案例、变种以及未来展望。
文章目录 [隐藏] 1. 马尔科夫决策过程 2. 策略和价值 3. 最优策略存在性和贝尔曼等式 强化学习系列系列文章 机器学习一共有三个分支,有监督...
本文介绍了梯度策略的相关知识,包括策略梯度的定义、策略梯度与价值函数的关系、策略梯度的算法以及策略梯度的应用场景。文章还介绍了蒙特卡罗策略梯度和Actor-Cr...
本文介绍了模型相关的强化学习,包括马尔科夫决策过程、策略迭代、价值迭代等概念。以机器人找金币问题为例子,介绍了如何使用这些算法进行强化学习。最后,介绍了强化学习...
暂未填写公司和职称
暂未填写个人简介
暂未填写学校和专业
暂未填写所在城市