首页
学习
活动
专区
圈层
工具
发布
首页标签深度强化学习

#深度强化学习

强化学习算法解析:XGBoost(eXtreme Gradient Boosting) 算法原理、Kaggle 冠军首选、全手动计算全解释

jack.yang

关键词:机器学习、XGBoost算法、极致梯度提升、正则化GBDT、二阶泰勒展开、Python XGBoost、Java XGBoost4J、Kaggle冠军算...

28510

强化学习算法解析:Gradient Boosting Machine(梯度提升机, GBM)算法原理、手动计算与Python/Java双代码实战指南

jack.yang

关键词:机器学习、梯度提升机、GBM算法、GBDT、负梯度拟合、残差学习、Python GBM、Java Weka GradientBoosting、XGBoo...

8610

强化学习算法解析:AdaBoost(自适应提升)算法

jack.yang

关键词:机器学习、AdaBoost算法、自适应提升、弱分类器、指数损失、Boosting、Python AdaBoost、Java Weka AdaBoostM...

12710

深度强化学习、蒙特卡洛模拟与时序预测:LSTM、GRU、Attention、DQN多策略智能体的股票交易决策体系构建—以Google股价为例 | 附代码数据

拓端

麦吉尔大学计算机科学与统计专业。熟练使用Python、R、SQL、C、stata、Wind数据分析软件,专注于金融、数理统计领域。

69820

突破认知边界!中科院等提出MIRROR框架:AI鉴伪从此有了“真实之镜”

CoovallyAIHub

当AI画作已能以假乱真,人类如何守住现实边界?新一代检测框架通过建模“真实本身”实现超人级鉴别能力。

23510

AI上阵,短信防线升级:SKT用深度学习狙击韩国“全民诈骗潮”,中国运营商能否借镜?

芦笛

中国互联网络信息中心 | 工程师 (已认证)

在首尔江南区的一间普通公寓里,72岁的金女士刚刚收到一条短信:“【国民银行】您的账户存在异常登录,请立即确认:bit.ly/3xK9mPq”。她点开链接,输入了...

42710

强化学习_从Q-Learning到深度强化学习

心疼你的一切

强化学习(Reinforcement Learning, RL)是机器学习的一个重要分支,专注于智能体(Agent)如何通过与环境(Environment)的交...

36210

收藏!LLM-RL训练框架:3大流派+6大框架,一文搞定

AI-Frontiers

原文: https://mp.weixin.qq.com/s/9f4mqYVGKNS-LhmHLl6CXw

1.1K10

AI成钓鱼“加速器”?从语法错误到深度伪造,网络诈骗正经历一场危险进化

芦笛

中国互联网络信息中心 | 工程师 (已认证)

全球网络安全界正面临一个令人不安的现实:曾经靠拼写错误和蹩脚话术就能被一眼识破的钓鱼邮件,如今正变得越来越“专业”、越来越“真实”,甚至让人难以分辨真假。而这场...

34410

超越Sora的开源思路:如何用预训练组件高效训练你的视频扩散模型?(附训练代码)

CoovallyAIHub

当我们开始思考3D数据或视频时,一个很自然的想法就是把它们视为一系列2D帧,然后通过简单地把时间作为额外维度来应用同样的模型。

12510

无人机低空视觉数据集全景解读:从单机感知到具身智能的跨越

CoovallyAIHub

年来,随着无人机技术的快速发展和低空经济政策的推进,无人机在智慧城市、交通巡检、应急救援等领域的应用日益广泛。然而,无人机的智能化离不开高质量视觉数据的支持。那...

95810

小白也能看懂的RLHF-PPO:原理篇

AI-Frontiers

原文: https://mp.weixin.qq.com/s/8O7W8--x14-b1d3M9IS_3w

47110

强化学习系列(十二)--GRPO,DAPO,DUPO,GSPO

languageX

在之前的强化学习系列中我们介绍了强化学习的基础知识,也在系列十和系列十一中介绍了强化学习RL在LLM中的应用。

2.6K40

基于深度伪造的高管仿冒钓鱼攻击检测与防御机制研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

近年来,随着生成式人工智能技术的快速发展,深度伪造(Deepfake)技术被恶意行为者广泛用于网络钓鱼攻击。其中,针对企业高管的“深度伪装”钓鱼攻击尤为突出。攻...

32910

深度强化学习架构中的优先级经验回放技术:TD误差采样与偏差修正

用户6320865

在人工智能技术快速发展的2025年,深度强化学习(Deep Reinforcement Learning, DRL)已成为实现通用人工智能的重要技术路径之一。这...

58010

深度强化学习架构探秘:DQN过估计问题与解决方案详解

用户6320865

在人工智能领域,深度强化学习(Deep Reinforcement Learning, DRL)已成为最富前景的研究方向之一。这种将深度学习与强化学习相结合的方...

71510

图灵奖得主Sutton再突破:强化学习在控制问题上媲美深度强化学习?

机器之心

近些天,Sutton 再发新论文,在强化学习领域再次发力,将他在 2024 年的时序差分学习新算法 SwiftTD 拓展到控制领域,在与一些更强大的预处理算法结...

32910
领券