Loading [MathJax]/jax/output/CommonHTML/jax.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >如何构建基于环境状态在环境中选择正确对象的DQN？

问如何构建基于环境状态在环境中选择正确对象的DQN？
EN

Data Science用户

提问于 2020-05-22 13:11:45

回答 1查看 158关注 0票数 1

我有一个有4个对象的环境。可以选择所有这些对象，也可以不选择。因此，我的DQN所采取的行动应该类似于- [1,0,1,1],[0,0,0,1],[1,1,0,0]...etc。

其中1表示对象被选中，0表示对象未被选中。作为DQN输入的环境状态由每个对象的属性和环境的其他因素组成。DQN将根据它所做的选择获得奖励。我刚开始强化学习，我只构建了DQN，它需要从整个动作空间中选择一个动作。但是如何为这个特定的环境构建一个DQN或强化学习网络呢？

reinforcement-learning

EN

回答 1

Data Science用户

回答已采纳

发布于 2020-05-22 14:56:08

DQN代理不需要关心操作代表什么，在您的情况下，它只需要进行离散的选择，并且简单地枚举操作空间。暂时忽略它们的意义，你有16个离散的动作。最简单的建模方法是为代理创建一个由16个动作组成的单一索引离散操作空间，然后将其映射到评估结果所需的选择。只要您始终如一地这样做(例如，使用动作索引号的二进制表示)，这是很好的。

根据价值函数的真实性质，使用更直接的表示也可能有所帮助。在这种情况下，您可以使用它，前提是您为 $\hat{q}(s,a,\theta)$ 的神经网络建模，将动作向量连接到输入中的状态向量，并为该特定组合提供估计动作值的单个输出。要评估要采取的操作，您将创建一个由16个输入组成的小型批处理，所有这些输入都具有相同的状态组件，并涵盖16个可能的输入变体。然后，您将选择具有最高估计值的组合，并查看输入向量的动作部分，以发现哪些操作被估计为最佳。

如果你不确定哪种方法最适合这个问题，你可以两者都尝试。

票数 0

EN

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/74673

复制

相关文章

计算机的计算单位

存储单位一般用 bit, Byte, KB, MB, GB, TB, PB, EB, ZB, BB来表示。一般将Byte简称为B，将KB简称问K。

JavaEdge

2021/02/23

8760

GraphX 在图数据库 Nebula Graph 的图计算实践

数据结构 spark https 网络安全 github

不同来源的异构数据间存在着千丝万缕的关联，这种数据之间隐藏的关联关系和网络结构特性对于数据分析至关重要，图计算就是以图作为数据模型来表达问题并予以解决的过程。

NebulaGraph

2020/11/11

2.6K0

GraphX 在图数据库 Nebula Graph 的图计算实践

AutoCAD 产品设计：图形单位

autocad 产品设计配置数据字符串

图形单位是用于设置一些属性数据应该用什么格式显示的命令，命令标识为 un（units）。

前端西瓜哥

2023/10/04

3570

AutoCAD 产品设计：图形单位

php实现图形计算器

存档： index.php 1 <html> 2 <head> 3 <title>图形计算器开发</title> 4 <meta http-equiv="Content-type" content="text/html;charset=utf-8"> 5 </head> 6 7 <body> 8 <center> 9 <h1>图形(周长&面积)计算器</h1> 10

Angel_Kitty

2018/04/08

1.7K0

NEO4J 图数据库哪里和哪里从哪里开始

云推荐引擎 sql 数据库

上期已经安装了图数据库，本期就该讨论到底这个图数据库里面的一些基本的概念和如何操作。最近听到一句话，年轻不年轻，不是看年龄，而是看你对新鲜事物的热情，即使你20岁，谈起新事物也是一脸的不屑，只能说明身体和灵魂分了家。闲话不谈回归正题。

AustinDatabases

2020/05/09

3K0

计算机的国产灵魂到底差在了哪里

最近，网上流传着一个国产系统PK国外系统的视频。视频中作者采用两台型号一样配置一样的电脑，分别安装了中兴新支点操作系统和Windows10，针对开关机、打开软件等方面进行了对比测试。

pak

2022/09/14

3.1K0

计算机类单位换算,计算机单位换算大全「建议收藏」

java https 网络安全

电脑世界是由0与1组成，其中有数以万计的线路，一条线路传递一个信号，而0代表没有信号，1代表有信号，就像电源开关一样，同一时间只可能有一种状态，所以电脑最基本的单位就是一条线路的信号，我们就把它称作“位”，英文叫做bit，缩写为 b。“位”和“字节”其实都是电脑的计量单位，我们可以理解成字节是由位组成的，一个“字节”等于8“位”，Byte是它的缩写.位(bit)这个单位太小，所以字节(Byte)是电脑存储容量的基本计量单位。Byte可简写为B，一个字节由八个二进制位组成，其最小值为0，最大值为11111111，一个存储单元能存储一个字节的内容。

全栈程序员站长

2022/09/18

1.4K0

图计算与图数据库的概念

图计算是一种针对图数据进行分析和计算的方法。图数据由节点和边构成，节点代表实体或对象，边代表节点之间的关系或连接。图计算可以应用于多个领域，如社交网络分析、生物网络分析、推荐系统等。

一凡sir

2023/10/24

6420

常用的数据单位符号

二进制计算机数据存储

黎鹤舞

2024/05/27

930

数据热点图告诉你：用户都在看哪里？

facebook twitter

一大波热点图，告诉你用户都在看向哪里？最后发现其实网站上那些一层层的banner其实都是没！人！看！的，因为我们的大脑都会自动屏蔽掉他们！（不管你logo放多大！字有多明显！）甲方的钱花的实在太冤枉

用户1756920

2018/06/20

8700

【笔记】《计算机图形学》(12)——图形学的数据结构

数据结构编程算法

之前我的笔记都是在OneNote上记录的，苦于OneNote羸弱的跨平台性，我决定抛弃OneNote，今后的笔记都用Markdown记录，方便迁移也方便调整格式。文章一开始编辑后会保存在我的Github仓库中(https://github.com/ZFhuang/Study-Notes)，整理完后会发到公众号上，并延时同步到我的腾讯云。

ZifengHuang

2021/02/04

6.1K0

【AI系统】计算图的控制流实现

计算图在数学上作为一个有向无环图（DAG，Directed Acyclic Graph），能够把神经网络模型的概念抽象出来作为同一描述，不过在计算机的编程中，会遇到很多 if、else、while、for 等控制流语句，有向无环图改如何表示控制流变成了计算图中一个很重要的问题。好处在于，引入控制流之后，开发者可以向计算图中引入分支选择以及循环控制逻辑，进而构造出更加复杂的神经网络模型结构。

用户11307734

2024/12/06

1010

计算机中存储单位的换算

1、单位定义存储单位：存储在计算机硬盘或内存中的信息容量标准，最小计量单位是“位”（bit，比特），一个比特位表示一个二进制的0或1在计算机中所占用的存储空间传输单位：在计算机网络中称为带宽，宽带传输速率的单位为bps，bps是bit per second的缩写，表示每秒钟传输多少比特位信息（很多人都会把这里的bit误以为是Byte，也就是错把位当成字节），例如：带宽的单位是10Mb/s，这里其实指的是每秒传输10兆位，而不是10兆字节数据，因此将位数需要除以8换算成字节数，也就是每秒传输1.2

跟着飞哥学编程

2022/11/30

1.4K0

图计算和图数据库在实际应用中的限制和挑战，以及处理策略

大规模图数据的处理需要高性能计算和存储系统，并且很多图算法和图查询是计算密集型的。因此，图计算和图数据库需要具备高度可扩展性和并行处理能力，以应对大规模图数据的挑战。

一凡sir

2023/10/25

4070

图计算和图数据库在实际应用中的限制和挑战，以及处理策略

怎么在Openresty中REST？

lua json 编程算法 http https

REST究竟指的是什么，如果原意英文缩写来看，REST（Resource Representational State Transfer ），解释很诗意，很烂漫，但基本看不出一个所以然。

糖果

2020/09/17

2.4K0

Power BI 卡片图显示不同单位

bi 表格可视化数据优化

如果数据差异非常大，有的上亿，有的只有几百，如何在卡片图更好的显示这样的数据？把数据修正同时带有单位是个不错的办法，比如如果数据超过一亿，除以一亿，末尾加个汉字”亿“。

wujunmin

2023/09/05

6140

Power BI 卡片图显示不同单位

windows 自带的计算器-标准计算，科学计算，函数绘图，各种单位转换。

存储 windows 工具函数数据

windows 自带的计算器，经过不断地迭代更新现在功能已经很强大了。我们如果还只是单纯的使用它计算普通的加减乘除就太浪费了

zinyan.com

2023/07/13

2K0

windows 自带的计算器-标准计算，科学计算，函数绘图，各种单位转换。

图计算 on nLive：Nebula 的图计算实践

数据库知识图谱

在 #图计算 on nLive# 直播活动中，来自 Nebula 研发团队的 nebula-plato 维护者郝彤和 nebula-algorithm 维护者 Nicole 分别同大家分享了他她眼中的图计算。

NebulaGraph

2022/02/22

1.6K0

图计算 on nLive：Nebula 的图计算实践

智能图形和列表在哪里呢？慢慢学会SmartArt智能图形和列表。

1、点击[插入] 2、点击[SmartArt] 3、点击[循环] 4、点击[图片] 5、点击[确定]

裴来凡

2022/05/28

9940

智能图形和列表在哪里呢？慢慢学会SmartArt智能图形和列表。

字符串在JVM的哪里

编程算法 jvm api java

另外String提供了一个API, java.lang.String.intern()，这个API可以手动将一个字符串对象的值转移到字符串常量池中

名字是乱打的

2022/05/13

4.3K0

相似问题

marklogic搜索结果中的Dateboosting

12

Marklogic REST API通配符搜索

144

MarkLogic搜索结果排名

24

如何使用MarkLogic搜索在rest中使用转换结果？

13

Marklogic搜索结果中的返回属性

12

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例