腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
您
如何将
2D
矩阵
表示
为
输入
状态
,
并
让
它
选择
它
认为
对
该
状态
最好
的
操作
的
行
的
索引
?
我正在尝试构建一个RL模型,其中
输入
是一个NxM
矩阵
,N是可选动作
的
数量,M是描述动作
的
特征。到目前为止,在我所见过
的
所有RL问题中,
状态
空间要么是一个向量,然后传递给一个常规
的
神经网络,要么是一个图像,然后通过卷积神经网络传递进来。但是假设我们有一个环境,其中
的
目标是学习
为
固定任务
选择
最强大
的
工作者,单个
状态
表示
如下所示: names = ['Bob&
浏览 21
提问于2021-02-17
得票数 0
1
回答
Q-学习具有
状态
-动作-
状态
奖励结构和以
状态
为
行
,动作为列
的
q-
矩阵
。
、
、
我在R中建立了一个Q-学习问题,
并
希望
对
我
的
方法
的
理论正确性有所帮助。 对于这个问题
的
问题结构,环境由10个可能
的
状态
组成。在每种
状态
下,代理都有11个可能
的
操作
,可以从中
选择
(无论代理处于何种
状态
,这些
操作
都是相同
的
)。随着时间
的
推移,
它
得到
的
回报越来越少。我已经研究过其他潜在
的</
浏览 0
提问于2017-07-29
得票数 1
1
回答
读取
矩阵
Simulink机器人手臂
、
我正在建立机器人手臂
的
轨迹,并以
矩阵
格式计算了自由度
的
位置,即第一位置是
矩阵
(x1,y1,z1)
的
第1
行
,第二位置是第2
行
(x2,y2,z2)等等。我试图在Simulink中一次读取一
行
,并在到达第一个位置时更改为下一
行
。但是,我不可能用脚本来解决这个问题。有什么建议吗?
浏览 3
提问于2014-06-02
得票数 0
回答已采纳
5
回答
状态
机
表示
、
我希望将GUI实现为
状态
机。我
认为
这样做有好处也有缺点,但这不是这个问题
的
主题。在阅读了这方面的文章之后,我发现了几种在C++中
对
状态
机建模
的
方法,我坚持使用了2,但是我不知道哪种方法更适合于GUI建模。用以下方法将
状态
机
表示
为
状态
列表: - `OnEnterState(...);`从StateMachine::OnEvent将
浏览 12
提问于2012-12-07
得票数 3
回答已采纳
1
回答
如何制作一个基于参数生成|0>或|1>
的
门?
、
我想要做一个单量子位门,
它
给|0>或|1>参考一个参数。 Python 3.7.3
浏览 0
提问于2019-09-07
得票数 3
回答已采纳
2
回答
numpy.random.choice和random.choice
的
输入
参数有区别吗?
、
、
为什么numpy.random.choice和random.choice
的
工作方式不一样?当我这样做
的
时候: (1, 2) >>> np.random.choice([(1,2), (3,4)]) File "<stdin>"mtrand/mtrand.c:15450
浏览 0
提问于2017-04-28
得票数 6
回答已采纳
1
回答
Q学习教程困惑
、
我
对
任何机器学习方法都很陌生,我想我会尝试一下Q-学习。所以我一直在读这篇文章: Q(1, 5) = R(1, 5) + 0.8 * Max[Q(5, 1), Q(5, 4), Q(5, 5)] = 100 + 0.8 * 0 =R
矩阵
是静态
的
。
浏览 0
提问于2015-09-03
得票数 1
回答已采纳
1
回答
具有
状态
-动作-
状态
奖励结构和以
状态
为
行
、动作为列
的
Q
矩阵
的
Q学习
、
、
、
、
我已经在R中建立了一个Q学习问题,
并
希望在我构建问题
的
方法
的
理论正确性方面提供一些帮助。 Problem structure对于此问题,环境由10种可能
的
状态
组成。在每个
状态
下,代理都有11个可供
选择
的
潜在
操作
(这些
操作
与代理所处
的
状态
无关)。最大
的
问题是,在我
的
Q学习中,我
的
代理没有学习。随着时间
的
推移,<e
浏览 61
提问于2017-07-29
得票数 0
回答已采纳
1
回答
基于android
的
Loop the Loop(栅栏)益智游戏开发
、
它
基本上由n×m (n×m)个单元
矩阵
组成。每个单元格都有边和角(点)。规则很简单。你必须在这些点之间画一条线,以形成一个没有交叉点或分支
的
单圈。一个单元格
的
数字
表示
它
周围有多少
行
。为了开发可视化
的
n×m
矩阵
,我考虑使用n×m
行
的
网格布局。每个单元格将保留一个默认不透明度
为
0
的
按钮,即它是透明
的
。当用户单击一条边时,
它
的
浏览 1
提问于2012-10-28
得票数 1
回答已采纳
2
回答
测量门是如何工作
的
?
我有一个
状态
|Q>
的
n位,
并
希望测量位数i。是否有一个
矩阵
可以应用于
状态
,所以
状态
Q最终变成了Q',就像Hadamard或X门一样?或者我应该根据测量结果应用度量
矩阵
|x><x|,如果是0,那么是x=0,如果是1,则是x=1。
浏览 1
提问于2016-03-28
得票数 2
1
回答
可能
的
NxN
矩阵
,T1在每一
行
和每列,没有对角线?
、
、
示例 随附
的
是Lefty算法
的
演练,该算法计算nxn 0-1
矩阵
的
数目,在每一
行
和每列中有t
矩阵
,但在主对角线上没有。用于验证所给方程
的
算法
对
所有可能
的
矩阵
进行计数,但不构造它们。它被称为“左”,
它
相当简单,
最好
用一个例子来描述。假设我们想要计算6x60-1
矩阵
的
数目,每一
行
和每列有两个
矩阵
,但是主对角线上没有
浏览 2
提问于2016-01-16
得票数 2
1
回答
如何定义维度,以便在显示所有值时不忽略FK中
的
空值?
、
、
我使用Modrian
对
OLAP多维数据集进行建模,
并
使用Jaspersoft
表示
它
。多维数据集建立在一个包含FKs到维度表
的
事实表之上。目前,我
的
事实表拥有维度
的
可空外键,我个人
认为
这很有趣(据我所知,这只是造型决定是否使用可空
的
FKs ( ) )。问题是,当
选择
所有的
状态
(在我
的
设计中,state是维度)时,我只得到具有
状态
的
记录,而不是没有
浏览 4
提问于2015-08-19
得票数 1
回答已采纳
3
回答
计算DFA接受
的
字符串数
的
最优算法
、
、
这是我遇到
的
问题DFAs可以用
状态
图
表示
。数组A
表示
从
状态
编号I到
状态
Ai
的
0边缘,对于所有的0≤i≤K-1 数组B
表示
从
状态
编号i到
状态
Bi
的
1条边,用于所有0≤i≤K
浏览 4
提问于2015-10-10
得票数 6
回答已采纳
1
回答
JSF PrimeFaces inputText JSF
、
、
但是
它
总是传递dataTable
的
最后一
行
,而不是包含当前单击
的
p:inputText__
的
行
的
索引
。从我之前
的
问题中可以看出,我正在尝试使用p:inputText作为一个
状态
的
注释者,比如在Facebook或其他。实现包括一个p:dataTable。
它
的
行
表示
每种
状态
。,在第二个
状态
(<em
浏览 2
提问于2013-02-20
得票数 3
回答已采纳
1
回答
利用梯度梯度实现SARSA
、
、
本质上,我有一个Q值
矩阵
,其中每一
行
对应一个
状态
,每列对应一个动作。[Q(sn,a1), Q(sn,a2), Q(sn,a3), Q(sn,a4)]我
的
第一个假设是建立一个两层网络,
输入
层
的
输入
神经元和有
状态</e
浏览 2
提问于2015-04-30
得票数 1
回答已采纳
1
回答
多层感知器是否只能接受
输入
数据
的
一维矢量?若然,
为
甚麽会这样呢?
、
、
我正在阅读下面的教程,
它
使用MNIST手写数字数据库。machinelearningmastery.com/handwritten-digit-recognition-using-convolutional-neural-networks-python-keras/ 28x28大小
的
图像数据必须被重塑成一个784像素
的
一维矢量。为什么多层感知器只坚持
输入
数据
的
一维矢量?卷积神经网络和递归神经网络不存在接受高维
输入
形状
的
问题。
浏览 0
提问于2018-08-18
得票数 2
1
回答
如何构建基于环境
状态
在环境中
选择
正确对象
的
DQN?
、
、
、
我有一个有4个对象
的
环境。可以
选择
所有这些对象,也可以不
选择
。因此,我
的
DQN所采取
的
行动应该类似于- [1,0,1,1],[0,0,0,1],[1,1,0,0]...etc。其中1
表示
对象被选中,0
表示
对象未被选中。作为DQN
输入
的
环境
状态
由每个对象
的
属性和环境
的
其他因素组成。DQN将根据它所做
的
选择
获得奖励。我刚开始强化学习,我只构建了DQN
浏览 0
提问于2020-05-22
得票数 1
回答已采纳
3
回答
计算
矩阵
块
、
、
、
直观地说,n可以看作是
矩阵
的
“像素大小”。++oo++++oo++++++有块状2。虽然有些条目可以被
认为
属于较大
的
块,但2是
对
所有条目有效
的
最大块大小。即使任何条目都可以被视为属于某个大小
为
“滑动”
的
2块,也不可能使用
该
大小
的
相邻块来形成
浏览 0
提问于2021-11-08
得票数 19
回答已采纳
2
回答
马尔可夫决策过程
的
转移
矩阵
必须是随机
的
吗?
、
、
、
、
我正在尝试使用值迭代(通过pymdptoolbox)和NumPy
为
中指定
的
马尔可夫决策过程问题找到最优策略。但是pymdptoolbox说我
的
转换
矩阵
“不是随机
的
”。import mdptoolbox trans
浏览 4
提问于2017-04-28
得票数 1
2
回答
关于理解餐桌最佳座位算法
的
问题
、
、
我正在阅读一个问题,
并
试图解决这个问题。 你有一张圆形餐桌,你想
让
周围的人都坐下来。不幸
的
是,并不是所有的朋友都是朋友,但你想
让
每个人都坐到
最好
的
位置,这样尽可能多的人坐在他们
认为
是朋友而不是敌人的人旁边。你在一个大小
为
NxN
的
矩阵
中描绘了每个人
的
友谊和仇恨,用整数
表示
友谊,用-1
表示
仇恨,用0
表示
冷漠。,例
浏览 1
提问于2019-02-03
得票数 10
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券