首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

27次训练即可解决小车双摆的强化学习算法

动力系统的有效控制设计传统上依赖于高水平的系统理解,通常用精确的物理模型来表达。与此相反,强化学习采用数据驱动的方法,通过与底层系统交互来构建最优控制策略。为了尽可能降低真实世界系统的磨损,学习过程应该很短。在我们的研究中,我们使用最先进的强化学习方法PILCO设计了一种反馈控制策略,用于小车上双摆的摆动,在测试台上的测试迭代非常少。PILCO代表“学习控制的概率推理”,学习只需要很少的专家知识。为了实现小车上的双摆摆动到其上不稳定平衡位置,我们在PILCO中引入了额外的状态约束,从而可以考虑有限的小车距离。由于这些措施,我们第一次能够在真正的测试台上学习摆起,并且仅用了27次学习迭代。

02

做直流逆变中用到的全桥逆变电路测试mos管好坏的方法

根据场效应管的PN结正、反向电阻值不一样的现象,可以判别出结型场效应管的三个电极。具体方法:将万用表拨在R×1k档上,任选两个电极,分别测出其正、反向电阻值。当某两个电极的正、反向电阻值相等,且为几千欧姆时,则该两个电极分别是漏极D和源极S。因为对结型场效应管而言,漏极和源极可互换,剩下的电极肯定是栅极G。也可以将万用表的黑表笔(红表笔也行)任意接触一个电极,另一只表笔依次去接触其余的两个电极,测其电阻值。当出现两次测得的电阻值近似相等时,则黑表笔所接触的电极为栅极,其余两电极分别为漏极和源极。若两次测出的电阻值均很大,说明是PN结的反向,即都是反向电阻,可以判定是N沟道场效应管,且黑表笔接的是栅极;若两次测出的电阻值均很小,说明是正向PN结,即是正向电阻,判定为P沟道场效应管,黑表笔接的也是栅极。若不出现上述情况,可以调换黑、红表笔按上述方法进行测试,直到判别出栅极为止。

01

Android开发笔记(十六)秋千摇摆动画SwingAnimation

上节博主介绍了AlphaAnimation和淡入淡出动画的使用,其实AlphaAnimation只是四种补间动画中的一种。那么为了加深对其他补间动画的理解,我想说说旋转动画RotateAnimation的使用,刚好工作中就有类似的应用场景,正好介绍一下。像我们生活中有许多左右摇摆的画面,比如说老式挂钟的钟摆围绕着竖轴左右摇摆,又比如说公园里人们坐在秋千上荡来荡去,这么一想,嗯,这左右摇摆的秋千动画确实贴近生活。 如果我们把钟摆或者秋千想象成一个线段,这个线段以上面的端点为圆心,先从垂直向下的角度向左旋转;转到一定角度,再向右旋转,同样旋转摆到左边的高度;接着再向左旋转,等到这个线段摆到垂直向下时,就完成了摇摆动作的一个循环。这么看,摇摆动画似乎与旋转动画有些关联,再仔细想想,这摇摆动画其实就是由三段旋转动画衔接起来的呀,先是向左旋转60度,然后向右旋转120度,最后向左旋转60度。所以看看能不能从旋转动画RotateAnimation源码中找找思路。 分析RotateAnimation的源码,我们看到RotateAnimation继承自Animation,除了几个构造函数与初始化函数之外,起主要作用的便是applyTransformation函数。

04
领券