文章/答案/技术大牛

发布

社区首页 >专栏 >修改Centos默认ssh端口22

修改Centos默认ssh端口22

原创

子润先生

修改于 2021-06-24 02:14:07

2.7K00

代码可运行

文章被收录于专栏：用户8644135的专栏用户8644135的专栏

运行总次数：0

代码可运行

修改Centos服务器ssh链接的默认端口22到任意端口，主要两个步骤：

1、添加端口；

2、开放防火墙；

添加端口

修改端口的文件sshd_config，位于/etc/ssh/，编辑将其中的#Port 22前的#号去掉，然后在下面新增Port 你的端口，为什么这里先保留22，是要防止新的端口没有修改成功，还可以使用22端口进行连接。

开放防火墙

如果有firewall，那么运行指令：

firewall-cmd --zone=public --add-port=你的端口/tcp --permanent

firewall-cmd --reload

如果没有firewall，那么直接添加端口即可：

iptables -I INPUT -p tcp --dport 你的端口 -j ACCEPT

service iptables save

如果使用云服务器，记得还要在控制台开放对应的端口才行。

测试新端口

重启ssh服务：

systemctl restart sshd.service

重启完之后使用新端口进行连接，如果正常连接，就将第一步中Port 22 前加上#即完成了Centos默认的ssh端口修改。最近打算做一个关于魂斗罗的强化学习训练，于是在网上找了一些怎么搭建Gym搭建的资料，现在做一个记录

魂斗罗的gym强化学习环境我已经搭建好了,并且已经打包发布到Pypi上了，点击这里有关项目的详细说明

整个gym_sample环境我已经上传到git，有兴趣的同学可以自己clone或者fork下来看看样例gym_sample

综述

Reinforcement Learning 已经经过了几十年的发展，发展壮大。近些年来，跟随着机器学习的浪潮开始发展壮大。多次战胜围棋冠军柯洁，以及在DOTA2、星际争霸等游戏中超凡表现，成为了众人追捧的明星。目前OpenAI作为世界NO.1的AI研究机构，构建的GYM，成为衡量强化学习算法的标准工具。通过OpenAI 的Gym直接构建自己的环境，从而利用目前现有的算法，直接求解模型。

包含大量自我理解，肯定存在不正确的地方，希望大家指正

RL and GYM

RL 考虑的是agent如何在一个环境中采取行动，以最大化一些累积奖励。其中主要包含的是2个交互： agent对env作出动作改变env

env 给出奖励和新的状态给agent 其中Gym就是OpenAI所搭建的env。

具体的安装和介绍主页很详细

Gym主页以及 DOC

简单的安装方法如下

123	git clone https://github.com/openai/gymcd gympip install -e .

你也可是使用

1	pip install -e .[all]

来安装全部的Gym现成的环境

安装好Gym之后，可以在annaconda 的 env 下的环境名称文件夹下 python sitpackage 下。

在调用Gym的环境的时候可以利用：

1234567	import gymenv = gym.make('CartPole-v0')env.reset()for _ in range(1000): env.render() env.step(env.action_space.sample()) # take a random actionenv.close()

GYM的文件夹下主要包含：

文件结构如下

envs 所有环境都保存在这个文件下 spaces 环境所定义的状态、动作空间 utils 环境中使用的一组常用实用程序 warppers 包装 init 读取时初始化 core 核心环境，直接链接到给定的环境 GYM 创建的环境主要在envs中，在这个里面可以找到常用的几个环境，比如说cart-pole, MountainCar等等。自我构建的GYM环境都应该在放在envs下子文件夹中的一个py文件中的类。例如：

1	gym\envs\classic_control\cartpole.py

Gym register

所有构建的环境都需要调用GYM库，然后再通过GYM库来调用所写的环境。所以需要现在GYM的内部构件一个内链接，指向自己构建的环境。 registry 主要在

envs下 init.py 文件下

123456	`register(` `id='CartPole-v1',` `entry_point='gym.envs.classic_control:CartPoleEnv',` `max_episode_steps=500,` `reward_threshold=475.0,` `)`

id 调用所构建的环境的名称调用该环境的时候所起的名字 ==注：名字包含一些特殊符号的时候，会报错==

entry_point 所在的位置例如上述：存在gym 文件夹下 classic_control文件夹下算法所需的参数 2 在所在文件夹下建立 init 文件，在下面调用

1	from gym.envs.classic_control.cartpole import CartPoleEnv

其中是cartpole是环境所存在的文件名字，CartPoleEnv是该文件下的类。

Gym 环境构建自我构建的环境为一个类。主要包含：变量、函数

必须的变量这个类包含如下两个变量值：state 和 action 对应的两个空间为observation _space 和 action _space 这两个空间必须要用 space 文件夹下的类在init中进行定义。其中 state是一个 object 一般为一个np.array 包含多个状态指示值。

必须存在的函数 step 利用动作环境给出的一下步动作和环境给出的奖励（核心）

这个函数承担了最重要的功能，是所构建环境所实现功能的位置

输入为动作输出为

1. 下一个状态值 object
1. 反馈 float 值
1. done（终结标志） 布尔值 0 或者1
1. info（对调试有用的任何信息） any
1. reset    重置环境
1. 将状态设置为初始状态，返回： 状态值

render 在图形界面上作出反应可以没有，但是必须存在
close 关闭图形界面
seed 随机种子可以没有，但是必须存在

状态、动作空间的构建

主要分为离散空间和连续空间：连续空间主要由spaces.Box定义，例如：

1	self.action_space = spaces.Box(low=-10, high=10, shape=(1,2))

上面定义了一个取值范围在（-10，10）的变量维度为1，2

离散空间主要有

spaces.Discrete，例如

1	self.observation_space = spaces.Discrete(2)

上面定义了一个变量空间范围为[0,2) 之间的整数

spaces.MultiBinary，例如

1	self.observation_space = spaces.MultiBinary(2)

上面定义了一个变量空间为0，1的2维整数变量

spaces.MultiBinary，例如

1	self.observation_space = MultiDiscrete（）

其他还可以定义一个元组或者字典等变量空间。

下面仔细说明一下Gym的文结构

Gym的文件结构

12345	├── gym_test│ ├── env│ │ ├── env_guess_number.py│ │ ├── __init__.py│ └── __init__.py

在init.py文件下你要包含如下代码

12345678	from gym.envs.registration import registerregister( id='MYGUESSNUMBER-v0', entry_point='gym_test.env.env_guess_number:guess_number',)# gym_test.env是相对于项目名字的gym的路径 # env_guess_number是env_guess_number.py# guess_number 是类名

如何使用自定义的Gym 环境？只需要这样

123	import gymimport gym_test.envenv = gym.make('MYGUESSNUMBER-v0')

您必须在PYTHONPATH中安装gym_sample目录或从父目录来使用您自定义的gym环境。

例如

12345678910	整个项目结构：├── gym_test│ ├── env│ │ ├── env.guess_number.py│ │ ├── __init__.py│ │ └── __pycache__│ │ └── __init__.cpython-37.pyc│ └── __init__.py├── README.md└── test.py

init.py 文件：

12345	from gym.envs.registration import registerregister( id='MYGUESSNUMBER-v0', entry_point='gym_test.env.env_guess_number:guess_number',)

env_guess_number.py文件：

1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768

import gymfrom gym import spacesfrom gym.utils import seedingimport numpy as npclass guess_number(gym.Env): """Hotter Colder The goal of hotter colder is to guess closer to a randomly selected guess_number After each step the agent receives an observation of: 0 - No guess yet submitted (only after reset) 1 - Guess is lower than the target 2 - Guess is equal to the target 3 - Guess is higher than the target The rewards is calculated as: (min(action, self.guess_number) + self.range) / (max(action, self.guess_number) + self.range) Ideally an agent will be able to recognise the 'scent' of a higher reward and increase the rate in which is guesses in that direction until the reward reaches its maximum """ def __init__(self): self.range = 1000 # +/- value the randomly select guess_number can be between self.bounds = 2000 # Action space bounds self.action_space = spaces.Box(low=np.array([-self.bounds]), high=np.array([self.bounds])) self.observation_space = spaces.Discrete(4) self.guess_number = 0 self.guess_count = 0 self.guess_max = 200 self.observation = 0 self.seed() self.reset() def seed(self, seed=None): self.np_random, seed = seeding.np_random(seed) return [seed] def step(self, action): # assert self.action_space.contains(action) if action < self.guess_number: self.observation = 1 elif action == self.guess_number: self.observation = 2 elif action > self.guess_number: self.observation = 3 reward = ((min(action, self.guess_number) + self.bounds) / (max(action, self.guess_number) + self.bounds)) ** 2 self.guess_count += 1 done = self.guess_count >= self.guess_max return self.observation, reward, done, {"guess_number": self.guess_number, "guesses": self.guess_count} def reset(self): self.guess_number = self.np_random.uniform(-self.range, self.range) print('guess number = ', self.guess_number) self.guess_count = 0 self.observation = 0 return self.observation