VM、DM、MS等服务器安装或升级服务起不来定位思路
常见服务起不来有以下几种原因:
1
先行排查VM软件安装目录是否和老版本目录一致,导致安装时有老版本的相关文件冲突,导致服务起不来
这种情况vmserver日志会打印 init GBSPT Fail 错误
2015-12-23 15:29:28 [INFO (0)] [vmserver][BP] [COMMU] [] [7952.0xb77aa960] [bp_module.cpp-374] [IMOS_Init]imos initsucceed.
2015-12-23 15:29:28 [FATAL (3957)] [vmserver] [] [] [][7952.0xb77aa960] [gbspt_srv.cpp-342] Failed to get CS init config! Err code:1!
2015-12-23 15:29:28 [FATAL (3957)] [vmserver] [] [] [][7952.0xb77aa960] [as_main.cpp-246] Init GBSPT Fail!
如下截图中B3315版本和B3318版本都是放在同一个路径,这样解压出来新老版本都在同一路径,会导致服务起不来
解决办法:将新版本拷贝到其它新的路径下,使用sh vmupdate.sh force强制升级即可解决
2
VM恢复的数据库和VM版本不一致,导致VM服务起不来。VM、DM、MS、TMS、IS合一安装,版本不配套也会导致VM服务无法启动。如果是大数据环境,VM、DB、DR版本也需要保持配套
解决办法:将版本升级到配套版本
3
进入var/log/imoslog/vm/路径,查看vminstall.log文件,看里面的安装语言是否为,选择是中文语言。如果1是英文语言,选1可能会导致服务起不来。
2015-02-11 19:26:29 [INFO] [0] [0] [] [main] [] [] [0]Get Machine version i686.
2015-02-11 19:26:35 [INFO] [0] [0] [] [main] [] [] [0] LANGUAGE=1
2015-02-11 19:26:37 [INFO] [0] [0] [] [main] [] [] [0]MODE=STANDALONE
解决办法:卸载重新安装
4
查看安装选择的VM、DB地址是否正确
2015-03-09 16:18:48 [INFO] [0] [0] [] [main][] [] [0] Please input SNMP port[default:162]:
2015-03-09 16:18:49 [INFO] [0] [0] [] [main][] [] [0] SNMPPORT=162
2015-03-09 16:18:49 [INFO] [0] [0] [] [main][] [] [0] Please input Video Manager server IP address[such as 192.168.0.11]:
2015-03-09 16:19:13 [INFO] [0] [0] [] [main][] [] [0] SERVERIP=10.135.8.72
2015-03-09 16:19:13 [INFO] [0] [0] [] [main][] [] [0] Please input database server IP address[such as 192.168.0.11]:
2015-03-09 16:19:28 [INFO] [0] [0] [] [main][] [] [0] DBIPADDR=10.135.8.72
2015-03-09 16:19:28 [INFO] [0] [0] [] [main][] [] [0] Route initialization succeeded!
解决办法:使用vmcfgtool.sh serverip serverip地址 修改vm地址,重启VM服务即可
5
进入var/log/imoslog/vm/ vminstall.log文件,看是不是有缺少相关的库文件引发的报错导致服务起不来,这个问题需要反馈相关的操作系统版本号、位数信息,平台版本,提供相关的库安装即可解决。
vmserver: error while loading sharedlibraries: libssl.so.6: cannot open shared object file: No such file ordirectory
可以使用如下命令查看少了什么库文件
ldd /usr/local/bin/vmserver
解决办法:返回日志分析
6
开启了背景抓包,硬盘空间不够导致VM服务起不来
[root@localhost ~]# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/sdb5 1.8T 48G 1.7T 3% ---可以查看下avial可利用空间是否还有
/tmpfs 7.4G 0 7.4G 0% /dev/shm
/dev/sdb1 194M 30M 154M 17% /boot
/dev/sdb2 20G 172M 19G 1% /share
解决办法:删除无用数据,释放空间
[root@me /]# du -sh /* 此命令为查看/ 目录 所使用的硬盘空间
7.4M /bin
25M /boot
4.0K /cgroup
0 /config
0 /config_paggb
21M /dev
38M /etc
49G /home
7
数据库IP地址不对导致VM连接数据库失败,从而使VM无法启动
定位办法:
查看VM日志 会提示DB 连接失败
2015-09-06 10:11:15 [ERROR (32)] [vmserver][] [] [] [20182.0x2ee8a9b0] [dbifpgsql.cpp-135] [CPgsql::Connect]PgsqlConnect()fail. PGerrcode:1, errmsg:could not connect to server: Invalid argument
Is the server running on host"172.16.110.6" and accepting
TCP/IP connections on port 5432?
VM启动的时候会去连接数据库,当连接数据库连接不上的时候会导致VM无法正常启动。
VM连接不上数据库一般有两种原因:
1、数据库和VM合一安装的话一般就是serverip和服务器网卡地址不对导致;
2、数据库单独安装的话,一般就是VM和数据库IP地址不通,或者是数据库服务没有起来导致。定位方法都非常简单,使用vmcfgtool.sh –q可以看到设置的VM的数据库IP地址,首先看他和本地网卡地址是否对应上,如果是单独安装的数据库,使用ping测试下网络连通性,
如果网络OK,那么去数据库那台服务器上看下数据库进程是否启动service postgresql status。
解决方法:修改数据库IP地址为正确的IP地址,vmcfgtool.sh dbip X.X.X.X然后重启VM。
8
升级到B3314版本,httpd无法启动。
如果排除上面8类问题,需要收集相关的日志、安装过程信息分析。
领取专属 10元无门槛券
私享最新 技术干货