前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >hostmonitor对异常用户会话的监控

hostmonitor对异常用户会话的监控

作者头像
小尘哥
发布于 2018-12-25 02:59:49
发布于 2018-12-25 02:59:49
63900
代码可运行
举报
文章被收录于专栏:小尘哥的专栏小尘哥的专栏
运行总次数:0
代码可运行

问题:日盘交易时间段,程序化交易客户端登录后,获取不到行情,并且出现客户端反复重连的情况,报错如下图:

分析
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
从截图可知客户端与服务端之间的会话通道异常,socket异常可能是网络抖动、客户端程序异常、服务端异常等造成的。
与客户沟通得知,该客户通讯链路正常,登录连接测试正常,本交易日夜盘登录、交易正常,客户端登录环境没有变化,同时确认服务端网络正常,暂时排除前两个可能性。目前交易系统共有7组前置服务,每组各1个交易前置,1个行情前置,对外地址映射时,IP地址和前置服务一一对应,客户端登录时自由选择前置服务组进行登录报单,客户登录的行情前置为front7、交易前置为front1。查看服务端监控,前置服务状态正常,交易报盘、行情报盘服务到交易所的连接状态正常,其他客户交易正常,说明交易系统到交易所的通道是正常的。
使用交易员客户端登录front7对应的地址组,查看交易所行情,发现状态异常,行情没有变化,登录front7所在服务器,检查客户端与前置服务间的会话,发现有多个行情socket连接处于timewait或syn_sent状态,这些连接大都对应同一IP,经确认,是该客户的IP,认定front7可能存在服务“假死”的情况,重启该行情服务,到该前置的连接恢复正常。

问题引申

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
和客服人员确认,尚未收到此种问题的反馈,说明碰到此种情况也属小概率事件,但问题的发生也说明监控上需要进一步完善。
目前使用的是一款开源的监控软件-hostmonitor,监控上的维护流程见下一步。

监控完善

1.trade@front,创建/home/trade/monitor目录 2.上传脚本至/home/trade/shell下,

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
checkfrontStatus.sh
-----------------------------------------------------------------------------------------------------------
#!/bin/bash
#author by wcy
#Date:20181129,用于检查客户端到交易系统前置的连接是否异常,输出检查结果
DATE=$(date "+%Y%m%d")
netstat -an |grep 41213|awk  '$6!~/ESTABLISHED/{print $6}' |wc -l >/home/trade/monitor/mdftPlayDead$DATE.txt
netstat -an |grep 41213|awk  '$6!~/ESTABLISHED/{print $6}' |wc -l>/home/trade/monitor/mdftPlayDie$DATE.txt
netstat -an |grep 41205|awk  '$6!~/ESTABLISHED/{print $6}' |wc -l >/home/trade/monitor/ftPlayDead$DATE.txt
netstat -an |grep 41205|awk  '$6!~/ESTABLISHED/{print $6}' |wc -l>/home/trade/monitor/ftPlayDie$DATE.txt

------------------------------------------------------------------------------------------------------------

3.计划任务:交易时间段,8:00-15:00,20:00-23:59,00-2:00之间;每分钟执行一次检查脚本。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
------------------------------------------------------------------------------------------------------------
*/1 8-15 * * 1-5    cd /home/trade/asptools;./checkfrontStatus.sh
*/1 20-23 * * 1-5    cd /home/trade/asptools;./checkfrontStatus.sh
00-59/1 23 * * 1-5    cd /home/trade/asptools;./checkfrontStatus.sh
*/1 0-2 * * 2-6     cd /home/trade/asptools;./checkfrontStatus.sh
------------------------------------------------------------------------------------------------------------

4.hostmonitor上,根据实际情况,告警阀值行情50,交易100,当扫描到客户端连接异常超过告警阈值时,认定前置服务出现假死,给出告警,并输出异常连接的数量。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
行情前置监控脚本:
checkMdfrontSocket
------------------------------------------------------------------------------------------------------------
DATE=$(date "+%Y%m%d")
ProName=$1
Con=$(cat /home/trade/monitor/mdftPlayDead$DATE.txt)
if [[ $Con -ge $2 ]]
then
  echo "ScriptRes:Bad:$Con socket disconnect"
else
  echo "ScriptRes:OK:$Con"
fi
------------------------------------------------------------------------------------------------------------

交易前置监控脚本:
checkfrontSocket
------------------------------------------------------------------------------------------------------------
DATE=$(date "+%Y%m%d")
ProName=$1
Con=$(cat /home/trade/monitor/ftPlayDead$DATE.txt)
if [[ $Con -ge $2 ]]
then
  echo "ScriptRes:Bad:$Con socket disconnect"
else
  echo "ScriptRes:OK:$Con"
fi
-------------------------------------------------------------------------------------------------------------
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-12-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 陌与尘埃 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
效率提升10倍,推荐这些值得收藏的Shell!
整理了一些常用的web日志分析及Linux网络连接状态等shell命令,建议收藏!!!
李俊鹏
2021/03/18
7130
记一次open-falcon手动push数据 原
http://book.open-falcon.org/zh/usage/data-push.html http://book.open-falcon.org/zh/philosophy/tags-and-hostgroup.html https://github.com/GuyCheung/falcon-ngx_metric
阿dai学长
2019/04/03
1.1K0
服务器负载监控以及文字处理脚本
运维监控总少不了一些脚本来监控自己的机器,博主自己写了个监控,并通过sleep来控制输出的间隔时间。如果想要获取其他的相关信息,可以采用类似的方式,添加即可。 首先是服务器的负载监控脚本,主要输出了 内存,CPU,网络连接等信息 #!/bin/sh while true do TOP=`top -b -n 2 | grep Cpu |tail -2` FREE=`free -m` SWAP=`echo $FREE | grep Swap | cut -d":" -f 4` MEM=`echo $FREE
用户1154259
2018/01/17
8040
简单shell脚本,实现多台liunx服务器自动巡检,避免每天重复的劳动工作!
运维服务一个项目二十多台(或者多台)服务器,每天要做服务器的性能巡检工作是查看服务器的CPU、内存、磁盘空间是否在正常值范围内。像这样每天或者每个固定时间段都做相同的重复工作,为了简化重复的工作,我写了基于liunx服务器的自动巡检脚本,在crontab中设定一个固定时间进行自动执行即可,以减少人工重复劳动的工作。
程序猿的栖息地
2022/04/29
1.1K0
获取A股行情数据方法[通俗易懂]
做股票量化分析,获取股票行情数据是第一步,结合网上的信息,和我用过的一些东西,做个总结。以后有新信息,逐步完善。
全栈程序员站长
2022/07/25
8.7K0
测试右移-后台服务监控告警实践
前段时间,公司上线了一个“大屏”项目,用于对接展示一些业务平台的数据。但是在上线后使用过程中,产品或业务经常反馈前台页面没有数据。出现这种情况后,开发人员会去排查问题,解决后再通知产品或业务人员解决修复情况。虽然研发每次都能在较短的时间内响应并解决问题,但运行一段时间后又会反复出现,也给用户造成了极其不好的使用体验。而本文则是基于“测试右移”思想,开展的一次后台服务监控告警的实践记录总结,整个实践过程可以分为:
大刚测试开发实战
2022/11/14
7270
测试右移-后台服务监控告警实践
云监控最佳实践:自定义监控服务器 TIME_WAIT 连接数
腾讯云服务器监控 agent 只采集了处于 ESTABLISHED 状态的 TCP 连接数量?
腾讯云可观测平台
2019/12/20
4.1K1
云监控最佳实践:自定义监控服务器 TIME_WAIT 连接数
超实用!18 个开箱即用的 Shell 脚本,拿好了~
for file in $(ls html); do mv file bbs_{file#} # mv file(echo $file |sed -r ‘s/.*(.*)/bbs\1/’) # mv file(echo file |echo bbs_(cut -d_ -f2) done
子润先生
2021/06/16
3860
​ssh免密码登录设置及问题总结
前几天写了一篇文章关于ssh命令的几个使用小技巧(r11笔记第27天),很多朋友给了不少的建议,其中郭亮同学整理了一篇文章发给我在此表示感谢。 关于ssh免密码登录,总结了3种方法, # 一种推送的方式,也就是在服务器端操作,前提是知道所有免秘登录的服务器用户密码,通过脚本可以读取用户名密码。我写过一个telnet自动登录的脚本,详见附件。 ssh自动登录也可以采用expect语言实现,这个暂未撰写脚本文件,待写中。 # 一种拉取的方式。也就是在客户端进程操作,前提只要知道服务器端一个用户密码即可,弊端是需
jeanron100
2018/03/21
1.7K0
大幅提效 | 18个一线工作中常用 Shell 脚本(纯干货)
假设服务器环境为 lnmp,近期访问经常出现 502 现象,且 502 错误在重启 php-fpm 服务后消失,因此需要编写监控脚本,一旦出现 502,则自动重启 php-fpm 服务。
一行Java
2023/09/04
4290
大幅提效 | 18个一线工作中常用 Shell 脚本(纯干货)
if语法案例
然后加入定时任务中执行即可 */3 * * * * /bin/bash /server/scripts/t3.sh
jackxiao
2021/11/16
4700
学习笔记0610----监控软件zabbix
cacti、nagios、zabbix、smokeping、open-falcon等等,其中nagios、zabbix流行度非常高;
嘻哈记
2020/11/24
1.5K0
Zabbix监控lnmp(附模板)
需要用到ngx_http_stub_status_module模块,提供对基本状态信息的访问默认情况下不构建此模块,应使用—with-http_stub_status_module 配置参数启用它 。 修改nginx配置文件,在server下添加 vim /etc/nginx/conf.d/zabbix.conf
没有故事的陈师傅
2019/07/27
8230
Zabbix监控TCP状态
[root@localhost ~]# vim /usr/local/zabbix/etc/zabbix_agentd.conf
子润先生
2021/07/07
1.1K0
记录一次zabbix监控常见系统层面问题排查方法
2018年09月26日 12:00:25 weixin_34018169 阅读数 12
拓荒者
2019/08/29
2K0
zabbix 自定义监控服务配置
注:本文基于https://blog.51cto.com/14227204/2474670 一、监控主机内存使用情况 1、在服务器上部署agent客户端
小手冰凉
2020/03/12
6800
第一章·监控系统-zabbix快速入门
-多年互联网运维工作经验,曾负责过大规模集群架构自动化运维管理工作。 -擅长Web集群架构与自动化运维,曾负责国内某大型金融公司运维工作。 -devops项目经理兼DBA。 -开发过一套自动化运维平台(功能如下): 1)整合了各个公有云API,自主创建云主机。 2)ELK自动化收集日志功能。 3)Saltstack自动化运维统一配置管理工具。 4)Git、Jenkins自动化代码上线及自动化测试平台。 5)堡垒机,连接Linux、Windows平台及日志审计。 6)SQL执行及审批流程。 7)慢查询日志分析web界面。
DriverZeng
2022/10/31
1K0
第一章·监控系统-zabbix快速入门
swoole学习笔记
swoole是面向生产环境的 PHP 异步网络通信引擎,本笔记是本人在学习完慕课网的课程《Swoole入门到实战打造高性能赛事直播平台》后的笔记,是对学习的代码整理的补充,学习过程中整理的github代码地址:
CS逍遥剑仙
2019/03/03
1.1K0
谁再说不熟悉Linux命令,就把这个给他扔过去!
虽然平时大部分工作都是和Java相关的开发, 但是每天都会接触Linux系统, 尤其是使用了Mac之后, 每天都是工作在黑色背景的命令行环境中. 自己记忆力不好, 很多有用的Linux命令不能很好的记忆, 现在逐渐总结一下, 以便后续查看.
程序员小猿
2021/11/23
5500
一起 goroutine 泄漏问题的排查
作者: yanhengwang,腾讯 PCG 开发工程师 在 golang 中创建 goroutine 是一件很容易的事情,但是不合理的使用可能会导致大量 goroutine 无法结束,资源也无法被释放,随着时间推移造成了内存的泄漏。避免 goroutine 泄漏的关键是要合理管理 goroutine 的生命周期,通过导出 runtime 指标和利用 pprof 可以发现和解决 goroutine 泄漏问题。 笔者维护了一个通过 SSH 连接到目标机器并执行命令的服务,这是一个内部小服务,平时没有问题
腾讯技术工程官方号
2020/01/08
2.9K0
一起 goroutine 泄漏问题的排查
推荐阅读
相关推荐
效率提升10倍,推荐这些值得收藏的Shell!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验