#脚本中 ifconfig、mpstat、iostat命令有依赖,需要安装相关依赖包 yum -y install bc sysstat net-tools 巡检项信息,可根据实际需求修改增加 1)、系统基本信息 2)、cpu信息 3)、ip网络信息 4)、cpu使用率 5)、连接数信息 6)、系统限制信息 7)、内存使用信息 8)、磁盘使用信息 9)、网络流量情况/系统资源变化 10)、cpu消耗情况前10排行 11)、cpu消耗按内存情况前10排行 12)、磁盘io情况 13)、系统定时任务列表 1
首先将DB_TiDB_HC_lhr_v7.0.0.sql和pt-summary这2个脚本拷贝到有mysql客户端的Linux环境中,然后执行如下命令:
这里只列出部分结果,其它的详细内容可以参考:https://share.weiyun.com/5lb2U2M
继上两篇巡检相关脚本后,有小伙伴问小编有没有网络设备相关的巡检脚本或工具,今天小编给大家分享个群友给的巡检工具。
运维服务一个项目二十多台(或者多台)服务器,每天要做服务器的性能巡检工作是查看服务器的CPU、内存、磁盘空间是否在正常值范围内。像这样每天或者每个固定时间段都做相同的重复工作,为了简化重复的工作,我写了基于liunx服务器的自动巡检脚本,在crontab中设定一个固定时间进行自动执行即可,以减少人工重复劳动的工作。
大卫说:关于构建自动化运维平台的相关内容,此前本公众号已经分享过很多篇文章,如: 大卫的思考 | 金融行业自动化运维的研究和落地 Ansible Tower管理Windows演示 | 自动化运维落地之路 谁说互联网企业IT运维必须DIY? | Github排名第一的自动化运维工具 自动化运维界的独孤九剑 | 尽破各路IT运维难题 我们知道,在金融行业,用户要构建的自动化运维平台,应当是能够跨多种平台的一体化运维,而不是将物理机、虚拟化、各种Linux、各种UNIX、各种网络设备、各种硬件等,单独构
SFS轻量级Linux工具箱是一款免费运维工具箱, 工具箱内集成一键自动化处理脚本与半自动化处理脚本, 快捷启动工具与菜单方便快速访问执行。 工具箱脚本存储于国内服务器,每个功能执行速度提升无需等待, 简洁易懂的工具箱首页面板数字化执行命令, 多样化功能菜单提升Linux运维效率 一键自动化脚本安装无需分布式部署 轻量级工具箱占用内存低于1M扩展性能强大 每个功能代码专业人员审查处理 无任何木马病毒破坏计算机代码 无任何漏洞侵占用户数据行为 部分功能来源于网络搜集 部分功能来源于个人开发魔改 部分功能来源于投稿合作
3、跨平台,只要有SQL*Plus、mysql、MSSQL客户端(SSMS、Navicat皆可)、psql环境即可运行脚本
全部介绍请参考:https://www.xmmup.com/shujukuxunjianjiaoben.html
在运维中需要对主机业务进行周期巡检,为减少人工巡检频率,降低业务停机风险,利用 shell 脚本对 Linux 系统服务运行状态进行主动巡检,异常服务通过钉钉机器人进行告警消息推送。
这一年,蓝鲸平台从自动化运维平台,重新定义为研发运营一体化平台,实现了CI、CD、CO的IT管理全生命周期的打通。
本文根据MOS文章:Oracle Exadata Database Machine EXAchk (Doc ID 1070954.1)整理关键步骤。 注:通常都会要求使用当前最新可用的EXAchk版本进行健康检查。
上次分享了Linux的信息收集脚本,有小伙伴说实际环境中还有不少Windows的机器,今天给大家分享个Windows服务器信息收集脚本以及使用方法,详见下面具体信息。
export CLASSPATH=:$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
蓝鲸智云,简称蓝鲸,是腾讯游戏运营部“腾讯智营”下的子品牌。它是一套基于 PaaS 的企业研发运营一体化技术解决方案,提供了一个完整的研发、运维、运营的PaaS技术平台。
目前一共包含7个脚本,若脚本的扩展名为“.sql”则表示该脚本为sql脚本,若脚本的扩展名为“.pl”则表示该脚本为perl脚本。 对于Oracle的SQL脚本而言,脚本DB_Oracle_HC_lhr_vxxx_10g.sql适用于Oracle 10g数据库,脚本DB_Oracle_HC_lhr_v6.0.8_11g.sql适用于Oracle 11g的数据库,脚本DB_Oracle_HC_lhr_v6.0.8_12c.sql适用于Oracle 12c及其以上版本,这3个脚本都是只读版本,这3个脚本只会对数据库做查询操作,不会做DML和DDL操作,这也是很多朋友所期待的功能。 脚本DB_OS_HC_lhr_v6.0.7.pl是perl脚本,执行后会对OS的信息进行收集,并且输出到html中。 脚本DB_MySQL_HC_lhr_v6.0.8.sql是MySQL脚本,执行后会产生MySQL的健康检查html报告,该脚本为只读脚本。 脚本DB_MSSQL_HC_lhr_v3.2.sql是SQL Server脚本,存在部分DDL和DML操作,执行后会产生SQL Server的健康检查html报告。
Linux系统需要定期巡检,以检查服务器软硬件使用情况,相当于对人的体检,确保可以及时发现问题、解决问题,降低损失,常用的巡检命令如下:
“不想当将军的士兵不是好的战士”、“不想当CIO的DBA不是好的运维”。在每天面临如此多的来自工作量、运维安全、技术更新挑战的同时,我们还需要不断的成长与思考:
百度大厦的一名安保人员手机里弹出这样一条信息。发信息的是他的“新同事”,一位近期上岗百度深研大厦的智能助手——小度巡检机器人。
前段时间在GitHub[1]上发现了一个Ansible巡检服务的Roles, 今天给大家分享一下!
首先看 CPU 内存、硬盘 io 的消耗程度,其中重点是硬盘使用率,要做好准备,避免厂家期间业务写入增长,磁盘占满。
最近在客户现场,每日都需要巡检大量主机系统的备库信息。如果一台台执行,时间浪费的就太冤枉了。 参考同事之前写的一个python脚本,配合各主机上写好的shell检查脚本,实现一次操作得到所有巡检结果。
◆ 一、开源项目简介 滴滴LogiAM来源于滴滴多年来大量的运维实践经验。经历过多方考验,对于大规模Agent日志采集治理管控及巡检诊断已经沉淀出一套完善的解决方案。在云原生时代背景下,LogiAM以“应用/服务”为采集粒度,满足了从业务层面创建采集任务的需求。 ◆ 二、开源协议 使用Apache-2.0开源协议 ◆ 三、界面展示 ◆ 四、功能概述 ◆ 用户体验地图 主机/容器管理:用于维护主机、容器信息至系统(含:容器-主机关系) 服务管理:用于维护服务信息至系统(含:服务-主机、服务-容器关系)
巡检平台是一个面向运维人员的开箱即用的巡检产品,提供自动诊断问题的自动化运维能力。产品不仅提供了自动化的巡检能力和巡检报告给运维工程师使用,还针对巡检报告中的问题提供了运维专家经验的优化建议供修复时参考。运维人员也可以根据自己的定制需求,通过多样化巡检原子能力灵活定制个性化巡检项加入到定期巡检任务中,巡检原子能力包括脚本巡检、HTTP(S) 接口巡检和 IP 巡检;该平台还具备覆盖多个垂直产品和多个维度巡检的分类能力,运维人员可以根据产品归属不同人员等方式,让不同用户订阅不同的巡检报告,从而大大减少运维工程师定期手工巡检的工作量。
攻防演练建议站在黑客的视角下,审视其攻击流程,再针对性的进行防守,防止出现木桶效应,即攻击者只会从短板攻入,但构建的防守措施却和短板无关。
2018年12月,经过嘉维蓝鲸项目组近半年的努力奋战,太平集团成功上线了蓝鲸研发运营一体化平台,实现了IT运维全流程标准化和调度自动化,并取得了如下收益:
XX系统,通过FTP给客户实时传送文件,正常逻辑是客户收到文件后,自动删除FTP服务器上的本地文件,但经常出现文件已经推送了,客户没删除文件的情况。每个文件其实是很小的,可能几K,但是量很大,1天几万个,以至于时间久了,本地积的文件就会很多。我们不说让客户怎么排查问题,单就这个现象,如果积了几百万的小文件,我们能做些什么?你可能会说,删了啊,确实应该删了,但是小文件多了,会产生什么影响?如果直接rm,你认为行么?
中移信息平台能力中心数据库团队成员,主要负责 MySQL、TiDB、Redis、clickhouse 等开源数据库的维护工作。
以下是一个简单的网络设备巡检自动化程序的 Python 代码示例,可以用于检查网络设备的基本配置和状态信息:
做云安全运营也有一年多时间了,对云上安全建设和运营有一点粗浅的经验,希望可以抛砖引玉,借此文章能有机会和大佬们交流 安全运营,安全建设方向的经验。
又到周末了,思前想后不知道写点什么,那就从以前经历的一个线上缺陷说起,聊一下软件质量保障的巡检技术。
中国移动通信集团北京有限公司(下称北京移动)成立于1999年,隶属于中国移动通信集团公司,秉承“正德厚生,臻于至善”的企业核心价值观,紧密围绕“做世界一流企业,成为移动信息专家”的战略定位,以卓越品质锻造一流信息服务,用创新精神努力实现从优秀向卓越的新跨越,着力推动“移动改变生活”。
集群巡检是对集群系统进行定期检查和评估的过程,其主要目的是确保集群的稳定性、性能和安全性。以下是集群巡检的几个主要用途:
定义:Docker是一个开源的应用容器引擎,使用GO语言开发,基于Linux内核的cgroup,namespace,Union FS等技术,对应用程序进行封装隔离,并且独立于宿主机与其他进程,这种运行时封装的状态称为容器。
CIS[1]即Center for Internet Security (CIS) 为安全基准计划提供了定义明确、公正、基于一致性的行业最佳实践来帮助组织评估和增强其安全性
此工具是小江大佬原创,可以模拟人工通过CRT登陆设备进行批量相关命令操作,或者进行设备的巡检还有设备相关信息的收集,并同时以log文档保存至本地。
常言道常在河边走,那有不湿鞋。作为一名Java开发人员,遇到OutOfMemoryError那可是在正常不过了,无论是别人写的代码导致的,还是别人写的代码导致的,总之不是我干的,你把Git记录拍在我脸上也不是我干的。遇到OOM不要慌,看一下姜同学是怎么解决的。
云锁是一款服务器使用的安全类程序,支持 windows/linux 服务器跨平台实时、批量、远程安全管理。云锁会 7*24 小时无间断守护业务系统,能自动调整安全策略,帮助用户有效抵御 CC 攻击、SQL 注入、XSS 跨站攻击、溢出攻击、暴力破解、提权等黑客攻击,及病毒、木马、后门等恶意代码。今天主要体验一下云锁服务器端及客户端安装使用。 前面魏艾斯博客提到过另外一款安全类软件安全狗。相关文章如下: linux 服务器安全狗卸载图文教程 服务器安全狗 Linux 安装教程 windows VPS 服务器安
脚本(复制粘贴) #!/bin/bash #作者:小韩 a="\033[40;37m" e="\033[0m" b="\033[41;37m" c="\033[42;37m" f="\033[43;37m" g="\033[44;37m" h="\033[45;37m" q="\033[46;37m" echo -e "$h=========😻本脚本适用K8S主节点&作者:小韩😻======"$e echo -e "$a--------自动巡检开启--请把你的小手拿走--" $e linux=$(cat /
今天巡检发现,mc1的K8S服务器集群有些异常,负载不太均衡。其中10.2.75.32-34,49的load average值都在40以上,虽然机器的cpu核数都是40或48核不算严重,但也值得重视。
领取专属 10元无门槛券
手把手带您无忧上云