还有一周即将进入漫长的春节假期,作为一名运维人员既兴奋又惶恐,因为根据多年经验假期往往也是故障的高发期,特别是数据库,很多公司安排了DBA春节现场值班,二线专家7*24小时随时待命。
有人无法与家人团聚,有人错过高中同学十年聚会,有人要背着电脑去给丈母娘拜年,有人在放假前给服务器祈祷:
但是故障往往都是一步步演变而来,最终发展成为影响业务连续性的事故,而这些故障的演变过程通常都会体现在日志和其他记录中,通过前期巡检就可以发现故障的蛛丝马迹,将其扼杀在摇篮中。加上数据库假期长时间无人看管,所以节前千万不要忘了给数据库做个巡检。
人工巡检耗时耗力,而且往往会漏掉巡检项,现在登录墨天轮云服务平台,只需三步(3-5分钟)即可快速完成一份数据库的专业巡检工作:下载脚本采集、上传巡检结果、立即查看报告。另外,我们后期会陆续推出MySQL、SQL Server、PG数据库的巡检功能,敬请关注。
采集脚本可以在所有系统上运行,包括Windows,支持Oracle 10g到12c所有版本,不采集任何业务数据,运行时自我监控,如遇CPU使用率过高、磁盘空间不足的情况下会自动终止采集程序。
调用白求恩智能分析引擎,针对隐患瓶颈分析总结,提供解决方案
还有Eygle、老杨等数据库专家在线免费帮您二次审核报告
这里我们总结了比较重要且容易忽略的巡检项及可能存在的问题
空间使用率:文件系统、表空间、ASM可用空间不足的致命问题
运行趋势:了解主机、数据库负载情况,近期是否存在高点或者持续增长的趋势
参数:主机、ASM、数据库(特别是重启后会变化的参数)
日志:系统日志、DB告警日志、ASM日志里的报错信息
网络配置,监听:检查网络配置、监听参数和状态,是否存在连接风暴和监听日志大于4G的问题
失效对象:建议排查及时删除或重新编译
SCN:Headroom问题和2019年6月23日自动解除最大SCN限制对当前环境是否影响的检查,以及需要做的应对措施
系统触发器木马:盗版PL/SQL DEV注入的比特币勒索病毒以及非官方安装包注入清空tab$的木马,前者在建库1200天后、后者在建库300天后触发,如果中招及时发现并处理
用户安全:用户即将过期锁定导致应用无法连接,另外假期收回或者锁定有DBA、ANY等高权限的用户
重做日志:了解切换规律,如果存在无法分配新日志的报错,建议增加日志组
DBLINK:梳理数据库中的DBLINK
RMAN备份检查:检查备份策略是否合理,另外节前最好做一次全备
DG检查:确保正常同步,可正常切换
现在登录云平台来巡检吧,全面检查,安心过节:https://cs.enmotech.com/cloudPlatform
领取专属 10元无门槛券
私享最新 技术干货