前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >运维知识体系总结

运维知识体系总结

作者头像
IT不难
发布2023-11-17 14:10:46
4540
发布2023-11-17 14:10:46
举报
文章被收录于专栏:IT不难技术家园IT不难技术家园
l5uon64x.png
l5uon64x.png

运维知识体系

基础设施层

公有云,私有云(OpenStack/cloudstack + KVM/XEN,oVirt), 混合云 服务监控 配置管理

硬件选型、配件更换、资产录入、系统安装(Cobbler)、标签化、Raid构建、远程控制(KVM,iDrac,ILO,IMM) 巡检,IPMI IPMI, CMDB

需求分析,IDC选型,网络测试,谈价格,签合同,设备采购(原厂vs渠道)、机柜和机位规划 巡检,IPMI IPMI, CMDB

数据中心选址、制冷、供电、网络、运维 风或水电 基础设施监控

操作系统层

CPU运行级别,使用率,上下文切换,运行队列,进程调度,系统调用、CPU管理(进程管理,taskset,intel vt-x) mpstat,strace

虚拟内存,swap换入换出,内存寻址,内存管理(Buffer Cache, HugePages, ksmd, EPT) vmstat,free

缺页中断,IOPS(顺序IO,随机IO),IO管理(IO调度算法,virtio),VFS iostat,iotop

TCP/IP(三次握手,四次挥手,状态转换,TCP队列),IO模型, Bonding, Bridge, 网络管理(iftop, tcpdump) iftop

内核定制、内存参数优化、脚本编程(awk, sed, shell, python, php, perl, ruby, lua) 系统监控

容器层

Mesos(Marathon, Chronos)、Kubernetes、Docker Swarm、Rancher、CoreOS(fleet)、OpenStack(Magnum) Docker Stats, cAdvisor, DataDog, Zabbix Docker Swarm, Mesos, Kubernetes

容器(LXC, LXD, Docker, rkt) 系统(CoreOS, Atomic, RancherOS)

网络:(Calico , Flanel, Weave Net) 存储(Ceph) 镜像管理(Docker Registry, Harbor)

基础服务层

灰度发布、服务降级、异地灾备、数据分析平台、智能扩容决策树(需要各层支持)、智能监控 zabbix, nagios,cacti, open-falcon, Sensu Puppet, Chef, SaltStack, Ansible 日志服务,操作审计,资源编排,运维监控服务,持续交付系统

项目管理(Redmine、Jira、知识库、Bugzilla、CodeReview)、工单系统、运维操作平台、监控平台

持续集成、日志收集平台(ELKStack)、自动化部署平台、Job管理(调度)平台、安全扫描平台

LDAP、内部DNS、DHCP、Mail、SMS、Gitlab、Yum仓库、操作审计(xenapp)、堡垒机

存储层

单机存储-----块存储 - 机械硬盘、SSD、文件系统(ext4、xfs)、LVM、tmpfs 单机存储扩展-----文件分发(多级分发)、文件同步(rsync、inotify)、DRBD、DAS(块存储) 共享存储-----文件存储 - NAS[NFS(Unix/Linux)]、FTP、SAN、iSCSI 分布式存储-----对象存储 - GlusterFS、MooseFS、Ceph、FastDFS(非对象存储)

监控体系:系统监控,软件自带监控 自动化/DevOps:配置管理 云计算:云硬盘,对象存储

数据访问层:应用层分片,淘宝TDDL,开源360(Atlas),阿里(Cobar), MyCat, MySQL-Proxy, 根据业务开发 监控体系同上 自动化/DevOps同上 云计算:数据库服务

分布式缓存----Memcached、Redis(客户端分片、Redis Cluster、Twemproxy、Codis) NoSQL----Redis、LevelDB(SSDB)、CouchDB、Mongodb、Couchbase 、Cassandra、TiDB(支持MySQL协议) 时间序列----RRDTool、Graphite Whisper、OpenTSDB、InfluxDB、KairosDB、ElasticSearch、Hbase RDBMS----MySQL(PXC集群、MHA)、Oracle(DG、OGG、RAC)、PostgreSQL、SqlServer、SQLite、DB2

监控体系:数据库监控 自动化/DevOps:数据库运维平台 云计算:云数据库-RDS, Mongodb, Redis, Memcached, OceanBase

大数据----Hadoop生态圈(HDFS、Hive、Hbase、Zookeeper、Pig、Spark、Impala、Kudu)、Mahout智能推荐

监控体系:服务监控 自动化/DevOps:Ambari, CM 云计算:大数据服务

应用服务层

HTTP协议、Web服务器(Apache、Nginx/OpenResty、Tomcat、Resin、Jboss)安全设置、性能优化

监控体系:业务监控(API),流量分析(Piwik),服务监控(API),安全监控(WAF) 自动化/DevOps: 配置管理-SaltStack 过载保护-服务降级 灰度发布-openresty 项目管理-Readmine 代码仓库-gitlab 持续集成-Jenkins 持续审查-SonarQube

云计算:镜像市场

运行环境(PHP Python Java C C++)、性能优化、缓存(OPCache、LocalCache)、Session存储、代码部署

云计算:各种SAAS服务

业务实现-API网关、302调度、业务模块化(电商例:用户、商品、购物车、结算中心、价格等服务)、微服务 对应云计算的各种SAAS服务

服务层-SOA框架(Dubbo)、微服务框架(istio、Spring Cloud)、协议(RPC、RESTful)、框架安全、应用性能监控 对应云计算的分布式应用服务

消息队列- ActiveMQ(成熟)、RabbitMQ(成熟、案例多)、RocketMQ(业务应用)、Kafka(日志传输)、ZeroMQ(快) 云计算:消息队列服务

接入层

四层负载均衡 开源:LVS(IP负载均衡)+Keepalived、Haproxy 商业:F5、Netscaler

七层负载均衡 反向代理:Haproxy、Nginx、Apache(根据HTTP协议支持的属性进行L7分发)、A/B Test Gateway、WAF

监控体系:服务监控(API) 自动化/DevOps:平台开发(LBaas) 云计算: 高防IP,云负载均衡SLB,CDN服务

ATS、Squid、Varnish、Nginx(缓存分级、预缓存、缓存刷新)

网络层

多机房互联(VPN,专线),异地灾备-->异地多活-->按SET部署

监控体系:设备监控(zabbix snmp) 网络质量监控(Smokeping) 自动化/DevOps:SDN , OpenvSwitch(GRE、Vxlan) 云计算:高速通道

防火墙、路由器、Ipsec VPN、链路负载均衡和高可用 (CCNP级别)

云计算:VPC(专有网络)

三层交换 动态路由(OSPF)、静态路由、EC(端口汇聚)、MSTP+VRRP等 (CCNP级别)

云计算:VPC(专有网络)

二层交换 (VTP、SPF、Trunk、端口安全)等 (CCNA级别)

云计算:VPC(专有网络)

外部层

GSLB、反向代理缓存、分布式存储、流量调度、配置管理、用户端(各类API如:带宽监控、预缓存、缓存刷新)

监控体系:舆论监控,外部网络监控,APM 自动化/DevOps:基于开放API开发 云计算:DNS服务,CDN服务,移动服务,云盾

第三方安全解决方案(防DDOS、防CC攻击、WAF等)

客户端层

Cookie作用域、浏览器缓存协商(Last-Modified、Expires、Etag)、组件分离、前端优化、运维检测工具

浏览器DNS缓存、DNS缓存、自建DNS服务器、商业DNS产品、智能DNS、公共DNS(BGP anycast)、bind+DLZ/DPDK

HTTP-DNS、打点日志、加密传输、移动推送、各类SDK(监控SDK、推流SDK等) 监控体系:舆论监控,外部网络监控,APM 自动化/DevOps:基于开放API开发 云计算:DNS服务,CDN服务,移动服务,云盾

运维产品化

项目管理(类似Jira) Bug管理 代码托管(类似Github) 持续交付(类似Jenkins的构建、测试、部署) 监控平台,看板 软件定义数据中心 DevOps产品

CMDB ITSM管理系统(事件管理,问题管理,故障管理,工单系统) 作业平台 堡垒机 APM 私有云平台 监控平台 CI/CD系统 运维管理产品

运维管理体系

ITSM ITIL V3 IT Service CMM Six Sigma DevOps Master 项目管理(PMBok)

知识体系 运维方案 容量规划 灾备规划 服务降级

运维协助 性能测试(TCPCopy,日志转换) 单机监控(nmon) 环境规划(开发,测试,预生产,生产) CI(持续集成)自动化部署

Operations as a Service 运维咨询 运维托管 技术培训 应急处理 产品即服务 DevOps专家服务

参考: 运维知识体系

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年07月21日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 运维知识体系
    • 基础设施层
      • 操作系统层
        • 容器层
          • 基础服务层
            • 存储层
              • 应用服务层
                • 接入层
                  • 网络层
                    • 外部层
                      • 客户端层
                      • 运维产品化
                      • 运维管理体系
                      相关产品与服务
                      负载均衡
                      负载均衡(Cloud Load Balancer,CLB)提供安全快捷的流量分发服务,访问流量经由 CLB 可以自动分配到云中的多台后端服务器上,扩展系统的服务能力并消除单点故障。负载均衡支持亿级连接和千万级并发,可轻松应对大流量访问,满足业务需求。
                      领券
                      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档