你将获得

  • 理解 SRE 的正确姿势
  • 10+ SRE 必学必会知识点
  • 可落地的故障应急处理机制
  • 2 种典型 SRE 组织架构案例分享

课程介绍

SRE(Site Reliability Engineering),网站稳定性工程,最早是由 Google 设置的一类工程师岗位,专职负责其超大规模分布式产品(如搜索、Gmail、Docs 等)的稳定性。而后,SRE 慢慢发展成了一系列面向稳定性的,包括技术、管理、流程、组织架构,以及文化建设的最佳实践,并最终被提炼成一套方法论,广泛流传。

在国内,SRE 的这套方法论,也被很多企业的 IT 团队作为技术能力提升和组织转型,特别是运维转型的参考标准。但是,在实际落地这套方法论时,大家有很多疑惑,比如:

  • SRE 如果不是运维的升级版,那它到底是什么?
  • SRE 涉及范围如此之大,到底应该从哪里入手建设呢?
  • 在稳定性方面,有些公司已经做了很多工作,特别是在技术体系搭建上,为什么还是故障频发?难道单纯的技术保障还不够吗?
  • 引入了 SRE,团队的能力应该怎么提升?组织架构应该怎么匹配呢?

因此,我们邀请赵成老师开设了《SRE 实战手册》这个课程。他将结合自己的实践经验,从基础理论和实践操作两方面入手,一次性解决你心中的困惑,帮助你正确认识 SRE,掌握可落地的实践方法。

这个课程分为基础篇和实践篇两大模块。

  • 基础篇:带你从实践的角度理解 SRE 是什么,并以 SRE 的基本概念 SLO 和 SLI 作为切入点,教你一步步建立起 SRE 稳定性标准。最后结合具体的电商案例,分享在实际场景中设定稳定性目标应该考虑的因素。
  • 实践篇:围绕“故障”这个影响稳定性的核心事件,分享故障发现、故障处理、故障复盘三个阶段的最佳实践。同时,着眼落地 SRE 时绕不开的组织架构问题,分享真实的组织架构设置实践和高效的跨团队协作经验。
声明:1、本站信息来自网络,版权争议与本站无关 2、本站所有主题由该帖子作者发表,该帖子作者与本站享有帖子相关版权 3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和本站的同意 4、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责 5、用户所发布的一切软件的解密分析文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。 6、您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。 7、请支持正版软件、得到更好的正版服务。 8、如有侵权请立即告知本站(邮箱hoh0@foxmail.com),本站将及时予与删除 9、本站所发布的一切破解补丁、注册机和注册信息及软件的解密分析文章和视频仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。