极客时间出品的专栏课《SRE实战手册》作者赵成,新客首单到手价29元,现免费分享。
课程介绍
SRE,即网站稳定性工程,源自Google的一项创新实践,它专职于确保超大规模分布式产品的稳定运行。经过发展,SRE已不仅限于技术范畴,更是一套涵盖技术、管理、流程、组织架构及文化建设的全面方法论。在国内,众多企业纷纷将SRE作为技术提升与组织转型的参考标准,但在实际落地过程中,却常面临诸多困惑与挑战。为此,我们特邀赵成老师开设《SRE 实战手册》课程,旨在为大家提供实用的指导与解决方案。
《SRE 实战手册》课程分为基础篇与实践篇两大模块。基础篇着重从实践角度出发,深入解析SRE的本质,并通过探讨SLO和SLI等核心概念,帮助学员建立稳定的SRE标准。结合生动的电商案例,课程将展示如何在实际场景中设定合理的稳定性目标。实践篇则围绕“故障”这一核心问题,分享故障发现、处理与复盘的实用技巧。同时,课程还将关注组织架构与团队协作等关键问题,为学员提供落地SRE的实战经验和策略。
通过这门课程的学习,学员将全面理解SRE的核心理念与实践方法,掌握故障处理与团队协作的关键技能。无论你是技术专家还是管理者,都能从中获得宝贵的启示与帮助。我们相信,在赵成老师的引领下,你将能够正确运用SRE方法论,推动企业的技术提升与组织转型,实现更加稳定、高效的运营目标。
课程目录
│ ├── 00丨开篇词|SRE是解决系统稳定性问题的灵丹妙药吗?.html
│ └── 00丨开篇词|SRE是解决系统稳定性问题的灵丹妙药吗?.pdf
├── 01丨基础篇 (5讲)
│ ├── 01丨SRE迷思:无所不能的角色?还是运维的升级?.html
│ ├── 01丨SRE迷思:无所不能的角色?还是运维的升级?.m4a
│ ├── 01丨SRE迷思:无所不能的角色?还是运维的升级?.pdf
│ ├── 02丨系统可用性:没有故障,系统就一定是稳定的吗?.html
│ ├── 02丨系统可用性:没有故障,系统就一定是稳定的吗?.m4a
│ ├── 02丨系统可用性:没有故障,系统就一定是稳定的吗?.pdf
│ ├── 03丨SRE切入点:选择SLI,设定SLO.html
│ ├── 03丨SRE切入点:选择SLI,设定SLO.m4a
│ ├── 03丨SRE切入点:选择SLI,设定SLO.pdf
│ ├── 04丨错误预算:达成稳定性目标的共识机制.html
│ ├── 04丨错误预算:达成稳定性目标的共识机制.m4a
│ ├── 04丨错误预算:达成稳定性目标的共识机制.pdf
│ ├── 05丨案例:落地SLO时还需要考虑哪些因素?.html
│ ├── 05丨案例:落地SLO时还需要考虑哪些因素?.m4a
│ └── 05丨案例:落地SLO时还需要考虑哪些因素?.pdf
├── 02丨实践篇 (5讲)
│ ├── 06丨故障发现:如何建设On-Call机制?.html
│ ├── 06丨故障发现:如何建设On-Call机制?.m4a
│ ├── 06丨故障发现:如何建设On-Call机制?.pdf
│ ├── 07|故障处理:一切以恢复业务为最高优先级.html
│ ├── 07|故障处理:一切以恢复业务为最高优先级.m4a
│ ├── 07|故障处理:一切以恢复业务为最高优先级.pdf
│ ├── 08丨故障复盘:黄金三问与判定三原则.html
│ ├── 08丨故障复盘:黄金三问与判定三原则.m4a
│ ├── 08丨故障复盘:黄金三问与判定三原则.pdf
│ ├── 09丨案例:互联网典型的SRE组织架构是怎样的?.html
│ ├── 09丨案例:互联网典型的SRE组织架构是怎样的?.m4a
│ ├── 09丨案例:互联网典型的SRE组织架构是怎样的?.pdf
│ ├── 10丨经验:都有哪些高效的SRE组织协作机制?.html
│ ├── 10丨经验:都有哪些高效的SRE组织协作机制?.m4a
│ └── 10丨经验:都有哪些高效的SRE组织协作机制?.pdf
└── 03丨结束语 (1讲)
├── 结束语|聊聊我的SRE落地心路历程.html
├── 结束语|聊聊我的SRE落地心路历程.m4a
└── 结束语|聊聊我的SRE落地心路历程.pdf
5 directories, 36 files
以上就是极客时间赵成老师的专栏课《SRE实战手册》的详细介绍了。
本文由提供IT教程网提供,仅供学习交流使用,未经许可,禁止转载!
原课程地址:https://time.geekbang.org/column/intro/100048201,有能力的朋友请支持正版,谢谢!
评论(0)