Google 在2003年启动了一个全新的团队——“SRE 团队”,该团队旨在通过软件工程的方法提高应用系统的可靠性;随着 SRE 相关理论和实践在 Google 的日臻成熟,SRE 实践也从 Google慢慢地扩散到了整个行业。自从 SRE 的理念进入中国以来,就已经引起了很多企业的关注和效仿,但各企业实施 SRE 的方法各异,SRE 的实现效果也各不相同。与此同时,中国的互联网行业中涌现出了一批对SRE 充满热情的倡导者,他们为社区做出了各种贡献;包括:孙宇聪翻译出版了《SRE:Google 运维解密》、赵成在极客时间开设了课程《SRE 实战手册》,以及赵舜东在社区里积极地布道分享等等,不胜枚举。
2022 年,由赵成等人牵头,首批来自于互联网、运营商、金融等行业领军企业的 SRE 团队负责人齐聚一堂,组织了SRE 研讨社区,定期开展社区分享活动,共同探讨 SRE 在各企业里的发展路径,分享各自的实战经验,并总结出了这份来自一线实战的、详实而持续更新的《SRE 实践白皮书》。社区每年都吸纳新的成员,逐年更新本白皮书内容,力求真实客观地描述国内企业SRE 团队的工作方式。在《实践白皮书》初稿长达两年的整理过程中,我们看到了不同企业对SRE 的理解,并尽可能统一大家对相似场景的定义;我们看到了不同企业对SRE 职能领地的扩展,并将成功团队的经验提炼成案例供大家参考;我们也看到了在这两年的编写过程中,不同企业SRE 团队的真实变化,并及时将其更新到实践白皮书中。总之,在未来的每个季度,我们都会将各SRE 团队的最新职能、组织形式、技术迭代等现状,补充到《实践白皮书》中。
2023 年,中国信息通信研究院(下简称信通院)云计算与大数据研究所(下简称云大所)稳定性保障实验室的专家加入了 SRE 研讨社区,深度的参与到社区交流当中,为《SRE 实践白皮书》的编写工作提供了专业指导。
参编企业包括20多家企业的SRE负责人或者SRE主管经理,SRE社区代表、信通院代表等。
白皮书发布更新进展和下载,点这里:《SRE实践白皮书》
SRE精英联盟不光注重联盟内部的研讨交流。更重视构建一个活跃的 SRE 社区,从 2024 年开始联盟会定期举办线上和线下的技术分享活动,邀请各企业的SRE团队负责人,一线技术专家,分享各自的 SRE 实战经验。活动的内容包括 SRE 团队的各种项目实践、团队组织形式、技术迭代、职能领域的扩展等。活动的目的是为了促进 SRE 的发展,让更多的企业了解 SRE 的实际应用方式,以及SRE的最佳实践。
所有公开活动的报名信息都会在本站发布,敬请关注。这些活动信息也会同步到联盟建立的微信公众号、视频号、B站和YouTube频道,欢迎关注。
微信公众号、视频号、B站和YouTube频道,请在各个平台搜索 “SRE精英联盟”。