全方面提升稳定性保障能力丨SRE研发运营系统可靠性与连续性评估报名正式开启!
来源:欧宝手机网页版 发布时间:2024-03-16 03:56:52原标题:全方面提升稳定性保障能力丨SRE研发运营系统可靠性与连续性评估报名正式开启!
随着各领域数字化转型的推进,数据密集型系统的应用场景范围逐步扩大,承载业务愈发关键,用户的高频访问成为常态,系统复杂性呈指数上升,这一些因素明显地增加了稳定性风险。传统的系统稳定性保障方法论难以适应数字化发展的需要,导致近年来全世界内系统故障事件频发。
为推动各行业系统稳定性体系建设,中国信通院依托分布式系统稳定性实验室,联合多家头部企业于2021年制定了《分布式系统稳定性保障能力分级要求》标准,今年标准工作组对框架及内容做了全面升级,正式更新为《研发运营一体化(DevOps)能力成熟度模型 第14部分:系统可靠性与连续性工程》标准,并依据此标准全新推出了SRE研发运营系统可靠性与连续性评估。
该评估由中国信通院工程师在参评机构现场完成,大致上可以分为研发过程的可靠性与连续性保障能力与技术运营过程的可靠性与连续性保障能力两大部分。覆盖了参评单位在系统研发运营生命周期中为保持系统平稳运行而采取的一系列工作,对参评机构的系统可靠性与连续性保障体系进行全方位的梳理。
①以项目为单位,评估参评项目的系统研发运营全过程的可靠性与连续性保障能力
参评方依照《研发运营一体化(DevOps)能力成熟度模型 第14部分:系统可靠性与连续性工程》标准及评估要求提供佐证材料
中国信通院评估小组于参评单位现场评估,评估完成后统一组织专家评审会对评估结果做复核评审
评估结果依据能力成熟度分为初始级、稳健级、优化级、引领级、卓越级五个级别
中国信通院对于通过评估的项目,将颁发相应成熟度级别证书,对不符合的能力项在检验报告中将给出整改建议
未来中国信通院DGA分布式系统稳定性实验室将持续开展系统稳定性评测项目,为各行业研发运营系统可靠性与连续性保障提供指导和帮助,助力我国数字化转型实现“又快又稳”。
面向分布式系统研发运营方,评估相关团队保障系统平稳运行的能力,即控制系统内部隐患,在故障发生时维持服务,排查故障并恢复系统的能力。评估内容有研发过程可靠性与连续性保障:设计与开发、质量保障、部署发布;技术运营过程可靠性与连续性保障:故障预防、故障观测、故障处置、优化改进。由信通院评估小组进行现场评估。完成评估的企业包括:浙江移动、工商银行、招商银行、农业银行、中原银行、数字广东、威海市大数据中心等。
考察数据产品是不是能在多种故障场景下保持平稳运行。通过对被测产品在稳定情况下的性能指标和在受到计算、存储、网络、节点等多种故障影响下的性能指标作比较,以衡量被测系统的性能受故障影响的程度,能为评估被测产品在存在扰动的场景下维持可用性和性能的能力提供量化的参考。测试对象是分布式数据库或云原生数据库,其类型包括事务型数据库、分析型数据库、时序数据库。由信通院提供测试用机房环境。完成测试的企业包括:京东科技、阿里云、华为云等。
dbaplus社群是围绕Database、BigData、AIOps的企业级专业社群。资深大咖、技术干货,每天精品个人独创的文章推送,每周线上技术分享,每月线下技术沙龙,每季度Gdevops&DAMS行业大会。