腾讯云 4.8 故障原因曝光:因 API 新版本兼容性不够和配置数据灰度机制不足
开源Linux
共 2798字,需浏览 6分钟
· 2024-04-15
2024 年 4 月 8 日 15 点 23 分,腾讯云团队收到告警信息,云 API 服务处于异常状态;随即在腾讯云工单、售后服务群以及微博等渠道开始大量出现腾讯云控制台登录不上的客户反馈。
经过故障定位发现,客户登录不上控制台正是由云 API 异常所导致。
云 API 是云上统一的开放接口集合,客户可以通过 API 以编程方式管理和操控云端资源,云控制台通过组合云 API 提供交互式的网页功能。
故障发生后,依赖云 API 提供产品能力的部分公有云服务,也因为云 API 的异常出现了无法使用的情况,比如云函数、文字识别、微服务平台、音频内容安全、验证码等。
此次故障一共持续了近 87 分钟,期间共有 1957 个客户报障。
从客户的视角来看,云服务大概可以分为数据面和控制面,数据面承载客户自身的业务,控制面负责操作云上不同产品。
比如目前使用最广泛的 IaaS 服务基本上都是以直接面向数据面为主,控制面仅在客户购买或需要对资源层面进行调整操作时会涉及。此次发生故障的控制台和云 API 是对控制面的影响。
问题复盘
整个处理过程如下:
改进措施
综合盘点这次故障,最根本的原因是在版本变更过程中,没有有效执行沙箱验证和预案演练,暴露了在变更管理上的不足,接下来将从以下几个方面快速进行改进和完善,以减少故障的影响范围和影响时长。
评论
API Grandma更快的 API 创建和数据库配置
API Grandma 是一个基于 CLI 框架的 API 和 ORM 构建器,用于自动化 API
API Grandma更快的 API 创建和数据库配置
0
API Grandma更快的 API 创建和数据库配置
APIGrandma是一个基于CLI框架的API和ORM构建器,用于自动化API开发和数据库建模。支持costum路由创建、代码生成、自动化脚本等等。目前处于alpha开发阶段。API-GRAN有3个
API Grandma更快的 API 创建和数据库配置
0