宕机原因查明:员工“乌龙指”致 AWS 误移除 S3 子系统中的大量站点

2017年03月03日 08:49 次阅读 稿源:cnBeta.COM 条评论

越来越多的互联网站点开始依托于亚马逊 AWS 等云平台,尽管其品牌影响力和可靠性比许多中小型主机托管服务商要高一些,但这并不意味着能够 100% 避免不宕机。几天前,亚马逊 Web 服务就遭遇了一场部分停摆的尴尬,许多互联网站点都受这波故障的影响而离线。而根据亚马逊刚刚发布的详情报告,事情可能需要归咎于某个员工从 S3 子系统中,向一台远程服务器输入了一个“常规命令”。

a-simple-typo-took-down-aws-s3-and-a-good-chunk-of-the-internet-513507-2.jpg

不幸的是,员工输入了一个比预想的要大得多的数字。命令影响到了另外两个 S3 子系统上的服务器,而后者分管着全区的存储和元数据 —— 事情就此变得一发而不可收拾。

报告解释到:

一名 S3 团队的授权成员,用一个既定的脚本执行了一个命令。

他原本是想将(通过 S3 计费处理的)一小部分服务器从某个 S3 子系统中移除,却不慎输入了一个不正确的指令,结果移除了一大票比预期更大数量的服务器。

无意中删除的服务器位于两个其它 S3 子系统中,其中一个是索引子系统,管理者元数据和全区所有 S3 对象的定位信息。

[编译自:Soft Pedia , 来源:Amazon Web Services]

访问:

腾讯云

访问:

阿里云

对文章打分

宕机原因查明:员工“乌龙指”致 AWS 误移除 S3 子系统中的大量站点

4 (50%)
已有 条意见

    最新资讯

    加载中...

    今日最热

    加载中...

    热门评论

      招聘

      Advertisment ad adsense googles cpro.baidu.com
      created by ceallan