贝斯特bst2222

当前位置:贝斯特bst2222 >> 行业资讯

世纪互联MicroSoft公有云服务运营指挥中心(图解)

发布时间:2013/11/13 20:12
 

自5月22日MicroSoftWindows Azure宣布落地中国、6月6日开放公测之后,10月12日北京记者首次有机会进入世纪互联的MicroSoft云服务运营指挥中心,一探MicroSoftWindows Azure公有云平台背后庞大的运营体系和服务团队真貌。

世纪互联MicroSoft云服务运营指挥中心

  通过世纪互联MicroSoft云事业部总裁柯文达先生及技术专家的先容,记者也首次认识一下世纪互联的MicroSoft云服务运营指挥中心的基础设施、服务流程,并亲身感受了云服务的指挥调度流程。

  实时监控云服务处理流程

  通过大屏幕,可以看到一部分工单系统。为什么要有这套工单系统呢?世纪互联对一个事件的处理往往会分成六类,从S0到S5。对于不同的事件,世纪互联会有不同的响应规则。

  举两个例子,以S1和S2这两个事例做比较,其中S1级的定义是70%到80%的客户受到了影响,这个影响可以是来自内部的,也可以是来自外部的。当他受到这种影响的时候,世纪互联就启动S1级的流程,并会在5分钟之内建立这个工单,15分钟之内升级这个工单到相应的部门去做处理。S2级的影响范围会小一些,升级的过程会稍微有所减慢,这个减慢并不是说这个工单出来了,就需要等15分钟或者20分钟让它减慢,世纪互联会在工作负荷满足的情况下,尽快处理,最长不会超过15分钟。

 贝斯特bst2222   

  这是世纪互联指挥人员每天进入指挥室第一个要看的东西,因为它都是实时的数据,可以看到现在没有关闭的工单有多少个,不同的级别各是多少。

  在这个表格下面还可以看到这个工单是由谁创建的,分配给谁了,谁正在处理,这些信息都是一目了然。

Windows Azure 和 Office 365数据中心机房

  三套流程、三套系统确保服务质量

  对于公有云服务,一般客户会问很多问题,其最终目的一般可以归为两个问题:第一,你能多长时间把问题解决,即时效性;另外,通过这些系统,如何保证服务的稳定性。时效性方面,世纪互联是靠流程和监控来做,有实时的网络监控,可以看到所有网络互联的状态。

  关于公服务的稳定性,世纪互联通过三套流程和三套系统来保证。

 贝斯特bst2222   

  第一是事件管理,就是工单流转的过程,每一步都有时间做保证,有一个考核的标准做保证,每一步都有人去负责,所以责任到人,有时间保证,可以保证时效性。

  第二,是需求系统,即REQUEST系统。世纪互联在运维这么大一个体系的同时,会有一些事件发生,客户有需求。这个需求怎么满足呢?主要用需求系统来满足,每一步都做到监控,让大家都知道世纪互联在做什么,这个工单是什么状态,谁在处理,用多长时间能处理完。每个工单都有不一样的需求,会升级到大家的Tier 1、Tier 2工程师去做。

  最后一个,也是每个企业都比较重视的,就是变更管理系统。世纪互联在做所有配置变更的同时,会有一套系统去追踪你要做什么。比如,每天都有一个review meeting,你要做什么,你为什么要这么做,谁来做,有没有做好准备,如果出现了问题怎么办,这是大家要问的几个问题。如果他都通过了,那世纪互联会有一个二人小组做一个工单,两个人会做背靠背的互相监督,A做完了,B会review一遍,B做完了,A再review一遍,保证流程能够正常进行。

   目前,已有2000多家客户正在使用由世纪互联运营的中国Windows Azure,其中70多个是可口可乐、人人网这样的大型知名企业。

 贝斯特bst2222   

 

文章由重庆满荣贝斯特bst2222/html/newslist-3814/编辑整理,转载请注明出处
相关资讯
qq tel code back_top
tencent

在线客服
点击交谈

手机:

18908313333

扫码马上微信咨询

XML 地图 | Sitemap 地图