返回 登录
0

前阿里GOC负责人葛梅:运维转型运营,IT服务管理体系搭建实践

SDCC 2016架构&运维峰会·成都站召开在即,5人以上团购或者购买两场峰会通票更有特惠,余票不足,预购从速。(票务详情链接)。
更多详细内容参见官网网址:SDCC数据库&架构峰会成都站大会报名

2016年8月12日-13日,由CSDN重磅打造的互联网应用架构实战峰会、运维技术与实战峰会将在成都举行。

这是继SDCC 2016架构技术峰会(上海站,官网图文直播架构峰会PPT数据库峰会PPT)和SDCC 2016架构技术峰会(深圳站,官网图文直播架构峰会PPT数据库峰会PPT)圆满收官后的再一次相聚。本次峰会已邀请到来自于百度、阿里、腾讯、京东、华为、小米、乐视、美团、聚美优品、当当网、中国电信、云霁科技、亚信、YY互娱、ThoughtWorks等公司的技术骨干,与大家相聚在安逸舒适、充满麻辣诱惑的成都,在盛享技术大餐之余,还可以大饱一下口服。

离大会还有不足两个星期的时间,很荣幸会前采访到了本次峰会讲师、金融云DCOS公司云霁科技合伙人葛梅,请她聊聊IT运维走向运营的关键点及构建企业IT服务管理体系的实践经验。大会期间她也将带来《超大型互联网IT服务管理和运行指挥体系实践》主题演讲,主要从面向业务部门的IT服务体系搭建实践、IT服务向IT运营转型的迷惘和突破点两方面展开深入分享。

受访嘉宾介绍

图片描述

金融云DCOS公司云霁科技合伙人葛梅

葛梅,金融云DCOS公司云霁科技合伙人。2006年加入支付宝运维部,负责支付宝ITIL体系建设、落地、以及运营,组建支付宝的服务台以及监控中心团队。2013年至2015年,担任阿里集团技术保障部高级经理,负责阿里集团(淘宝、天猫、阿里云、蚂蚁金服等)IT服务管理,组建阿里集团全球运营指挥中心(Global Operations Center,GOC),承担了双11等阿里重大活动的应急、指挥、调度工作。

CSDN:请您首先介绍一下自己,及目前在公司主要负责的工作。

葛梅:之前在阿里工作10年,花名叫薛红玉,一直从事运维相关工作。现任金融云DCOS公司云霁科技合伙人,做运维管控领域的创业。

2006年加入支付宝运维部,负责支付宝ITIL体系建设、落地,以及运营、组建支付宝的服务台以及监控中心团队。

2013年至2015年,担任阿里集团技术保障部高级经理,负责阿里集团(淘宝、天猫、阿里云、蚂蚁金服等)IT服务管理,组建阿里集团全球运营指挥中心(Global Operations Center,GOC),承担了双11等阿里重大活动的应急、指挥、调度工作。

CSDN:面对云计算、大数据等新技术的兴起,IT企业的运维模式发生了怎样的变化?

葛梅:随着云计算的普及,IT已不再是专有技术,而是基础性技术。随着小型机向X86、虚拟化的转移,企业数据中心的管理规模和复杂度日益增加,系统宕机的损失越来越难承受。对于企业与组织而言,IT成为一种常态性投人,需要保障产生业务价值,在这个背景下,通过科学的IT运维管理确保对IT业务产生持续价值。

运维是什么?按照Google SRE的说法,就是站点的可持续性的保障。随着DevOps的流行,开发和运维在某种程度上是融合的,运维比以前有更多的机会走向业务和影响业务。而云计算和云运维的普及,成为了一种可以对外输出的服务,运维可以直接创造业务价值,不再是成本中心。

CSDN:互联网时代,对一些传统企业,尤其是金融行业的数据中心提出了哪些更高的要求?他们应如何面对这些挑战?IT企业的哪些运维经验值得他们借鉴学习?

葛梅:“互联网+”时代,传统企业的数据中心也需要“互联网+”。但是我个人认为,并没有所谓的传统运维和互联网运维之分,只要到一定的业务量,运维面临的问题和解决问题的方法都是类似的。以金融行业为例,支付宝虽然诞生于互联网企业,但是第一天的业务基因就是金融基因,最早支付宝的架构就是学银行的,后来虽着业务量的增大,遇到的挑战越来越多,才有了“去IOE”的创新。当然,今天金融行业可以从互联网的架构演进中学到很多经验,但也不能完全照搬互联网,未来以传统行业的数据中心一定是融合了传统经验和互联网架构的融合体系。

CSDN:云霁科技推出的数据中心操作系统产品“iDCOS”是一款怎样的产品?针对的目标用户是谁?它的优势在哪里?

葛梅:云霁iDCOS,是面向大型数据中心的统一运维PAAS平台,同时支持传统IT环境和云化环境,当前重点针对金融行业,帮助金融机构构建私有云和行业云。

iDCOS综合了大型互联网公司和大型金融机构的运维最佳实践,以“平台化整合”为思路,整合数据中心里各个分散的功能运维工具,形成统一的数据、流程、操作的闭环;以“场景化构建”为手段,从业务需求和业务痛点出发,去覆盖数据中心运维的各个场景,把场景抽象成各个“自服务目录”,实现资源申请、变更发布、运行维护等全生命周期的自动化管理。

iDCOS和传统IT运维平台的区别在于,传统IT运维平台只提供工具,管理的对象局限在资源和操作层面,云霁IDCOS融合了数据中心运行所需要的技术工具、人员组织,流程制度,把管理的对象上升到了数据、流程、业务层面,为传统企业向云计算和分布式提供了最佳实践,真正实现了软件定义数据中心。

CSDN:IT运维与IT运营的区别在哪里?运维团队管理者如何带领团队从IT运维走向IT运营?

葛梅:行业内对IT运维和IT运营有比较感性的描述对比,相信经历过从运维到运营过程的IT人对此深有体会:

  • IT运维更多是被动式“维持”,IT运营更多是主动式“经营”;
  • IT运维更多是面向基础设施面向软硬件,IT运营更多是面向业务面向服务面向人;
  • IT运维的关键词是“稳定”、“安全”、“可靠“,IT运营的关键词是“体验”、“效率”、“效应”;
  • IT运维管理工具更多是关注故障防范和修复的“监管控”,IT运营管理工具开始更多应用性能、用户感知、快速交付、数据分析和可视化。

运维走向运营最大的诉求就是更直接的为公司业务发展提供价值。如何去链接业务和IT,利用IT自身所拥有的资源、数据、技术寻找到与业务产生协同的目标点,是IT运维团队管理者首要去考虑的问题;另外,不断地提取合理的、有业务价值感的运营指标并量化,是IT运营能否落地的关键点。业务协同点、运营指标清晰化后,团队目标、组织架构、人才类型等团建建设和管理的视角已经悄然发生改变,变化慢慢产生。

CSDN:IT运营中,更多的不是来自技术,而是来自管理方面,对此您怎么看?在构建企业IT服务管理体系上,有哪些宝贵的经验?

葛梅:任何一件事情做到“好”的标准,往往都不是一方面的因素能够成就,好的IT运营同样需要技术、管理、运营等多种力同时起作用。当然,IT运营,会更多从业务视角、管理视角去切入,以点带面,驱动技术的协同。比如运营可用率指标,管理上更多的是考虑客户或业务需要什么样的承诺和保障指标,但背后需要应用架构高可用性设计、数据库去单点、流控、容灾、应急切换、演练等大量技术支撑。

构建IT服务管理体系,成熟的理论指导有很多,但是落地有效果的不多。更多是在构建过程中如何根据自身企业所处阶段、环境、业务特性,因地制宜的去落地。

  • 始终围绕业务价值/客户价值设立目标,向业务走近一点,再近一点;
  • 数字驱动一切;
  • 强大的技术和工具支撑。

CSDN:在本次SDCC 2016(成都站)大会上分享的话题是?选择该话题的原因是什么?您希望通过该演讲,让参会者从中获得什么?

葛梅:我这次在SDCC2016(成都站)大会上分享的话题是超大型互联网IT服务管理和运营指挥体系实践,主要分享自己所经历的一线互联网公司IT服务管理从无到有,从运维向运营摸索转型的过程。

  • 面向业务部门的IT服务体系搭建实践;
  • IT服务向IT运营转型的迷惘和突破点。
评论