返回 登录
1

提高监控策略的十个小技巧

原文:10 Tips for an Effective Monitoring Strategy
作者:Dawn Parzych
翻译:Diwei

译者注:为了收集用户体验的相关信息,必须得学习一些基本的监控策略,将指标与业务联系起来,并与竞争对手在性能方面进行比较。以下为译文。

这是我三篇连载文章中的第二篇,在这几篇文章中我会对O’Reilly Media中DevOps for Media & Entertainment这篇文章提到的一些观点进行扩展。第一篇文章介绍了DevOps很基础但是经常被忽视的两个方面:沟通和共情。今天,我们将深入探讨一个技术性更强的话题——监控。

监控的重要性不言而喻,通过监控可以知道服务是否正常。当某些组件出现故障以后,监控工具可以通过警报通知用户,并帮助用户对问题进行诊断。因此建立一套有效的监控策略可以让企业获得巨大的利益,包括:

  • 企业收入、品牌影响和安全系数都会得到保障;
  • 可以在影响客户使用之前定位出问题;
  • 创建了反馈循环以及增强了稳定性;
  • 收集了关于使用性和可用性的信息;
  • 可以对A/B场景进行试验;
  • 从生产用户中收集信息。

但是,有效的监控策略究竟包括哪些组成部分呢?O’Reilly的报告指出应该包含可以分析日志文件以及可以跟踪类似于内存、存储空间和处理能力这样的系统资源。这是一个很好的提议,但是要实现上面列出的那么多利益,仅仅包含这些是远远不够的。一个全面的监控策略必须包括对真实用户的监控(RUM)。

现在的应用程序非常复杂。如果只是监控基础架构和交付内容,那么可能会遗漏某些问题。来自于全球分布定位的合成监控可以帮助企业不仅对基础架构进行测试,还可以测试其它的依赖项。只要是在防火墙和系统内进行测试是没有关系的,但是用户仍然可能遇到问题。以真实用户访问应用的方式来对应用进行监控,这样才可以对监控数据有最深刻的理解。

用户的分布范围很广泛,而且可以使用很多设备访问和连接应用程序。合成监控可能无法覆盖所有的地理区域,这种情况下RUM就可以发挥作用了。RUM从真实的访问者那里收集数据,让你了解用户是如何与站点交互的,他们获取了哪些路径,以及页面是如何执行的。RUM可以通过合成监控和日志来扩大洞察力。

收集监控数据可能很容易,但是要确定要收集哪些数据,还得要确保所有的观点都被包含进来可能就比较困难了。

这里有10个提示可以帮助用户创建全面的监控策略:

  1. 监控组件及整体。获得完整的图像需要将系统级、组件级和总体应用程序度量包含进来。

  2. 分析第一方和第三方的表现。第三方的问题会影响整体的数字体验,就像第一方内容的问题一样。

  3. 度量单个页面和多步骤事务。用户访问的页面不止一个页面,所以不应该仅仅只监视主页。

  4. 配置警报,这样当性能从基线变化时可以通知用户。早期识别问题并且进行解决也可以避免影响客户的使用。

  5. 将你的表现与竞争对手或行业领袖进行比较。性能是相对的,你每天都在和其他网站进行比较,这样就会得到很多累积的信息了。

  6. 从用户的角度进行监视。从真实用户那里获取测量标准,以获得最广泛的覆盖,并使用这些位置来影响从哪里捕获合成测量。

  7. 测量多种连接类型的性能。连接类型的性能和可用性可能会有很大差异。

  8. 将指标与业务战略保持一致。为什么企业中的其他人会对度量标准特别关心呢?向他们描述一下监控数据是如何与业务战略相关的,如增加客户忠诚度、增加收入或降低成本。

  9. 定期重新评估战略。随着公司的发展,应用程序也会发生变化,监控策略也需要重新评估。

  10. 寻找异常值。我们可以从问题中学到很多的知识。

创建一个监控策略并不容易,但是从长远的角度来看,你的投入一定是值得的。

想要了解更多关于建立一个全面的监控策略的信息,请下载Media&Entertainment的DevOps报告。

评论