云服务基础:远程监控 - 报告

编辑人员注释: 本文章由 Ewan Fairweather 撰写。

欢迎阅读关于在 Windows Azure 中的云服务基础 (CSF) 中设计和实施远程监控组件的第四篇博客文章!到目前为止,我们已在远程监控基础知识和故障排除中描述了应用程序运行状况的基本原则,并概括介绍了对您获取所部署 Windows Azure 解决方案相关信息有用的基础工具、信息源和脚本。在第二篇文章中,我们针对远程监控 – 应用程序运行状况测量,描述了应用程序本身何以成为用于监视的最大的信息源,以及应用程序投产之后需如何合理使用才能实现可管理性目标。在第三篇文章中,我们描述了如何伸缩数据采集管道并使之自动化,从而收集解决方案中不同组件和服务的监视和诊断信息,并在可查询的运营存储中整合这些信息。

这是第四篇博客,以报告为主题,基本内容包括演示如何获取所需的系统信息以满足组织的各种分析和报告要求。我们将在本博客中概括介绍已提供的解决方案,并在相应的 WIKI文章中详细说明实施过程。具体地说,我们将向您演示如何快速提取信息(如数据库层资源利用率、端到端的执行时间分析)以及如何将这些信息转变成报告和仪表板。然后在 Wiki 文章中详细介绍运营存储的具体实现,同时提供有关如何对其执行分析查询的示例。此外,我们还将涵盖我们所提供的报告包以及如何利用 Excel 进行深入分析。之后,我们将向您演示如何扩展所提供的帮助功能以获取满足您需求的详细信息。

CSF 中的远程监控数据库

此系列的前一篇文章讨论了数据管道,它是对以下数据流图中所示收集器任务的 CSF 实施。通过这些收集器任务,CSF 远程监控 worker role 和计划程序可以定期(周期可配置)填充远程监控数据库。在本文章中,我们将描述为了确定分析和报告需求需经历的思维过程。然后在相应的 WIKI文章中提供详细信息,以便您了解如何提取信息(如图的右边所示),以通过报告服务、SSMS 和 Excel 提供这些信息。

定义报告方案及要求

有效洞察您的远程监控数据的第一个关键性步骤就是定义报告方案及其关键要求。而在定义 CSF 远程监控解决方案时采用的一个有用的方法是首先定义三种方案:运营报告方案、警报方案和根本原因隔离方案。随后采用“我能”的方法来定义关键要求。接下来设定这些方案的优先级,使大多数运营报告方案和根本原因隔离方案都能在全新的 CSF 体验中进行实施。基础数据结构可以满足您的警报需求。

这种方法是重要的第一步,让我们可以考虑基础架构如何支持现有需求和潜在的未来需求,不论是定义时还是在随后扩展远程监控数据库。因此,如果您计划扩展您的远程监控数据库,就尤其应该使用这种方法。

下图突出显示了与远程监控数据库和报告解决方案相关的 CSF 包的特定部分。

我们希望这能够加深您对解决方案的了解。如果您想了解解决方案的实际应用,请继续阅读相应的 WIKI 文章,其中提供了所有详细信息。

本文翻译自:

https://blogs.msdn.com/b/windowsazure/archive/2013/08/29/csf-series-telemetry-data-pipeline.aspx