华为云监控相关服务

华为云和性能监控相关的服务有三种,如下:

  • Application Operations Management (AOM 应用运维管理)
  • Application Performance Management (APM 应用性能管理)
  • Cloud Eye(CES 云监控)

AOM 与 APM的区别

apm-aom
apm-aom

AOM和APM都是和应用相关的,APM偏向于应用之间的链路拓扑、调用链分析等,对应的开源软件有Zipkin,Pinpoint,SkyWalking,CAT等,而华为的APM就是基于Pinpoint来做的;AOM属于立体化运维、智能分析的一个汇总平台,其结合了CES性能指标监控、日志监控分析等,同时其在管理控制台也集成了APM调用链分析。

  1. AOM与APM同属于立体化运维解决方案体系,共享采集器。
  2. AOM提供了应用级故障分析、告警管理、日志采集与分析等能力,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。
  3. APM提供了用户体验管理、分布式性能追踪、事务分析等能力,可以帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题,为用户体验保驾护航。AOM提供基础运维能力,APM是对AOM运维能力的补充。
  4. AOM界面集成了APM,可通过AOM界面统一运维;APM也有独立的控制台入口,可以单独使用APM。

参考内容:
huaweicloud APM功能

CES功能

CES 服务当前本身是免费的,默认也是自动开通的,原始指标数据一般保留2天。CES底层通过Cassandra存储监控时序数据的。

CES
ces

云监控服务主要具有以下功能:

  • 自动监控:
    云监控服务不需要开通,在创建弹性云服务器等资源后监控服务会自动启动,您可以直接到云监控服务查看该资源运行状态并设置告警规则。
  • 主机监控:
    通过在弹性云服务或裸金属服务器中安装云监控服务Agent插件,用户可以实时采集ECS或BMS 1分钟级粒度的监控数据。已上线CPU、内存和磁盘等40余种监控指标。有关主机监控的更多信息,请参阅主机监控简介。
  • 灵活配置告警规则:
    对监控指标设置告警规则时,支持对多个云服务资源同时添加告警规则。告警规则创建完成后,可随时修改告警规则,支持对告警规则进行启用、停止、删除等灵活操作。
  • 实时通知:
    通过在告警规则中开启消息通知服务,当云服务的状态变化触发告警规则设置的阈值时,系统通过邮件通知或发送消息至服务器地址等多种方式实时通知用户,让用户能够实时掌握云资源运行状态变化。
  • 监控面板:
    为用户提供在一个监控面板跨服务、跨维度查看监控数据,将用户关注的重点服务监控指标集中呈现,既能满足您总览云服务的运行概况,又能满足排查故障时查看监控详情的需求。
  • 资源分组:
    资源分组支持用户从业务角度集中管理其业务涉及到的弹性云服务器、云硬盘、弹性IP、带宽、数据库等资源。从而按业务来管理不同类型的资源、告警规则、告警历史,可以迅速提升运维效率。

如果设备量和监控项比较多,还是建议要自建监控平台,因类CES是有限制的,比如可创建告警规则数默认就是100条。

CES与AOM、APM的关系

三者之间的关系如图所示:

ces-apm-aom
ces-apm-aom