帮助文档 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
帮助文档 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. 分布式云容器平台ACK One
  4. 操作指南
  5. 注册集群
  6. 可观测性
  7. 将事件中心接入注册集群

将事件中心接入注册集群

  • 可观测性
  • 发布于 2025-04-18
  • 0 次阅读
文档编辑
文档编辑

注册集群接入事件中心功能可以记录Kubernetes集群的状态变更,包括配置Pod及组件异常等。Kubernetes事件中心功能实时汇聚Kubernetes中的所有事件并提供存储、查询、分析、可视化、告警等能力。本文介绍如何通过容器服务Kubernetes版中的应用将事件中心接入至注册的Kubernetes集群。

前提条件

  • 已创建ACK One注册集群,并已将本地数据中心自建Kubernetes集群接入ACK One注册集群。具体操作,请参见创建ACK One注册集群。

  • 获取集群KubeConfig并通过kubectl工具连接注册集群。

背景信息

Kubernetes的架构设计基于状态机,不同的状态之间进行转换会生成相应的事件,正常的状态之间转换会生成Normal等级的事件,正常状态与异常状态之间的转换会生成Warning等级的事件。

ACK提供开箱即用的容器场景事件监控方案,通过ACK维护的NPD(node-problem-detector)以及包含在NPD中的kube-eventer提供容器事件监控能力。事件监控关系图

  • NPD(node-problem-detector)是Kubernetes节点诊断的工具,可以将节点的异常,例如Docker Engine Hang、Linux Kernel Hang、网络出网异常、文件描述符异常转换为Node的事件,结合kube-eventer可以实现节点事件告警的闭环。更多信息,请参见NPD。

  • kube-eventer是ACK维护的开源Kubernetes事件离线工具,可以将集群的事件离线到钉钉、SLS、EventBridge等系统,并提供不同等级的过滤条件,实现事件的实时采集、定向告警、异步归档。更多信息,请参见kube-eventer。

步骤一:为事件中心组件配置RAM权限

通过onectl配置

  1. 在本地安装配置onectl。具体操作,请参见通过onectl管理注册集群。

  2. 执行以下命令,为事件中心组件配置RAM权限。

    onectl ram-user grant --addon ack-node-problem-detector

    预期输出:

    Ram policy ack-one-registered-cluster-policy-ack-node-problem-detector granted to ram user ack-one-user-ce313528c3 successfully.

通过控制台配置

在注册集群中安装组件前,您需要在接入集群中设置AccessKey用来访问云服务的权限。设置AccessKey前,您需要创建RAM用户并为其添加访问相关云资源的权限。

  1. 创建RAM用户。

  2. 创建自定义权限策略。

    展开查看事件中心所需的自定义权限策略内容

    {
        "Version": "1",
        "Statement": [
            {
                "Action": [
                    "log:CreateProject",
                    "log:GetProject",
                    "log:DeleteProject",
                    "log:CreateLogStore",
                    "log:GetLogStore",
                    "log:UpdateLogStore",
                    "log:DeleteLogStore",
                    "log:CreateConfig",
                    "log:UpdateConfig",
                    "log:GetConfig",
                    "log:DeleteConfig",
                    "log:CreateMachineGroup",
                    "log:UpdateMachineGroup",
                    "log:GetMachineGroup",
                    "log:DeleteMachineGroup",
                    "log:ApplyConfigToGroup",
                    "log:GetAppliedMachineGroups",
                    "log:GetAppliedConfigs",
                    "log:RemoveConfigFromMachineGroup",
                    "log:CreateIndex",
                    "log:GetIndex",
                    "log:UpdateIndex",
                    "log:DeleteIndex",
                    "log:CreateSavedSearch",
                    "log:GetSavedSearch",
                    "log:UpdateSavedSearch",
                    "log:DeleteSavedSearch",
                    "log:CreateDashboard",
                    "log:GetDashboard",
                    "log:UpdateDashboard",
                    "log:DeleteDashboard",
                    "log:CreateJob",
                    "log:GetJob",
                    "log:DeleteJob",
                    "log:UpdateJob",
                    "log:PostLogStoreLogs",
                    "log:CreateSortedSubStore",
                    "log:GetSortedSubStore",
                    "log:ListSortedSubStore",
                    "log:UpdateSortedSubStore",
                    "log:DeleteSortedSubStore",
                    "log:CreateApp",
                    "log:UpdateApp",
                    "log:GetApp",
                    "log:DeleteApp",
                    "cs:DescribeTemplates",
                    "cs:DescribeTemplateAttribute"
                ],
                "Resource": [
                    "*"
                ],
                "Effect": "Allow"
            }
        ]
    }
  3. 为RAM用户授权。

    可选择自定义权限策略或AliyunECIFullAccess策略为RAM用户授权。

  4. 为RAM用户创建AccessKey。具体操作,请参见获取AccessKey。

  5. 使用AccessKey在注册集群中创建名为alibaba-addon-secret的Secret资源。

    安装事件中心相关组件时将自动引用此AccessKey访问对应的云服务资源。

    执行以下命令创建事件中心使用的Secret。

    kubectl -n kube-system create secret generic alibaba-addon-secret --from-literal='access-key-id=<your AccessKey ID>' --from-literal='access-key-secret=<your AccessKey Secret>'
    说明

    <your AccessKey ID>及<your AccessKey Secret>为上一步获取的AccessKey信息。

步骤二:安装事件中心组件

通过onectl安装

执行以下命令,安装事件中心组件。

onectl addon install ack-node-problem-detector

预期输出:

Addon ack-node-problem-detector, version xxx installed.

通过控制台安装

  1. 登录容器服务管理控制台,在左侧导航栏选择集群列表。

  2. 在集群列表页面,单击目标集群名称,然后在左侧导航栏,选择运维管理 > 事件中心。

  3. 可选:若提示未安装组件ack-node-problem-detector,请单击创建事件中心。

  4. 在事件中心页面,单击事件总览页签,然后在页面右上角单击事件中心管理,在K8s事件中心页面左侧导航栏,单击目标集群名称左边的展开图标展开,查看Kubernetes事件中心相关信息。

    事件中心

    您可以查看Kubernetes事件的总览及详情、Pod生命周期,还可以进行自定义查询及告警配置。

执行结果

配置成功后,即可使用事件中心功能。更多信息,请参见创建并使用K8s事件中心。

将事件中心接入注册的Kubernetes集群后,即可使用K8s事件中心,包括查看事件总览、查询事件详情、查看Pod生命周期、配置告警和自定义查询等操作。

相关文档

  • 注册集群概述

  • 事件监控

相关文章

将日志服务接入注册集群 2025-04-18 18:13

注册集群接入日志服务可以为分布在各处的Kubernetes集群提供统一的管理方式。本文介绍如何通过阿里云容器服务Kubernetes版中的应用将日志服务接入注册集群。 前提条件

将事件中心接入注册集群 2025-04-18 18:13

注册集群接入事件中心功能可以记录Kubernetes集群的状态变更,包括配置Pod及组件异常等。Kubernetes事件中心功能实时汇聚Kubernetes中的所有事件并提供存储、查询、分析、可视化、告警等能力。本文介绍如何通过容器服务Kubernetes版中的应用将事件中心接入至注册的Kubern

将报警配置功能接入注册集群 2025-04-18 18:13

报警配置功能提供容器场景报警能力的统一管理,包括容器服务异常事件报警,以及容器场景指标报警。您可以通过集群内部署CRD的方式配置容器服务的报警规则。本文介绍在注册集群中如何接入报警配置功能及如何配置报警规则。 前提条件

将应用实时监控服务ARMS接入注册集群 2025-04-18 18:13

应用实时监控服务ARMS能够对应用进行全方位的监控,帮助您全面掌握应用的运行状态。您可以在注册集群中安装ARMS应用监控组件,将ARMS服务安装到已注册的Kubernetes集群中,使用ARMS对集群中的应用进行监控。 前提条件

将阿里云Prometheus接入注册集群 2025-04-18 18:13

注册集群接入阿里云Prometheus能为分布在各处的Kubernetes集群提供统一的管理方式。本文介绍如何将阿里云Prometheus接入至注册集群中。

集群成本洞察 2025-04-18 18:13

本文介绍如何查看集群成本洞察及集群成本洞察的能力。 前提条件

目录
Copyright © 2025 your company All Rights Reserved. Powered by 博智数字服务平台.
闽ICP备08105208号-1