阿里云文档 2025-03-25

为ACK 集群数据面(Kubelet)组件启用链路追踪

kubelet的链路追踪可以记录kubelet在节点上执行的关键操作轨迹,例如 Pod 生命周期管理、API 调用等,以便定位系统性能瓶颈并排查集群问题。启用后,kubelet的链路信息将自动上报至可观测链路 OpenTelemetry 版,提供可视化的链路明细、实时拓扑等监控数据。

阿里云文档 2025-03-25

为ACK 集群控制面(APISever)组件启用链路追踪

为了快速定位性能瓶颈、排查集群问题,建议为集群API Server启用链路追踪,记录其请求交互细节。启用后,API Server的链路信息将自动上报至可观测链路 OpenTelemetry 版,提供可视化的链路明细、实时拓扑等监控数据。

阿里云文档 2025-03-25

为ACK 集群数据面(Kubelet)组件启用链路追踪

kubelet的链路追踪可以记录kubelet在节点上执行的关键操作轨迹,例如 Pod 生命周期管理、API 调用等,以便定位系统性能瓶颈并排查集群问题。启用后,kubelet的链路信息将自动上报至可观测链路 OpenTelemetry 版,提供可视化的链路明细、实时拓扑等监控数据。

阿里云文档 2025-03-25

为ACK 集群控制面(APISever)组件启用链路追踪

为了快速定位性能瓶颈、排查集群问题,建议为集群API Server启用链路追踪,记录其请求交互细节。启用后,API Server的链路信息将自动上报至可观测链路 OpenTelemetry 版,提供可视化的链路明细、实时拓扑等监控数据。

阿里云文档 2025-03-21

Spark on ACK概述

Spark on ACK是ACK基于Spark on Kubernetes提供的解决方案,让您能够基于ACK提供的企业级容器应用管理能力,快速构建高效、灵活且可扩展的Spark大数据处理平台。

文章 2025-03-02 来自:开发者社区

OpenAI故障复盘丨如何保障大规模K8s集群稳定性

作者: 阿里云容器服务团队:佳旭、行疾 阿里云可观测团队:凌竹、丹雀、左知 01前言 Cloud Native Kubernetes(K8s)架构已经是当今IT架构的主流与事实标准[CNCF Survey][1]。随着承接的业务规模越来越大,用户也在使用越来越大的K8s集群。Kubernetes官方建议的最大集群规模是5000节点[2]...

OpenAI故障复盘丨如何保障大规模K8s集群稳定性
文章 2024-12-25 来自:开发者社区

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

【阅读原文】戳:OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性 本文作者: 容器服务团队:刘佳旭、冯诗淳 可观测团队:竺夏栋、麻嘉豪、隋吉智     1. 前言   Kubernetes(K8s)架构已经是当今IT架构的主流与事实标准(CNCF Survey...

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性
文章 2023-11-27 来自:开发者社区

阿里云 ACK 云上大规模 Kubernetes 集群高可靠性保障实战

1.引言2023 年 7 月,阿里云容器服务 ACK 成为首批通过中国信通院“云服务稳定运行能力-容器集群稳定性”评估的产品, 并荣获“先进级”认证。随着 ACK 在生产环境中的采用率越来越高,稳定性保障已成为基本诉求。本文基于 ACK 稳定性保障实践经验,帮助用户全面理解 ACK 稳定性理论和优化策略,并了解如何使用相应的工具和服务进行稳定性保障。2.K8s 集群稳定性和大规模场景下的挑战2.....

阿里云 ACK 云上大规模 Kubernetes 集群高可靠性保障实战
文章 2023-01-11 来自:开发者社区

大规模 Kubernetes 集群故障注入的利器-ChaosBlade

作者:叶飞ChaosBlade随着云原生的发展,云原生应用一致性、可靠性、灵活编排的能力让大部分企业选择将应用往云上迁移,但同时云基础设施在稳定性、可观测、也接受的强大的考验。ChaosBlade 是阿里巴巴开源的一款遵循混沌工程原理和混沌实验模型的实验注入工具,帮助企业提升分布式系统的容错能力,并且在企业上云或往云原生系统迁移过程中业务连续性保障。ChaosBlade Operator 是 k....

大规模 Kubernetes 集群故障注入的利器-ChaosBlade
文章 2022-10-24 来自:开发者社区

大规模 Kubernetes 集群故障注入的利器-ChaosBlade

ChaosBlade 随着云原生的发展,云原生应用一致性、可靠性、灵活编排的能力让大部分企业选择将应用往云上迁移,但同时云基础设施在稳定性、可观测、也接受的强大的考验;ChaosBlade 是阿里巴巴开源的一款遵循混沌工程原理和混沌实验模型的实验注入工具,帮助企业提升分布式系统的容错能力,并且在企业上云或往云原生系统迁移过程中业务连续性保障。ChaosBlade Operator 是 kuber....

大规模 Kubernetes 集群故障注入的利器-ChaosBlade

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

容器服务

国内唯一 Forrester 公共云容器平台领导者象限。

+关注
相关镜像