阿里云文档 2025-03-28

多集群舰队组件统一管理

ACK仅支持单集群的组件管理,您需手动维护各个集群中组件的版本,维护成本较高,也增加了由于组件升级引发的稳定性问题。ACK One舰队为集群运维人员提供了统一且自动化的组件管理能力,可以定义包含多个组件及其版本的基线,并将其部署到多个集群,同时支持组件配置、部署批次和回滚等功能,从而提升系统的稳定性。。本文将介绍如何在多集群场景中统一安装和管理组件。

阿里云文档 2025-03-28

AI Profiling示例参考

本文以Pytorch训练场景和vLLM推理场景为例,对在ACK集群中运行的GPU容器的AI Profiling检测结果进行分析,重点阐述如何通过在线性能检测结果的可视化页面,分析Python进程、CPU调用、系统调用、CUDA库和CUDA核函数的执行过程,定位性能瓶颈,找到性能调优方向,从而提升GPU利用率和应用效率。

阿里云文档 2025-03-25

为ACK 集群数据面(Kubelet)组件启用链路追踪

kubelet的链路追踪可以记录kubelet在节点上执行的关键操作轨迹,例如 Pod 生命周期管理、API 调用等,以便定位系统性能瓶颈并排查集群问题。启用后,kubelet的链路信息将自动上报至可观测链路 OpenTelemetry 版,提供可视化的链路明细、实时拓扑等监控数据。

阿里云文档 2025-03-25

为ACK 集群控制面(APISever)组件启用链路追踪

为了快速定位性能瓶颈、排查集群问题,建议为集群API Server启用链路追踪,记录其请求交互细节。启用后,API Server的链路信息将自动上报至可观测链路 OpenTelemetry 版,提供可视化的链路明细、实时拓扑等监控数据。

阿里云文档 2025-03-25

为ACK 集群数据面(Kubelet)组件启用链路追踪

kubelet的链路追踪可以记录kubelet在节点上执行的关键操作轨迹,例如 Pod 生命周期管理、API 调用等,以便定位系统性能瓶颈并排查集群问题。启用后,kubelet的链路信息将自动上报至可观测链路 OpenTelemetry 版,提供可视化的链路明细、实时拓扑等监控数据。

文章 2023-12-21 来自:开发者社区

云原生|kubernetes|centos7下的kubeadm部署的集群内在线部署kubesphere(外部etcd)

前言:本文将主要就在centos7操作系统下已有的一个利用kubeadm部署的集群内在线安装kubesphere做一个介绍,该kubernetes集群是使用的etcd外部集群。kubernetes集群的搭建本文不做过多介绍,具体的搭建流程见我的博客:云原生|kubernetes|kubeadm部署高可用集群(一)使用外部etcd集群_kubeadm etcd集群_晚风_END的博客-下面开始就在....

云原生|kubernetes|centos7下的kubeadm部署的集群内在线部署kubesphere(外部etcd)
文章 2023-12-20 来自:开发者社区

云原生|kubernetes|使用cri-docker部署基于kubeadm-1.25.4的集群

前言:kubernetes的部署从1.24版本开始后,弃用docker-shim,也就是说部署1.24版本后的集群不能使用docker-ce了。比较清晰的解决方案有两个,一是使用containerd,这个是一个新的支持cri标准的shim,一个是使用cri-docker这样的中间插件形式,一头通过CRI跟kubelet交互,另一头跟docker api交互,从而间接的实现了kubernetes以....

云原生|kubernetes|使用cri-docker部署基于kubeadm-1.25.4的集群
文章 2023-12-20 来自:开发者社区

云原生|kubernetes|kubeadm部署的集群的100年证书

前言:首先,先看看minikube这样的开发或者测试使用的kubernetes集群的证书时间:[root@node3 ~]# kubeadm certs check-expiration [check-expiration] Reading configuration from the cluster... [check-expiration] FYI: You can look at thi.....

文章 2023-12-19 来自:开发者社区

云原生|kubernetes|部署MySQL一主多从复制集群(基于GTID的复制)

前言:一,MySQL的主从复制优点如下:数据更安全:做了数据冗余,不会因为单台服务器的宕机而丢失数据 性能大大提升:一主多从,不同用户从不同数据库读取,性能提升 扩展性更优:流量增大时,可以方便的增加从服务器,不影响系统使用 负载均衡:一主多从相当于分担了主机任务,做了负载均衡。那么在实操之前,我们还是需要了解一下主从复制的原理:二,主从复制的原理:MySQL的复制功能用三个线程来实现: 主库:....

云原生|kubernetes|部署MySQL一主多从复制集群(基于GTID的复制)
文章 2023-12-19 来自:开发者社区

云原生|kubernetes|kubeadm部署高可用集群(二)---kube-apiserver高可用+etcd外部集群+haproxy+keepalived

前言:上一篇文章云原生|kubernetes|kubeadm部署高可用集群(一)使用外部etcd集群_晚风_END的博客-CSDN博客讲述了如何利用kubeadm部署集群的时候使用外部扩展etcd集群,使得集群的整体结构做了一些解耦,提高了集群的负载能力,那么,本文将讲述如何在此基础上做到kube-apiserver的高可用,从而部署一个可完全用于生产的kubernetes集群。下面就直接上干货....

云原生|kubernetes|kubeadm部署高可用集群(二)---kube-apiserver高可用+etcd外部集群+haproxy+keepalived

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

容器服务

国内唯一 Forrester 公共云容器平台领导者象限。

+关注
相关镜像