阿里云文档 2025-02-19

ACK灵骏Pod使用RDMA

本文档介绍如何在ACK灵骏集群中配置和使用RDMA(RemoteDirect Memory Access)技术,实现高性能容器网络通信。RDMA技术可显著降低网络延迟并提升吞吐量,适用于高性能计算(HPC)、AI训练、分布式存储等对网络性能要求严苛的场景。

阿里云文档 2025-02-12

ACK集群同步节点

在 ACK 集群中,由于节点的动态扩缩容,导致IP地址频繁变动。通过 ACK 集群同步节点,自动同步 ACK 集群内节点 IP 地址到云防火墙地址簿,减少手动更新工作量,提高安全性。

阿里云文档 2025-02-06

升级操作系统镜像版或更换节点操作系统类型

ACK集群会定期发布新的操作系统镜像版本,带来新的功能特性、功能优化和缺陷修复,请及时升级节点池的操作系统镜像版本。您也可以按需切换操作系统类型,例如将已经停止维护(EOL)的操作系统更换为支持中的操作系统。

阿里云文档 2025-02-06

升级操作系统镜像版或更换节点操作系统类型

ACK集群会定期发布新的操作系统镜像版本,带来新的功能特性、功能优化和缺陷修复,请及时升级节点池的操作系统镜像版本。您也可以按需切换操作系统类型,例如将已经停止维护(EOL)的操作系统更换为支持中的操作系统。

阿里云文档 2025-01-17

启用节点自动伸缩以实现节点的自动扩缩容

当集群的容量规划无法满足应用Pod调度时,您可以使用节点自动伸缩方案实现节点的自动扩缩。节点自动伸缩适用于扩容规模较小(例如开启弹性的节点池数量少于20,或对应节点池中的节点数量少于100),工作负载批次较为稳定,以单次伸缩为主等业务场景。

文章 2024-08-24 来自:开发者社区

在K8S中,节点故障pod驱逐pod过程,时间怎么定义的?

在Kubernetes(K8S)中,节点故障导致Pod驱逐的过程是一个涉及多个组件和参数协同工作的复杂流程。这个过程的时间定义主要通过一系列参数来配置和确定。以下是该过程的详细解释以及时间定义的说明: 一、节点故障检测 节点控制器(Node Controller)检查间隔: node-monitor-period:这是节点控制器检查每个节...

文章 2024-08-19 来自:开发者社区

在K8S中,节点故障驱逐pod过程时间怎么定义?

在Kubernetes中,节点故障驱逐Pod的过程涉及多个参数和组件的相互作用。以下是该过程的简要概述: 默认设置:在默认配置下,节点故障时,工作负载的调度周期约为6分钟。 关键参数: node-monitor-period:节点控制器(node controller)检查每个节点的间隔,默认值为5秒。 node-monito...

问答 2024-05-28 来自:开发者社区

ChaosBlade通过daemonset方式,对k8s节点执行节点网络丢包故障注入怎么办?

"ChaosBlade通过daemonset方式,对k8s节点执行节点网络丢包故障注入。虽然故障注入的时候设置了排除10250、6433端口,但是执行blade destroy命令恢复的时候报错?提示访问10250端口超时,导致恢复失败。报错日志如下:time=""2024-05-09T05:55:31Z"" level=error msg=""Invoke exec command error....

问答 2023-06-12 来自:开发者社区

无法将k8s注入节点CPU故障

问题描述 [root@kube-master-192-168-131-12 ~/chaosblade-0.4.0]$ ./blade create k8s node-cpu fullload --names kube-node-192-168-131-16 --cpu-percent 80 --kubeconfig ~/.kube/config {"code":504,"success":fal....

问答 2023-04-06 来自:开发者社区

请问一下 我对k8s集群的某一个节点 执行内存满负载实验 过几分钟故障自己恢复了 但是我无法手动销毁

请问一下 我对k8s集群的某一个节点 执行内存满负载实验 过几分钟故障自己恢复了 但是我无法手动销毁实验 是怎么回事呢?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

容器服务

国内唯一 Forrester 公共云容器平台领导者象限。

+关注
相关镜像