阿里云文档 2025-05-07

基于ACK集群的Slurm最佳实践FAQ

Slurm on ACK是以容器化的方式在ACK上部署Slurm集群的部署方案,帮助客户解决Slurm集群节点环境不统一,节点增删复杂等问题。本文提供了Slurm集群在ACK中的常见问题的排查方法以及排查思路。

阿里云文档 2025-04-27

在ACK中使用KTransformers部署DeepSeek-R1模型

KTransformers框架实现了多种LLM推理优化,进一步减少了推理阶段的显存占用,从而提高推理性能和降低GPU资源成本。本文介绍如何在阿里云容器服务 Kubernetes 版中通过KTransformers实现高效部署671B参数的DeepSeek-R1-Q4_K_M量化模型推理服务。

阿里云文档 2025-04-22

安装并使用HistoryServer组件

Ray原生Dashboard仅在集群运行时可用,集群终止后用户无法获取历史日志与监控数据。为解决此问题,本文介绍了RayCluster HistoryServer功能,其在集群运行期间实时采集节点日志并持久化存储至OSS,支持集群回收后仍可查询历史记录。

阿里云文档 2025-04-14

在ACK中安装KubeRay组件

本文将指导您在ACK托管集群Pro版上部署KubeRay Operator组件,并集成阿里云日志服务SLS与Prometheus监控,从而增强日志管理、系统可观测性及高可用性。通过Kubernetes自定义资源(CR),您可高效管理Ray集群与应用。

阿里云文档 2025-04-02

基于ACK集群的Dify组件升级指南

本文主要指导用户将ack-dify从旧版本升级至v1.0.0及以上,首先备份数据,然后通过命令提取并安装插件迁移工具至插件系统,最后验证插件功能是否正常运行,以启用新的插件生态系统。

文章 2022-10-12 来自:开发者社区

【云原生 | 从零开始学Kubernetes】十六、k8s核心技术-Deployment深入使用

Deployment深入使用Deployment 资源清单文件编写技巧Deployment 使用案例:创建一个 web 站点Deployment 管理 pod:扩容、缩容、滚动更新、回滚自定义滚动更新策略Deployment 资源清单详解Deployment 资源清单文件编写技巧查看 Deployment 资源对象由哪几部分组成[root@k8smaster node]# kubectl exp....

文章 2022-10-12 来自:开发者社区

【云原生 | 从零开始学Kubernetes】十五、k8s核心技术-Deployment 控制器

什么是Deployment 控制器·Deployment控制器可以部署无状态应用·管理Pod和ReplicaSet·部署,滚动升级等功能·应用场景:web服务,微服务Deployment表示用户对K8S集群的一次更新操作。Deployment是一个比RS( Replica Set, RS) 应用模型更广的 API 对象,可以是创建一个新的服务,更新一个新的服务,也可以是滚动升级一个服务。滚动升级....

【云原生 | 从零开始学Kubernetes】十五、k8s核心技术-Deployment 控制器
文章 2022-10-12 来自:开发者社区

【云原生 | 从零开始学Kubernetes】十四、k8s核心技术-Controller

前面我们学习了 Pod,那我们在定义 pod 资源时,可以直接创建一个 kind:Pod 类型的自主式 pod, 但是这存在一个问题,假如 pod 被删除了,那这个 pod 就不能自我恢复,就会彻底被删除,线上这种情况非常危险,所以今天就给大家讲解下 pod 的控制器,所谓控制器就是能够管理 pod,监测 pod 运行状况,当 pod 发生故障,可以自动恢复 pod。也就是说能够代我们去管理 p....

【云原生 | 从零开始学Kubernetes】十四、k8s核心技术-Controller

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

容器服务Kubernetes版更多云原生相关

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问