阿里云文档 2025-05-07

基于ACK集群的Slurm最佳实践FAQ

Slurm on ACK是以容器化的方式在ACK上部署Slurm集群的部署方案,帮助客户解决Slurm集群节点环境不统一,节点增删复杂等问题。本文提供了Slurm集群在ACK中的常见问题的排查方法以及排查思路。

阿里云文档 2025-04-27

在ACK中使用KTransformers部署DeepSeek-R1模型

KTransformers框架实现了多种LLM推理优化,进一步减少了推理阶段的显存占用,从而提高推理性能和降低GPU资源成本。本文介绍如何在阿里云容器服务 Kubernetes 版中通过KTransformers实现高效部署671B参数的DeepSeek-R1-Q4_K_M量化模型推理服务。

阿里云文档 2025-04-22

安装并使用HistoryServer组件

Ray原生Dashboard仅在集群运行时可用,集群终止后用户无法获取历史日志与监控数据。为解决此问题,本文介绍了RayCluster HistoryServer功能,其在集群运行期间实时采集节点日志并持久化存储至OSS,支持集群回收后仍可查询历史记录。

阿里云文档 2025-04-14

在ACK中安装KubeRay组件

本文将指导您在ACK托管集群Pro版上部署KubeRay Operator组件,并集成阿里云日志服务SLS与Prometheus监控,从而增强日志管理、系统可观测性及高可用性。通过Kubernetes自定义资源(CR),您可高效管理Ray集群与应用。

阿里云文档 2025-04-02

基于ACK集群的Dify组件升级指南

本文主要指导用户将ack-dify从旧版本升级至v1.0.0及以上,首先备份数据,然后通过命令提取并安装插件迁移工具至插件系统,最后验证插件功能是否正常运行,以启用新的插件生态系统。

文章 2022-01-12 来自:开发者社区

阿里云数字新基建系列:云原生操作系统Kubernetes-第1章(4)

1.4 集群系统层       集群系统层是指Kubernetes 及其组件,比如网络组件CNI、存储插件FlexVolume 等。这部分内容,实际上是大部分工程师学习Kubernetes 的起点,也是工程师相对比较熟悉的一部分内容。       为了适配云环境,以及支持百万级线上集群稳定运行,阿里云三种版本Kubernetes 集群的....

阿里云数字新基建系列:云原生操作系统Kubernetes-第1章(4)
文章 2022-01-12 来自:开发者社区

阿里云数字新基建系列:云原生操作系统Kubernetes-第1章(3)

1.3 单机系统层       单机系统层主要有两部分内容,分别是操作系统和容器运行时。从理论上来说,这两者的组合可以有很多变化,如CentOS 和Docker,Windows 和Docker 等。阿里云单机系统层主要支持CentOS 和Windows 两种操作系统,以及Docker 和安全沙箱两种容器运行时。Kubernetes 集群单机系统层结构如图1-5所示。....

阿里云数字新基建系列:云原生操作系统Kubernetes-第1章(3)
文章 2022-01-12 来自:开发者社区

阿里云数字新基建系列:云原生操作系统Kubernetes-第1章(2)

1.2 云资源层       云资源层和云上Kubernetes 之间的关系,相当于计算机硬件与操作系统之间的关系。云资源层为Kubernetes 提供了有弹性优势的软硬件基础,如云服务器、安全组、专有网络、负载均衡、资源编排等。       从本质上来说,Kubernetes 本身并不提供任何计算、网络或存储资源,它仅仅是这些底层资源....

阿里云数字新基建系列:云原生操作系统Kubernetes-第1章(2)
文章 2022-01-07 来自:开发者社区

阿里云数字新基建系列:云原生操作系统Kubernetes-第1章(1)

第1章 鸟瞰云上Kubernetes       云原生本质上是一套让用户用好云的技术栈。从目前的发展情况来看,Kubernetes on Cloud是这套技术栈的主框架。这里的Kubernetes on Cloud,说的是各个云厂商基于自己的云产品和开源Kubernetes软件实现的容器集群产品。       这些容器集群产品,以云服....

阿里云数字新基建系列:云原生操作系统Kubernetes-第1章(1)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注