阿里云文档 2025-05-07

基于ACK集群的Slurm最佳实践FAQ

Slurm on ACK是以容器化的方式在ACK上部署Slurm集群的部署方案,帮助客户解决Slurm集群节点环境不统一,节点增删复杂等问题。本文提供了Slurm集群在ACK中的常见问题的排查方法以及排查思路。

阿里云文档 2025-05-06

如何通过OSS SDK、ossutil工具实现OSS存储的读写分离

OSS存储卷支持多种客户端,不同客户端对写操作的支持程度不同。通常来说,完备的写操作支持会牺牲部分读性能。因此,数据的读写分离能最大程度避免写操作对读性能的影响,显著提升读多写少场景的数据访问性能。本文介绍在读多写少场景下如何通过不同的OSS存储卷客户端,或OSS SDK、ossutil工具等方式实现数据的读写分离。

阿里云文档 2025-04-25

Datapath V2下最佳实践

本文介绍在使用Terway网络插件的集群中,启用Datapath V2后如何优化集群的网络配置,例如Conntrack参数配置、Identity资源管理等,以提升集群性能和稳定性。

阿里云文档 2025-03-19

ACK Edge集群GPU资源监控最佳实践

ACK Edge集群可以纳管数据中心和边缘侧的GPU节点,统一管理多地域、多环境的异构算力。您可以在ACK Edge集群中接入阿里云Prometheus监控,使数据中心和边缘计算的GPU节点拥有与云上一致的可观测能力。

阿里云文档 2025-03-13

ACK集群成本管理最佳实践

集群成本调优旨在经济高效地利用集群资源,减少不必要的开支。为了实现集群成本调优,工作负载和集群的稳定性、可靠性以及集群运维成本三者之间的平衡,本文为您汇总了相关的最佳实践,包括如何以较低成本配置集群、使用工作负载和节点的弹性能力、实时监控集群成本等。

文章 2020-09-14 来自:开发者社区

SpringCloud 应用在 Kubernetes 上的最佳实践 — 线上发布(可回滚)

作者 | 长门 导读:本篇是《SpringCloud 应用在 Kubernetes 上的最佳实践》系列文章的第七篇,主要介绍了新功能上线时,如何尽快减少对线上用户的影响?发布系统需要提供回滚到前一个或前几个版本的能力,达到快速恢复线上业务的目的。 相关文章推荐: 《SpringCloud 应用在 Kubernetes 上的最佳实践 —— 开发篇》 《SpringCloud 应用在 Kubern.....

SpringCloud 应用在 Kubernetes 上的最佳实践 — 线上发布(可回滚)
文章 2020-07-31 来自:开发者社区

SpringCloud 应用在 Kubernetes 上的最佳实践 — 线上发布(可回滚)

通常一次应用的线上发布就表示了一次新功能的上线。在上线过程中,可能发生一些非预期的情况,如新版本软件有bug,或者功能不达预期,就会影响了线上客户的使用。 为了尽快减少对线上用户的影响,发布系统需要提供回滚到前一个或前几个版本的能力。达到快速恢复线上业务的目的。 从应用的部署变更层次来看,可以分为以下三层: 所以对应了以下的回滚场景: 回滚应用内的配置,适用于由于应用配置变更导致的问题。此时如.....

SpringCloud 应用在 Kubernetes 上的最佳实践 — 线上发布(可回滚)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等