阿里云文档 2025-04-08

基于ACK多机分布式部署DeepSeek满血版推理部署实战

本文深入解析基于阿里云容器服务ACK的DeepSeek-R1-671B大模型分布式推理实战方案。针对该千亿参数模型(671B)单卡显存不足的挑战,提出混合并行策略(Pipeline Parallelism=2 + Tensor Parallelism=8),结合阿里云Arena工具,实现在2台ecs.ebmgn8v.48xlarge(8*96GB)节点上的高效分布式部署。进一步演示如何将部署于AC...

文章 2023-01-22 来自:开发者社区

《Kubernetes在大规模场景下的service性能优化实战》电子版地址

《Kubernetes在大规模场景下的service性能优化实战》Kubernetes在大规模场景下的service性能优化实战 电子版下载地址: https://developer.aliyun.com/ebook/2175 电子书: </div>

《Kubernetes在大规模场景下的service性能优化实战》电子版地址
问答 2018-06-20 来自:开发者社区

Kubernetes在大规模场景下的service性能优化实战

华为Cloud BU - PaaSS开源组杜军在2017CNUTCon全球容器技术大会大会上做了题为《Kubernetes在大规模场景下的service性能优化实战》的分享就Kubernetes的service机制Iptables实现service负载均衡当前Iptables实现存在的问题IPVS实现service负载均衡做了深入的分析。 https://yq.aliyun.com/down...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等