阿里云文档 2025-04-08

基于ACK多机分布式部署DeepSeek满血版推理部署实战

本文深入解析基于阿里云容器服务ACK的DeepSeek-R1-671B大模型分布式推理实战方案。针对该千亿参数模型(671B)单卡显存不足的挑战,提出混合并行策略(Pipeline Parallelism=2 + Tensor Parallelism=8),结合阿里云Arena工具,实现在2台ecs.ebmgn8v.48xlarge(8*96GB)节点上的高效分布式部署。进一步演示如何将部署于AC...

文章 2022-07-12 来自:开发者社区

企业级运维之云原生与Kubernetes实战课程 - 第三章第3讲 集群创建Pod的过程

企业级运维之云原生与Kubernetes实战课程第三章第3讲 集群创建Pod的过程  视频地址:https://developer.aliyun.com/learning/course/913/detail/14556 本讲目录: 控制器模型集群架构Pod创建过程  一、控制器模型 1.  控制器Controller....

企业级运维之云原生与Kubernetes实战课程 - 第三章第3讲 集群创建Pod的过程
文章 2022-07-12 来自:开发者社区

企业级运维之云原生与Kubernetes实战课程 第三章第2讲 深入剖析linux容器&Pod(下)

企业级运维之云原生与Kubernetes实战课程第三章第2讲 深入剖析linux容器&Pod(下) 视频地址:https://developer.aliyun.com/learning/course/913/detail/14555  三、资源限制(cgroup) 1.  控制器组(cgroup) cgroup是Linux co....

企业级运维之云原生与Kubernetes实战课程 第三章第2讲 深入剖析linux容器&Pod(下)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问