阿里云文档 2025-04-08

基于ACK多机分布式部署DeepSeek满血版推理部署实战

本文深入解析基于阿里云容器服务ACK的DeepSeek-R1-671B大模型分布式推理实战方案。针对该千亿参数模型(671B)单卡显存不足的挑战,提出混合并行策略(Pipeline Parallelism=2 + Tensor Parallelism=8),结合阿里云Arena工具,实现在2台ecs.ebmgn8v.48xlarge(8*96GB)节点上的高效分布式部署。进一步演示如何将部署于AC...

文章 2023-09-14 来自:开发者社区

硬核!万字神文精解高并发高可用系统实战,分布式系统一致性文档

前言本文专注于分布式系统的一致性,从实例、算法、原理多方面深入浅出地讲解其中的奥妙。架构的终极奥义正是化繁为简,非精深者不能为之。对于有志于钻研技术架构、扩展行业视野的同道中人,相信本文会带给你很多思考和成长。比如:分布式能解决一切问题吗?不能,会带来更多问题!如何在物理规则下构建可扩展的系统?如何在算法的理想设计和实际应用中权衡取舍?也许并没有唯一的答案,但每有所得,皆是欢喜!高并发高可用系统....

硬核!万字神文精解高并发高可用系统实战,分布式系统一致性文档
文章 2022-02-17 来自:开发者社区

可能要用心学高并发核心编程,限流原理与实战,分布式令牌桶限流

  实战:分布式令牌桶限流  本节介绍的分布式令牌桶限流通过Lua+Java结合完成,首先在Lua脚本中完成限流的计算,然后在Java代码中进行组织和调用。  分布式令牌桶限流Lua脚本  分布式令牌桶限流Lua脚本的核心逻辑和Java令牌桶的执行逻辑类似,只是限流计算相关的统计和时间数据存放于Redis中。  这里将限流的脚本命名为rate_limiter.lua,该脚本既使用Redis存储令....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云分布式应用服务

企业级分布式应用服务 EDAS(Enterprise Distributed Application Service)是应用全生命周期管理和监控的一站式PaaS平台,支持部署于 Kubernetes/ECS,无侵入支持Java/Go/Python/PHP/.NetCore 等多语言应用的发布运行和服务治理 ,Java支持Spring Cloud、Apache Dubbo近五年所有版本,多语言应用一键开启Service Mesh。

+关注