基于ACK多机分布式部署DeepSeek满血版推理部署实战
本文深入解析基于阿里云容器服务ACK的DeepSeek-R1-671B大模型分布式推理实战方案。针对该千亿参数模型(671B)单卡显存不足的挑战,提出混合并行策略(Pipeline Parallelism=2 + Tensor Parallelism=8),结合阿里云Arena工具,实现在2台ecs.ebmgn8v.48xlarge(8*96GB)节点上的高效分布式部署。进一步演示如何将部署于AC...
如何进行SQL调优(下推更多计算和增加索引)
找出需调优的慢SQL后,先通过EXPLAIN查看执行计划,然后通过如下方法优化SQL:下推更多计算至存储层MySQL,适当增加索引,优化执行计划。
《2023云原生实战案例集》——03 交通/物流——货拉拉 使用ACK轻松应对容器管理难题,实现精细化成本治理
客户简介货拉拉于2013年创立,成长于粤港澳大湾区,是一家从事同城/跨城货运、企业版物流 服务、搬家、零担、汽车租售及车后市场服务的互联网物流商城。客户痛点• 自建集群稳定性差:货拉拉内部运行大量微服务系统,错综复杂,对Kubernetes稳 定性要求高。自建容易出现稳定性问题,运维成本高。• IT成本治理难:IT成本治理往往需要对Kubernetes进彳了扩展。基于容器的能力构建 需要进行一些....

《2023云原生实战案例集》——03 交通/物流——龙湖千丁 基于ACK@Edge高效落地云边端一体化智慧停车业务
客户简介龙湖千丁是国内最早一批参与智慧城市、智慧社区建设的高科技企业,智慧停车是龙湖 千丁生活服务的主要场景之一。依托龙湖千丁停车云系统,千丁智能已为全国范围内自 有及托管的1000+车场的智慧停车业务提供统一的车管解决方案。客户痛点分布式边缘环境拖慢运维效率:由于客户各个车场地理位置分散,彼此网络隔离,车 场内的计算资源无法直接被公网访问,导致业务发布和问题排查需要相关人员现场处 ....

《2023云原生实战案例集》——03 交通/物流——大搜车 云上多地域高可用消息系统的构建
客户简介汽车产业互联网平台大搜车由姚军红创立于2012年12月,先后获得阿里巴巴集团、蚂蚁 金服、晨兴资本、华平投资、春华资本等机构超过12亿美元融资。2017年12月,大搜车 列入由硅谷全球数据研究机构PitchBook评选的"2017年全球新晋独角兽"名单。客户痛点目前,大搜车已经搭建起比较完整的汽车产业互联网协同生态。随着业务业务的快速发 展,大搜车遇到了一系列的问题:• 大量....

《2023云原生实战案例集》——03 交通/物流——高德 基于函数计算实现毫秒级自动扩缩容
高德是中国领先的数字地图内容、导航和位置服务解决方案提供商。自主出行是高德地 图的核心业务,涉及到用户出行相关的功能诉求,承载了高德地图APP内最大的用户流 量。自主出行核心业务中应用Node FaaS的部分场景包括主图场景页、路线规划页和 导航结束页等。客户痛点随着功能的进一步拓展,高德地图从导航工具升级为出行服务平台和生活信息服务入口, 进一步拓展了出行相关的生活信息服务场景,带....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
云原生更多实战相关
阿里云云原生
关注云原生中间件、微服务、Serverless、容器、Service Mesh等技术领域、聚焦云原生技术趋势、云原生大规模的落地实践
+关注