阿里云文档 2025-02-21

基于ACK多机分布式部署DeepSeek满血版推理部署实战

本文深入解析基于阿里云容器服务ACK的DeepSeek-R1-671B大模型分布式推理实战方案。针对该千亿参数模型(671B)单卡显存不足的挑战,提出混合并行策略(Pipeline Parallelism=2 + Tensor Parallelism=8),结合阿里云Arena工具,实现在2台ecs.ebmgn8v.48xlarge(8*96GB)节点上的高效分布式部署。进一步演示如何将部署于AC...

阿里云文档 2024-12-11

如何进行SQL调优(下推更多计算和增加索引)

找出需调优的慢SQL后,先通过EXPLAIN查看执行计划,然后通过如下方法优化SQL:下推更多计算至存储层MySQL,适当增加索引,优化执行计划。

文章 2023-09-22 来自:开发者社区

云原生Istio案例实战 3

2.6 流量管理2.6.1 放开bookinfo自定义路由权限这个文件也是起到了一个路由的功能,必须先执行这个文件之后gateway路由规则才可以自定义执行destination-rule-all.yamlkubectl apply -f destination-rule-all.yaml -n bookinfo-ns查看kubectl get DestinationRule -n bookin....

云原生Istio案例实战 3
文章 2023-09-22 来自:开发者社区

云原生Istio案例实战 2

2.3 启动bookinfo进入istio安装目录:/home/tools/istio-1.0.6/samples/bookinfo/platform/kube找到bookinfo.yaml文件查看需要的image个数:cat bookinfo.yaml | grep image: 里面就是bookinfo案例所需要依赖的镜像地址执行命令kubectl apply -f bookinfo.ya.....

云原生Istio案例实战 2
文章 2023-09-22 来自:开发者社区

云原生Istio案例实战 1

1 Istio监控功能1.1 prometheus和grafanaPrometheus存储服务的监控数据,数据来自于istio组件mixer上报Grafana开源数据可视化工具,展示Prometheus收集到的监控数据istio已经默认帮我们把grafana和prometheus已经默认部署好了(1)执行命令查看istio自带的组件kubectl get pods -n istio-ns我们打开....

云原生Istio案例实战 1

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云云原生

关注云原生中间件、微服务、Serverless、容器、Service Mesh等技术领域、聚焦云原生技术趋势、云原生大规模的落地实践

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等