基于ACK多机分布式部署DeepSeek满血版推理部署实战
本文深入解析基于阿里云容器服务ACK的DeepSeek-R1-671B大模型分布式推理实战方案。针对该千亿参数模型(671B)单卡显存不足的挑战,提出混合并行策略(Pipeline Parallelism=2 + Tensor Parallelism=8),结合阿里云Arena工具,实现在2台ecs.ebmgn8v.48xlarge(8*96GB)节点上的高效分布式部署。进一步演示如何将部署于AC...
如何进行SQL调优(下推更多计算和增加索引)
找出需调优的慢SQL后,先通过EXPLAIN查看执行计划,然后通过如下方法优化SQL:下推更多计算至存储层MySQL,适当增加索引,优化执行计划。
云原生Istio案例实战 3
2.6 流量管理2.6.1 放开bookinfo自定义路由权限这个文件也是起到了一个路由的功能,必须先执行这个文件之后gateway路由规则才可以自定义执行destination-rule-all.yamlkubectl apply -f destination-rule-all.yaml -n bookinfo-ns查看kubectl get DestinationRule -n bookin....

云原生Istio案例实战 2
2.3 启动bookinfo进入istio安装目录:/home/tools/istio-1.0.6/samples/bookinfo/platform/kube找到bookinfo.yaml文件查看需要的image个数:cat bookinfo.yaml | grep image: 里面就是bookinfo案例所需要依赖的镜像地址执行命令kubectl apply -f bookinfo.ya.....

云原生Istio案例实战 1
1 Istio监控功能1.1 prometheus和grafanaPrometheus存储服务的监控数据,数据来自于istio组件mixer上报Grafana开源数据可视化工具,展示Prometheus收集到的监控数据istio已经默认帮我们把grafana和prometheus已经默认部署好了(1)执行命令查看istio自带的组件kubectl get pods -n istio-ns我们打开....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
云原生更多实战相关
阿里云云原生
关注云原生中间件、微服务、Serverless、容器、Service Mesh等技术领域、聚焦云原生技术趋势、云原生大规模的落地实践
+关注