使用高性能网络RDMA运行应用
在大规模的AI计算应用中,需要考虑任务间的通信效率,以充分发挥GPU算力的性能。阿里云容器计算服务 ACS(Container Compute Service)提供了低延迟、大吞吐、高弹性的高性能RDMA(Remote Direct Memory Access)网络服务。本文为您介绍如何使用高性能网络RDMA运行应用。
使用高性能网络RDMA运行应用
在大规模的AI计算应用中,需要考虑任务间的通信效率,以充分发挥GPU算力的性能。ACK One注册集群接入ACS算力后,提供了低延迟、大吞吐、高弹性的高性能RDMA(Remote Direct Memory Access)网络服务。本文为您介绍如何使用高性能网络RDMA运行应用。
基于属性标签将应用调度到高性能网络GPU型虚拟节点上
在使用GPU-HPN预留资源运行应用时,可以基于虚拟节点中的GPU属性标签,将应用调度至目标节点。本文介绍GPU-HPN虚拟节点属性标签基本信息,以及如何将应用部署和运行在指定卡型上。
云卓越架构:云上网络稳定性建设和应用稳定性治理最佳实践
一、云上网络稳定性体系建设 网络的稳定性是业务稳定性的一个基石,网络稳定性面临非常多方面的挑战,比如网源的故障导致的异常,传输链路的故障导致的异常,或者网络攻击导致的异常,如何应对网络稳定性的挑战,采用责任共担的模型,责任共担的模型好比在云上搭积木,因为在云上搭建业务,做稳定性的时候,它一定是责任共担,阿里云提供的组件好比积木的基本的组件,用户在使用云的时候,要把这些组件合理的组合在一起...
基于eRDMA部署高网络性能的bRPC应用
基于支持eRDMA能力的ECS实例部署bRPC应用,可以充分利用eRDMA提供的低延迟、高吞吐量以及低CPU占用等特性,以优化bRPC应用的数据传输效率,适用于对消息吞吐量和时延要求较高的应用场景。本文介绍如何基于支持eRDMA能力的ECS实例部署bRPC应用,并测试eRDMA对bRPC应用的性能提升效果。
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。