阿里云文档 2025-07-11

配置EAS服务使用GPU共享功能

在您使用专属资源组或灵骏智算资源配额部署服务时,EAS提供了GPU共享功能,以便充分利用资源。您只需在部署服务时打开GPU共享开关,系统便会在服务中部署虚拟化的GPU,EAS可以根据您配置的算力占比和使用显存来指定每个实例所需的资源。本文为您介绍如何配置GPU共享功能。

阿里云文档 2025-06-27

如何配置共享GPU调度节点选卡策略

默认情况,Pod分配GPU资源的顺序为先分配完节点上的一张GPU卡,再分配其他GPU卡,避免出现GPU资源碎片。但是在有的场景中,您希望让Pod调度到节点上时,尽量分散到各个GPU卡上,避免因为某张GPU卡坏掉影响的业务过多。本文介绍如何配置共享GPU调度节点选卡策略。

阿里云文档 2025-06-11

在GPU实例上启用eRDMA实现高效数据传输

GPU实例绑定弹性RDMA网卡(ERI)后,各GPU实例间在VPC网络下可以实现RDMA直通加速互连,相比传统的RDMA,eRDMA可以提供更高效的数据传输服务,有效提升GPU实例之间的通信效率并缩短任务处理时间。本文介绍如何在GPU实例上启用eRDMA。

阿里云文档 2025-01-14

配置共享GPU调度仅共享不隔离策略

在某些场景下,您可能不需要GPU隔离模块参与共享GPU调度。例如,有些业务应用自带显存限制能力。在这种情况下,使用GPU隔离模块可能不合适。对此,共享GPU调度支持某些节点不安装GPU隔离模块的选项。本文介绍如何配置共享GPU调度仅共享不隔离策略。

阿里云文档 2024-12-10

在GPU实例的Docker环境中快速配置eRDMA提升网络性能

eRDMA(Elastic Remote Direct Memory Access)是一种高性能网络通信技术,将eRDMA功能引入容器(Docker)环境可以实现容器应用程序绕过操作系统内核直接访问主机的物理eRDMA设备,从而提供更快的数据传输和通信效率,适用于在容器中需要大规模数据传输和高性能网络通信的应用场景。本文介绍如何使用eRDMA镜像在GPU实例上快速配置eRDMA。

问答 2023-06-23 来自:开发者社区

我创建了一个使用 GPU 实例的函数,并且我把模型部署到 oss 了。我在服务配置中已经配置了 os

我创建了一个使用 GPU 实例的函数,并且我把模型部署到 oss 了。我在服务配置中已经配置了 oss 挂载点,但是在测试函数时发现函数每次加载存储在 oss 中的模型权重都会超时,然后返回 412 码。 我的 oss 和函数都部署在美东区域。 请问有什么解决思路呢?

问答 2023-06-08 来自:开发者社区

请问gpu fc函数里如果需要访问服务挂载的nas,需要单独做配置么?

请问gpu fc函数里如果需要访问服务挂载的nas,需要单独做配置么?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问