阿里云文档 2025-04-07

在Knative中使用GPU资源并开启共享GPU

如需在Knative中部署需要GPU资源的任务(如AI或高性能计算),您可以在Knative Service中指定GPU规格并创建GPU实例。您还可以开启共享GPU调度能力,允许多个Pod共享GPU,提升使用率。

阿里云文档 2025-03-06

如何使用GPU监控2.0监控ACK集群中的GPU资源

GPU监控2.0基于NVIDIA DCGM实现对集群GPU节点的全方位监控。本文介绍如何使用GPU监控2.0监控ACK集群中的GPU资源。

阿里云文档 2025-01-09

如何实现K8s集群以Serverless方式使用云上CPU/GPU资源

IDC中K8s集群通过Serverless方式使用阿里云弹性容器实例ECI运行业务Pod。您可以在K8s集群直接提交业务Pod,使Pod运行在ECI上,无需额外运维云上节点池,更加灵活、高效、弹性地使用云上CPU和GPU资源。本文介绍如何基于注册集群实现IDC中K8s集群以Serverless方式使用云上CPU和GPU资源。

阿里云文档 2024-11-01

在Knative中使用GPU资源并开启共享GPU

如需在Knative中部署AI任务、高性能计算等需要GPU资源的工作负载,您可以在Knative Service中指定GPU规格,创建GPU实例。您也可以为节点开启共享GPU调度能力,允许多个Pod共享同一个GPU,提高GPU使用率。

文章 2024-06-11 来自:开发者社区

Serverless 应用引擎产品使用合集之函数实例运行期间相关的依赖资源(vcpu、临时磁盘、GPU)是否会随函数运行完毕而释放

问题一:在阿里函数计算里可以创建comfyui吗?怎么找不到入口安装?还有用完sd 需要停止操作吗? 在阿里函数计算里可以创建comfyui吗?怎么找不到入口安装?还有用完sd 需要停止操作吗? 参考回答: 如您暂时不需要使用Stable Diffusion应用生成图片,请及时删除对应资源。如您需要长期使用Stable Diffusion应用,请忽略此...

阿里云文档 2023-11-15

如何通过Docker或Kubernetes使用eGPU优化套件,进行GPU容器虚拟化和资源共享

本文以卷积神经网络模型ResNet50的训练和推理为例,为您介绍如何通过Docker或Kubernetes使用eGPU优化套件,进行GPU容器虚拟化和资源共享。本实践中的ResNet50模型基于NVIDIA官方开源代码DeepLearningExamples实现。

文章 2022-10-31 来自:开发者社区

Docker资源(CPU/内存/磁盘IO/GPU)限制与分配指南

什么是cgroup?cgroups其名称源自控制组群(control groups)的简写,是Linux内核的一个功能,用来限制、控制与分离一个进程组(如CPU、内存、磁盘输入输出等)。什么是Docker资源限制?默认情况下,Docker容器是没有资源限制的,它会尽可能地使用宿主机能够分配给它的资源。如果不对容器资源进行限制,容器之间就会相互影响,一些占用硬件资源较高的容器会吞噬掉所有的硬件资源....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等