阿里云文档 2025-06-04

基于异构机密计算实例构建支持安全度量的大语言模型推理环境

随着大语言模型技术的普及,越来越多的企业开始尝试利用该技术来提升业务能力。因此,如何安全的管理模型及用户数据变得尤为重要,本文介绍基于异构机密计算实例构建支持安全度量大语言模型推理环境的最佳实践。

阿里云文档 2025-05-28

在GPU实例上部署Qwen3-235B-A22B

本文介绍如何在阿里云GPU实例上快速、便捷地构建Qwen3-235B-A22B的推理环境。您无需深入了解底层硬件,也无需额外配置,即可实现开箱即用。本文分别使用VLLM和SGLang作为Qwen3-235B-A22B模型的推理框架。

阿里云文档 2025-04-21

本地部署通义千问QwQ-32B模型

通义千问QwQ-32B是阿里云开源的320亿参数推理模型,通过大规模强化学习在数学推理、编程及通用任务中实现性能突破,支持消费级显卡本地部署,兼顾高效推理与低资源消耗。本文将介绍如何利用vLLM作为通义千问QwQ-32B模型的推理框架,在一台阿里云GPU实例上构建通义千问QwQ-32B的推理服务。

阿里云文档 2025-04-08

本地单机部署满血版DeepSeek模型

DeepSeek-V3/R1是一个具有超过600亿参数的专家混合(MoE)模型,且已开源其模型权重。本文将介绍如何利用SGLang作为DeepSeek模型的推理框架,在一台ebmgn8v实例上构建DeepSeek-V3/R1的推理服务。您无需进行额外配置,即可实现开箱即用。

阿里云文档 2025-03-26

通过docker run --gpus all [镜像名称]启动容器镜像时出现docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].报错

在GPU云服务器上安装Docker环境后,如果未安装NVIDIA Container Toolkit,通过docker run --gpus all [镜像名称]启动容器镜像时,可能会出现docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]]报错,本文为您介绍这...

文章 2024-03-01 来自:开发者社区

阿里云GPU服务器价格多少钱?2024年阿里云GPU服务器价格配置及性能测评

2024年阿里云GPU服务器是一款高性能的计算服务器,基于GPU应用的计算服务,多适用于视频解码、图形渲染、深度学习、科学计算等应用场景。阿里云GPU服务器具有超强的计算能力、网络性能出色、购买方式灵活、高性能实例存储等特点。 阿里云提供了多种配置的GPU服务器,包括gn6v、gn6i、vgn6i-vws和gn6e等,这些服务器配备了不同型号的GPU计算卡、不同规格的内存和存储...

问答 2022-04-05 来自:开发者社区

弹性裸金属服务器如何适用于GPU性能无损输出?

弹性裸金属服务器如何适用于GPU性能无损输出?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云服务器ECS

做技术先进、性能优异、稳如磐石的弹性计算!

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问