阿里云文档 2025-03-21

微调DeepSeek-R1

DeepSeek-R1是由深度求索公司推出的首款推理模型,该模型在数学、代码和推理任务上的表现优异。深度求索不仅开源了DeepSeek-R1模型,还发布了从DeepSeek-R1基于Llama和Qwen蒸馏而来的六个密集模型,在各项基准测试中均表现出色。本文以蒸馏模型DeepSeek-R1-Distill-Qwen-7B为例,为您介绍如何微调该系列模型。

阿里云文档 2025-03-19

使用GA实现PAI-DSW跨域加速拉取海外模型或容器镜像

当您使用海外容器镜像(如:docker.io镜像)创建交互式建模 PAI-DSW实例,或者在PAI-DSW实例中拉取海外模型时(如:huggingface.co模型),可能由于网络跨域的原因无法正常访问,为解决此问题,您可以创建全球加速GA(Global Accelerator)实例,使用其提供的覆盖全球的网络加速服务,使PAI-DSW具备跨域获取模型和镜像的网络访问能力。

阿里云文档 2025-03-19

DSW跨域拉取海外模型或容器镜像

当您使用海外容器镜像(如:docker.io镜像)创建DSW实例,或者在DSW实例中拉取海外模型时(如:huggingface.co模型),可能由于网络跨域的原因无法正常访问,为解决此问题,您可以创建全球加速GA(Global Accelerator)实例,使用其提供的覆盖全球的网络加速服务,使DSW具备跨域获取模型和镜像的网络访问能力。

阿里云文档 2025-03-19

部署DeepSeek-V3、DeepSeek-R1模型

DeepSeek-V3是由深度求索公司推出的一款拥有6710亿参数的专家混合(MoE)大语言模型,DeepSeek-R1是基于DeepSeek-V3-Base训练的高性能推理模型。Model Gallery提供了标准部署和多种加速部署方式,帮助您一键部署DeepSeek-V3和DeepSeek-R1...

阿里云文档 2025-02-24

PAI部署模型接入AI网关

本文主要介绍如何通过AI网关访问部署在人工智能平台PAI的模型。

文章 2024-07-16 来自:开发者社区

带你读《阿里云产品五月刊》——一、PAI+Llama Factory低代码微调Llama3模型

LLaMA Factory是一款开源低代码大模型微调框架,集成了业界广泛使用的微调技术,支持通过Web UI界面零代码微调大模型。本教程将基于Meta AI开源的LlaMA 3 8B模型,介绍如何使用PAI平台及LLaMA Factory训练框架完成模型的中文化与角色扮演微调和评估。 准备环境和资源 ∙ 创建工作空间,具体操作,请参见创建工作空间。 ∙ 创建DSW实例,其...

带你读《阿里云产品五月刊》——一、PAI+Llama Factory低代码微调Llama3模型
问答 2024-06-22 来自:开发者社区

阿里云机器学习团队在Transformer模型方面有什么新的进展?

阿里云机器学习团队在Transformer模型方面有什么新的进展?

文章 2024-01-25 来自:开发者社区

在阿里云机器学习平台上布置一个PyTorch模型

在阿里云机器学习平台上布置一个PyTorch模型,可以使用两种主要方法:通过PAI Python SDK直接提交训练作业,或者使用PAI-Blade的SDK部署优化后的模型推理。 如果您要选择PAI Python SDK,您需要先安装SDK,并配置好访问密钥(AccessKey),以及...

问答 2023-12-27 来自:开发者社区

ModelScope用阿里云pai部署模型,模型选不到社区公开的模型,要怎么弄呢?

ModelScope用阿里云pai部署模型,模型选不到社区公开的模型,要怎么弄呢?现在准备clone成自己的模型去一键部署,不知道可行不

文章 2023-12-22 来自:开发者社区

阿里云PAI-EAS:一键部署通义千问模型的理想平台

随着人工智能技术的飞速发展,大语言模型已经成为了AI领域的研究热点。阿里云研发的通义千问大模型系列,尤其是70亿参数规模的Qwen-7B模型,展示了强大的语言理解和生成能力。然而,对于大多数开发者和企业来说,如何高效部署和应用这样的大模型仍然是一个挑战。幸运的是,阿里云模型在线服务(PAI-EAS&...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

人工智能平台PAI

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

+关注