阿里云文档 2025-04-27

通义千问2.5模型部署与微调

通义千问2.5(Qwen2.5)是阿里云研发的通义千问系列开源大模型。该系列提供Base和Instruct等多版本、多规模的开源模型,从而满足不同的计算需求。PAI已对该系列模型进行全面支持,本文以通义千问2.5-7B-Instruct模型为例为您介绍如何在Model Gallery中部署、微调和评测该系列模型(本文适用于Qwen2.5和Qwen2系列模型)。

阿里云文档 2025-03-21

微调DeepSeek-R1

DeepSeek-R1是由深度求索公司推出的首款推理模型,该模型在数学、代码和推理任务上的表现优异。深度求索不仅开源了DeepSeek-R1模型,还发布了从DeepSeek-R1基于Llama和Qwen蒸馏而来的六个密集模型,在各项基准测试中均表现出色。本文以蒸馏模型DeepSeek-R1-Distill-Qwen-7B为例,为您介绍如何微调该系列模型。

阿里云文档 2025-03-05

使用LLaMA Factory微调LlaMA 3模型

LLaMA Factory是一款开源低代码大模型微调框架,集成了业界广泛使用的微调技术,支持通过Web UI界面零代码微调大模型。本教程将基于Meta AI开源的LlaMA 3 8B模型,介绍如何使用PAI平台及LLaMA Factory训练框架完成模型的中文化与角色扮演微调和评估。

阿里云文档 2025-01-15

微调、部署并实现Llama-3.1模型的高效推理

阿里云PAI灵骏智算服务是面向大规模深度学习场景的智算产品,提供一站式的异构计算资源和AI工程化平台。本方案将为您介绍如何使用阿里云PAI灵骏智算服务,以及基于Meta-Llama-3.1-8B的开源模型和Megatron的训练流程,进行模型微调、离线推理验证,并实现在线服务部署。

文章 2024-12-13 来自:开发者社区

技术实践 | 使用 PAI+LLaMA Factory 微调 Qwen2-VL 模型快速搭建专业领域知识问答机器人

一、方案概述 Qwen2-VL具备高级图像和视频理解能力,能够处理不同分辨率和长宽比的图片,实时分析动态视频内容。同时,它还支持多种语言,包括英文、中文以及大多数欧洲语言、日语、韩语、阿拉伯语、越南语等,适用于多模态应用开发。 Qwen2-VL系列模型通过扩展模型大小(如2B、7B、72B参数)和训...

技术实践 | 使用 PAI+LLaMA Factory 微调 Qwen2-VL 模型快速搭建专业领域知识问答机器人
文章 2024-09-27 来自:开发者社区

使用PAI+LLaMA Factory 微调 Qwen2-VL 模型,搭建文旅领域知识问答机器人

教程简述 阿里云人工智能平台 PAI 是 AI Native 的大模型与 AIGC 工程平台,覆盖 AI 开发全链路,为用户提供高性能、高稳定的大模型工程化能力。 LLaMA Factory 是一款开源低代码大模型微调框架,集成了百余种开源大模型的高效微调,至今已在 Github 社区获得超过 3 万个 star,成为了社区最受欢迎的微调框架之一。 LLaMA Facto...

使用PAI+LLaMA Factory 微调 Qwen2-VL 模型,搭建文旅领域知识问答机器人
阿里云文档 2024-08-28

面向NL2BI的大模型微调最佳实践

本文以Qwen系列大模型为例,介绍如何在人工智能平台PAI上构建从训练数据生成、模型微调训练到服务部署和调用的NL2BI全链路解决方案。

文章 2024-07-23 来自:开发者社区

使用PAI×LLaMA Factory 微调 Llama3 模型

活动地址:https://developer.aliyun.com/topic/llamafactory 活动时间:7月25日- 9月1日 活动任务:使用 PAI 平台及 LLaMA Factory 训练框架完成模型的中文化与角色扮演微调和评估,搭建专属“ AI 诸葛亮”问答机器人,7×24小时为你出谋划策! ...

使用PAI×LLaMA Factory 微调 Llama3 模型
文章 2024-07-16 来自:开发者社区

带你读《阿里云产品五月刊》——一、PAI+Llama Factory低代码微调Llama3模型

LLaMA Factory是一款开源低代码大模型微调框架,集成了业界广泛使用的微调技术,支持通过Web UI界面零代码微调大模型。本教程将基于Meta AI开源的LlaMA 3 8B模型,介绍如何使用PAI平台及LLaMA Factory训练框架完成模型的中文化与角色扮演微调和评估。 准备环境和资源 ∙ 创建工作空间,具体操作,请参见创建工作空间。 ∙ 创建DSW实例,其...

带你读《阿里云产品五月刊》——一、PAI+Llama Factory低代码微调Llama3模型
问答 2024-04-11 来自:开发者社区

机器学习PAI中EAS部署Bert微调模型有参考文档不,保存模型是.pth格式文件?

机器学习PAI中EAS部署Bert微调模型有参考文档不,保存模型是.pth格式文件?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等