文章 2024-01-11 来自:开发者社区

通义千问Qwen-72B-Chat基于PAI的低代码微调部署实践

1.引言通义千问-72B(Qwen-72B)是阿里云研发的通义千问大模型系列的720亿参数规模模型。Qwen-72B的预训练数据类型多样、覆盖广泛,包括大量网络文本、专业书籍、代码等。Qwen-72B-Chat是在Qwen-72B的基础上,使用对齐机制打造的基于大语言模型的AI助手。阿里云人工智能平台PAI是面向开发者和企业的机器学习/深度学习平台,提供AI开发全链路服务。快速开始(PAI-Qu....

通义千问Qwen-72B-Chat基于PAI的低代码微调部署实践
文章 2023-07-27 来自:开发者社区

快速玩转 Llama2 机器学习 PAI 最佳实践(一)低代码 Lora 微调及部署

1.前言 近期,Meta 宣布大语言模型 Llama2 开源,包含7B、13B、70B不同尺寸,分别对应70亿、130亿、700亿参数量,并在每个规格下都有专门适配对话场景的优化模型Llama-2-Chat。Llama2 可免费用于研究场景和商业用途(但月活超过7亿以上的企业需要申请),对企业和开发者来说,提供了大模型研究的最新利器。 目前,Llama-2-Chat在大多数评测指...

快速玩转 Llama2 机器学习 PAI 最佳实践(一)低代码 Lora 微调及部署

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。