阿里云文档 2025-02-24

以DeepSeek大语言模型介绍如何自定义部署和使用RAG服务

模型在线服务EAS(Elastic Algorithm Service)是阿里云PAI产品提供的一站式模型开发和部署平台,支持通过自定义部署方式来部署RAG服务。您可以根据自身业务需求来调整更多配置选项,从而实现更灵活的服务配置。本文将介绍如何自定义部署RAG服务,并以DeepSeek大语言模型为例,说明如何使用RAG服务和LLM服务进行知识问答。

阿里云文档 2025-02-19

大语言模型数据增强与模型蒸馏解决方案

大语言模型的训练和推理过程存在高能耗及长响应时间等问题,这些问题限制了其在资源有限场景中使用。为了解决这些问题,PAI提出了模型蒸馏功能。该功能支持将大模型知识迁移到较小模型,从而在保留大部分性能的同时,大幅降低模型的规模和对计算资源的需求,为更多的实际应用场景提供支持。本文将以通义千问2(Qwen2)大语言模型为基础,为您介绍大语言模型数据增强和蒸馏解决方案的完整开发流程。

阿里云文档 2025-01-06

大语言模型数据增强与模型蒸馏解决方案

大语言模型的训练和推理过程存在高能耗及长响应时间等问题,这些问题限制了其在资源有限场景中使用。为了解决这些问题,PAI提出了模型蒸馏功能。该功能支持将大模型知识迁移到较小模型,从而在保留大部分性能的同时,大幅降低模型的规模和对计算资源的需求,为更多的实际应用场景提供支持。本文将以通义千问2(Qwen2)大语言模型为基础,为您介绍大语言模型数据增强和蒸馏解决方案的完整开发流程。

阿里云文档 2024-11-20

通义千问2.5模型部署与微调

通义千问2.5(Qwen2.5)是阿里云研发的通义千问系列开源大模型。该系列提供Base和Instruct等多版本、多规模的开源模型,从而满足不同的计算需求。PAI已对该系列模型进行全面支持,本文以通义千问2.5-7B-Instruct模型为例为您介绍如何在Model Gallery中部署、微调和评测该系列模型(本文适用于Qwen2.5和Qwen2系列模型)。

阿里云文档 2024-08-12

LLM大语言模型数据处理-Alpaca-Cot

LLM数据处理算法提供了对数据样本进行编辑和转换、过滤低质量样本、识别和删除重复样本等功能。您可以根据实际需求组合不同的算法,从而过滤出合适的数据并生成符合要求的文本,方便为后续的LLM训练提供优质的数据。本文以开源Alpaca-Cot中的少量数据为例,为您介绍如何使用PAI提供的大模型数据处理组件,对SFT数据进行数据清洗和处理。

文章 2024-04-01 来自:开发者社区

阿里通义千问大语言模型在人工智能教育领域的应用探索

标题:阿里通义千问大语言模型在人工智能教育领域的应用探索在当今快速发展的数字时代,人工智能(AI)技术正逐渐成为教育行业的重要驱动力。作为国内领先的人工智能企业,阿里巴巴的阿里通义千问大语言模型(以下简称“千问”)在人工智能教育领域的应用探索,不仅展示了其在提高教育质量、实现个性化教育...

文章 2024-01-24 来自:开发者社区

【大模型】大语言模型前沿技术系列讲座-学习笔记1:人工智能发展史

最近参加了深蓝学院举办的 《大型语言模型前沿技术系列分享》,该系列分享以大模型(LLM)为背景,以科普、启发为目的,从最基本的Transformer开始讲起,逐步涉及一些更高阶更深入的课题,涵盖大模型基础、大模型对齐、大模型推理和大模型应用等内容。系列讲座的内容由浅入深,讲解非常细致,没有任何水分,很适合我这种NLP刚入门的小白,听了这些讲座之后感觉收获满满8.26 讲座安排(实际时长17:30....

【大模型】大语言模型前沿技术系列讲座-学习笔记1:人工智能发展史
文章 2023-12-06 来自:开发者社区

大语言模型|人工智能领域中备受关注的技术

前言(开源大语言模型)伴随着 GPT-4 Turbo发布,当下人工领域技术再一次迎来了巨大变革,这也让我们再一次将视野聚焦在人工智能这一神奇的领域之上。作为人工智能领域中备受关注的技术之一,自Chatgpt爆火至今,大语言模型一词从未淡出过我们的视野,从某种意义来说,了解大语言模型是我们进入人工智能世界的第一步。那么今天我们就来聊聊关于大语言模型~关于大语言模型大语言模型是什么?大语言模型(la....

大语言模型|人工智能领域中备受关注的技术

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐