通义星尘微调的相关内容

文章 2024-10-12 来自：开发者社区

多智能体微调实践：α-UMi 开源

01 背景近年来，为了加强大型语言模型(Large-Language Models, LLM）实时信息处理、解决专业问题的能力，催生了工具调用智能体（Tool Integrated Agent）概念，该方向旨在让LLM智能地决定何时及如何利用外部工具解决复杂问题。目前工具调用智能体的研究不仅限于闭源LLM如GPT-4，还聚焦于通过在工具使用数据集上微调开源LLM，开发可定制化工...

文章 2024-05-29 来自：开发者社区

LLM 大模型学习必知必会系列(九)：Agent微调最佳实践，用消费级显卡训练属于自己的Agent！

LLM 大模型学习必知必会系列(九)：Agent微调最佳实践，用消费级显卡训练属于自己的Agent！ SWIFT支持了开源模型，尤其是中小型模型（7B、14B等）对Agent场景的训练，并将loss-scale技术应用到agent训练中，使中小模型API Call能力更稳定，并支持使用单张商业级显卡进行Agent推理和部署，可以直接在生产场景中全链路闭环落地使用。 1.环境安装 #设置pi...

文章 2024-05-27 来自：开发者社区

B端Agent的机会，不在于“助手”，而在基于垂直领域的任务式Agent微调

Coze、钉钉的Ai助理吸引了无数眼球，但是角色扮演的助理Agent落地一直很一般。同时“助理”型服务无法满足B端的实际业务场景，因为在B端工作中，特别是在客服场景下，十分强调回复准确性、稳定性，以及按照要求来执行具体的任务，解决实际业务问题。而相比助理Agent，通过对Agent框架的微调，在客服领域的表现完全强于coze、钉钉，更能落地在企业业务流程中。 “助手”Agent模式特点 ...

文章 2024-05-14 来自：开发者社区

专业智能体指导让小模型学会数学推理！微调Mistral-7B实现86.81%准确率

最近，一项名为Orca-Math的研究引起了广泛关注，该研究展示了如何使用小语言模型（SLM）解决小学数学问题。数学问题解决一直被认为是一项复杂的任务，对于SLM来说尤其具有挑战性。然而，Orca-Math通过使用一种创新的方法，成功地将一个只有70亿参数的SLM在GSM8K基准测试上的准确率提高到...

文章 2024-04-25 来自：开发者社区

Llama3 中文通用Agent微调模型来啦！（附手把手微调实战教程）

前言 Llama3模型在4月18日公布后，国内开发者对Llama3模型进行了很多训练和适配，除了中文纯文本模型外，多模态版本也陆续在发布中。考虑到国内用户对Agent场景的需求，魔搭社区LLM&AIGC模型微调推理框架SWIFT基于Llama3-8b-instruct原始版本训练了通用中文模型，并保留且适配了中文Agent能力，这是开源社区中率先完整适配中文环境的通用A...

文章 2024-03-19 来自：开发者社区

用消费级显卡微调属于自己的Agent

本文为魔搭社区轻量级训练推理工具SWIFT微调实战教程系列 SWIFT支持了开源模型，尤其是中小型模型（7B、14B等）对Agent场景的训练，并将loss-scale技术应用到agent训练中，使中小模型API Call能力更稳定，并支持使用单张商业级显卡进行Agent推理和部署，可以直接在生产场景中全链路闭环落地使用。接下来进入手把手Agent微调实操：...

问答 2024-02-13 来自：开发者社区

ModelScope中，使用Qwen7b 训练modelscope-agent 微调的出现问题了吗？

文章 2023-12-21 来自：开发者社区

视觉Agent来了！智谱AI开源CogAgent，支持GUI图形界面问答（附魔搭推理微调最佳实践）

序言近日，智谱AI开源了VLM领域的最新工作 CogAgent。Github：https://github.com/THUDM/CogVLM论文：https://arxiv.org/abs/2312.08914CogAgent 是基于CogVLM改进的模型，是一个擅长于GUI理解和导航的180亿参数规模的视觉语言模型，CogAgent-18B 拥有110亿视觉参数和70亿语言参数。CogAgen....

文章 2023-10-24 来自：开发者社区

AgentLM：智谱AI对齐Agent能力微调语言模型，模型&数据集均开源

为探索提升智能体任务之间的促进及泛化效果，智谱AI&清华KEG提出了一种对齐Agent能力的微调方法 AgentTuning，该方法使用少量数据微调已有模型，显著激发了模型的 Agent能力，同时可以保持模型原有的通用能力。10月21日，智谱AI官方宣布开源经过 Agent 对齐的语言模型（AgentLM：能打的 Agent 模型来了！7B，13B，70B 全开源），包括 AgentLM....