文章 2024-10-12 来自:开发者社区

多智能体微调实践:α-UMi 开源

01 背景 近年来,为了加强大型语言模型(Large-Language Models, LLM)实时信息处理、解决专业问题的能力,催生了工具调用智能体(Tool Integrated Agent)概念,该方向旨在让LLM智能地决定何时及如何利用外部工具解决复杂问题。目前工具调用智能体的研究不仅限于闭源LLM如GPT-4,还聚焦于通过在工具使用数据集上微调开源LLM,开发可定制化工...

多智能体微调实践:α-UMi 开源
文章 2024-05-29 来自:开发者社区

LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent!

LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent! SWIFT支持了开源模型,尤其是中小型模型(7B、14B等)对Agent场景的训练,并将loss-scale技术应用到agent训练中,使中小模型API Call能力更稳定,并支持使用单张商业级显卡进行Agent推理和部署,可以直接在生产场景中全链路闭环落地使用。 1.环境安装 #设置pi...

LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent!
文章 2024-05-27 来自:开发者社区

B端Agent的机会,不在于“助手”,而在基于垂直领域的任务式Agent微调

Coze、钉钉的Ai助理吸引了无数眼球,但是角色扮演的助理Agent落地一直很一般。同时“助理”型服务无法满足B端的实际业务场景,因为在B端工作中,特别是在客服场景下,十分强调回复准确性、稳定性,以及按照要求来执行具体的任务,解决实际业务问题。而相比助理Agent,通过对Agent框架的微调,在客服领域的表现完全强于coze、钉钉,更能落地在企业业务流程中。 “助手”Agent模式特点 ...

B端Agent的机会,不在于“助手”,而在基于垂直领域的任务式Agent微调
文章 2024-05-14 来自:开发者社区

专业智能体指导让小模型学会数学推理!微调Mistral-7B实现86.81%准确率

最近,一项名为Orca-Math的研究引起了广泛关注,该研究展示了如何使用小语言模型(SLM)解决小学数学问题。数学问题解决一直被认为是一项复杂的任务,对于SLM来说尤其具有挑战性。然而,Orca-Math通过使用一种创新的方法,成功地将一个只有70亿参数的SLM在GSM8K基准测试上的准确率提高到...

文章 2024-04-25 来自:开发者社区

Llama3 中文通用Agent微调模型来啦!(附手把手微调实战教程)

前言 Llama3模型在4月18日公布后,国内开发者对Llama3模型进行了很多训练和适配,除了中文纯文本模型外,多模态版本也陆续在发布中。考虑到国内用户对Agent场景的需求,魔搭社区LLM&AIGC模型微调推理框架SWIFT基于Llama3-8b-instruct原始版本训练了通用中文模型,并保留且适配了中文Agent能力,这是开源社区中率先完整适配中文环境的通用A...

Llama3 中文通用Agent微调模型来啦!(附手把手微调实战教程)
文章 2024-03-19 来自:开发者社区

用消费级显卡微调属于自己的Agent

本文为魔搭社区轻量级训练推理工具SWIFT微调实战教程系列 SWIFT支持了开源模型,尤其是中小型模型(7B、14B等)对Agent场景的训练,并将loss-scale技术应用到agent训练中,使中小模型API Call能力更稳定,并支持使用单张商业级显卡进行Agent推理和部署,可以直接在生产场景中全链路闭环落地使用。 接下来进入手把手Agent微调实操:...

用消费级显卡微调属于自己的Agent
问答 2024-02-13 来自:开发者社区

ModelScope中,使用Qwen7b 训练modelscope-agent 微调的出现问题了吗?

ModelScope中,使用Qwen7b 训练modelscope-agent 微调的出现问题了吗?

文章 2023-12-21 来自:开发者社区

视觉Agent来了!智谱AI开源CogAgent,支持GUI图形界面问答(附魔搭推理微调最佳实践)

序言近日,智谱AI开源了VLM领域的最新工作 CogAgent。Github:https://github.com/THUDM/CogVLM论文:https://arxiv.org/abs/2312.08914CogAgent 是基于CogVLM改进的模型,是一个擅长于GUI理解和导航的180亿参数规模的视觉语言模型,CogAgent-18B 拥有110亿视觉参数和70亿语言参数。CogAgen....

视觉Agent来了!智谱AI开源CogAgent,支持GUI图形界面问答(附魔搭推理微调最佳实践)
文章 2023-10-24 来自:开发者社区

AgentLM:智谱AI对齐Agent能力微调语言模型,模型&数据集均开源

为探索提升智能体任务之间的促进及泛化效果,智谱AI&清华KEG提出了一种对齐Agent能力的微调方法 AgentTuning,该方法使用少量数据微调已有模型,显著激发了模型的 Agent能力,同时可以保持模型原有的通用能力。10月21日,智谱AI官方宣布开源经过 Agent 对齐的语言模型(AgentLM:能打的 Agent 模型来了!7B,13B,70B 全开源),包括 AgentLM....

AgentLM:智谱AI对齐Agent能力微调语言模型,模型&数据集均开源

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

通义大模型

通义千问大模型家族全面升级更大参数规模模型首次面世,全新通义千问2.0版本欢迎体验。https://tongyi.aliyun.com/

+关注