文章 2024-07-11 来自:开发者社区

介绍一个大语言模型的微调框架Swift | AIGC

介绍一个大语言模型的微调框架Swift 一、什么微调finetune 在大语言模型中,微调(Fine-tuning)是一种重要的技术,用于提升模型在特定任务或领域上的性能。微调(Fine-tuning)是指在已经预训练好的大语言模型基础上,使用特定领域或任务的数据集进行进一步的训练,使模型能够更好地适应并完成该领域或任务的具体要求。预训练的大语言模型通常在大规模通用语料库上进行训练,学习了语...

介绍一个大语言模型的微调框架Swift | AIGC
问答 2024-04-16 来自:开发者社区

modelscope微调后模型量化的时候, swift是源码部署的报错怎么处理?

"modelscope微调后模型量化的时候,用qwen1half-14b-chat-awq 微调的 swift是源码部署的报错怎么处理?,用这个:CUDA_VISIBLE_DEVICES=0 swift export \ --ckpt_dir 'output/qwen1half-4b-chat/vx-xxx/checkpoint-xxx' \ --merge_lora true...

问答 2024-03-18 来自:开发者社区

ModelScope中,没看到全参微调的例子,swift是不支持吗?

ModelScope中,没看到全参微调的例子,swift是不支持吗?

问答 2024-01-22 来自:开发者社区

yi-34b-chat的ModelScope mp Lora微调代码Swift有发布吗?

yi-34b-chat的ModelScope mp Lora微调代码Swift有发布吗?

问答 2024-01-16 来自:开发者社区

modelscope qwen-7b微调swift项目文件里有更新qalora 微调方式吗?

modelscope qwen-7b微调swift项目文件里有更新qalora 微调方式吗?

问答 2023-11-29 来自:开发者社区

在ModelScope中,微调使用的是swift吗,

微调使用的是swift吗,我使用 --merge_lora_and_save true 把权重合并了这是微调的脚本:nproc_per_node=2 PYTHONPATH=../../.. \CUDA_VISIBLE_DEVICES=0,1 \torchrun \ --nproc_per_node=$nproc_per_node \ --master_port 29500 \ ...

问答 2023-10-30 来自:开发者社区

Modelscope进行微调的代码swift里面如何使用本地数据集,我看示例里面都是使用hf的数据集

Modelscope进行微调的代码swift里面如何使用本地数据集,我看示例里面都是使用hf的数据集

问答 2023-10-18 来自:开发者社区

modelscope源码是微调是全量微调,最新的swift可以选择lora微调和qlora是吧?

ModelScope中,modelscope源码是微调是全量微调,最新的swift可以选择lora微调和qlora是吧?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

开发与运维

集结各类场景实战经验,助你开发运维畅行无忧

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问