阿里云文档 2025-03-05

Llama3-8B大模型微调训练

DSW是一款交互式建模平台,适合需要定制化微调模型并追求优化效果的开发者。本文以Llama-3-8B-Instruct模型为例,为您介绍如何在DSW中对Llama3大模型进行参数微调训练,以使模型更好地理解和适应特定的任务,提高模型在指定任务上的表现和性能。

阿里云文档 2024-12-30

MLP回归的训练过程

MLP(Multilayer Perceptron,多层感知器)回归是一种基于神经网络的回归算法,主要用于解决非线性回归问题。它通过多个隐藏层将输入特征映射到输出,能够捕捉复杂的模式和关系。MLP回归的训练过程涉及前向传播、损失计算、反向传播及参数更新的多个步骤,通过这些步骤模型可以逐渐学习并优化,从而准确预测输出结果。

阿里云文档 2024-12-30

图像生成训练

图像生成训练算法提供主流的GAN模型训练功能,用于图像生成。通过对原始图片素材进行训练,支持DCGAN、WGAN-GP、LSGAN、GGAN、PGGAN和StyleGAN图像生成模型网络,可生成高质量和多样化的图像生成模型。

阿里云文档 2024-12-25

快速提交Slurm类型的DLC任务

本文为您介绍如何提交Slurm类型的训练任务。

阿里云文档 2024-12-18

使用eRDMA网络进行分布式训练

弹性RDMA(Elastic Remote Direct Memory Access,简称eRDMA)是阿里云自研的云上弹性RDMA网络。PAI通用计算资源中的部分GPU机型已支持eRDMA能力,您只需使用特定镜像提交基于这些GPU机型的DLC任务,系统将自动在容器内挂载eRDMA网卡,从而加速分布式训练过程。

问答 2023-12-05 来自:开发者社区

抛一个机器学习PAI问题:假设每条训练样本有数量不等的一些兴趣tags,是我miss了哪一个地方吗?

抛一个机器学习PAI问题:假设每条训练样本有数量不等的一些兴趣tags,例如A样本有"电影 | 电视剧",B样本有"书籍 | 电视剧 | 汽车 | 新闻"。easyrec提供了TagFeature来parse这样的输入特征,但是parse后A样本有2个tag embedding向量,B样本有4个tag embedding向量,理想情况下应该有个mean或者max的pooling来合一,但是我读了....

问答 2023-11-30 来自:开发者社区

机器学习PAI我配置了负采样表,但是不知道在训练样本里label_fields该怎么设置?

机器学习PAI我们场景里,目前只有用户的搜索的指定类型的数据,没有负样本,所以我们的训练样本标签都为1,预备从负采样表中采样负样本作为0。我配置了负采样表,但是不知道在训练样本里label_fields该怎么设置?

问答 2023-11-05 来自:开发者社区

机器学习PAI 训练的时候可以给样本加上sample_weight吗?

机器学习PAI 训练的时候可以给样本加上sample_weight吗? 我想给正样本权重高一些

问答 2022-06-13 来自:开发者社区

传统的全量多轮迭代的机器学习算法为什么不太适合万亿规模的训练样本?

传统的全量多轮迭代的机器学习算法为什么不太适合万亿规模的训练样本?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

人工智能平台PAI

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

+关注