阿里云文档 2025-03-05

Llama3-8B大模型微调训练

DSW是一款交互式建模平台,适合需要定制化微调模型并追求优化效果的开发者。本文以Llama-3-8B-Instruct模型为例,为您介绍如何在DSW中对Llama3大模型进行参数微调训练,以使模型更好地理解和适应特定的任务,提高模型在指定任务上的表现和性能。

阿里云文档 2024-12-30

MLP回归的训练过程

MLP(Multilayer Perceptron,多层感知器)回归是一种基于神经网络的回归算法,主要用于解决非线性回归问题。它通过多个隐藏层将输入特征映射到输出,能够捕捉复杂的模式和关系。MLP回归的训练过程涉及前向传播、损失计算、反向传播及参数更新的多个步骤,通过这些步骤模型可以逐渐学习并优化,从而准确预测输出结果。

阿里云文档 2024-12-30

图像生成训练

图像生成训练算法提供主流的GAN模型训练功能,用于图像生成。通过对原始图片素材进行训练,支持DCGAN、WGAN-GP、LSGAN、GGAN、PGGAN和StyleGAN图像生成模型网络,可生成高质量和多样化的图像生成模型。

阿里云文档 2024-12-25

快速提交Slurm类型的DLC任务

本文为您介绍如何提交Slurm类型的训练任务。

阿里云文档 2024-12-18

使用eRDMA网络进行分布式训练

弹性RDMA(Elastic Remote Direct Memory Access,简称eRDMA)是阿里云自研的云上弹性RDMA网络。PAI通用计算资源中的部分GPU机型已支持eRDMA能力,您只需使用特定镜像提交基于这些GPU机型的DLC任务,系统将自动在容器内挂载eRDMA网卡,从而加速分布式训练过程。

问答 2024-08-07 来自:开发者社区

在机器学习PAI如果同一个特征离线训练用的和在线推理用,来源不一样,可以配置出来吗?

在机器学习PAI如果同一个特征离线训练用的和在线推理用,来源不一样,可以配置出来吗?

文章 2024-06-11 来自:开发者社区

人工智能平台PAI产品使用合集之只进行训练(train)而不进行评估(eval)该如何配置

问题一:机器学习PAI dlc上用v2也不得行? 机器学习PAI dlc上用v2也不得行? 参考回答: OdpsInputV2 是只支持 mc 上的。现在用 dlc 的话,还是只能用 OdpsInp...

人工智能平台PAI产品使用合集之只进行训练(train)而不进行评估(eval)该如何配置
问答 2023-11-05 来自:开发者社区

机器学习PAI训练文件配置,一个合并好的csv文件和几十个小的csv文件,在训练上会有差异吗?

机器学习PAI训练文件配置,一个合并好的csv文件和几十个小的csv文件,在训练上会有差异吗?

问答 2023-10-29 来自:开发者社区

机器学习PAI如果我想训练评估后直接导出,应该改哪个配置呢?如何让chief导出呢?我该改哪里啊?

机器学习PAI如果我想训练评估后直接导出,应该改哪个配置呢?如何让chief导出呢?我该改哪里啊?

问答 2023-07-22 来自:开发者社区

机器学习PAI 序列最大长度为25,为什么训练过程中会出现21的序列呢,是有什么配置没配吗?

问题1:机器学习PAI 序列最大长度为25,为什么训练过程中会出现21的序列呢,是有什么配置没配吗?tensorflow.python.framework.errors_impl.InvalidArgumentError: From /job:chief/replica:0/task:0:All dimensions except 2 must match. Input 1 has shape ....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

人工智能平台PAI

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

+关注