阿里云文档 2025-03-05

Llama3-8B大模型微调训练

DSW是一款交互式建模平台,适合需要定制化微调模型并追求优化效果的开发者。本文以Llama-3-8B-Instruct模型为例,为您介绍如何在DSW中对Llama3大模型进行参数微调训练,以使模型更好地理解和适应特定的任务,提高模型在指定任务上的表现和性能。

阿里云文档 2024-12-30

MLP回归的训练过程

MLP(Multilayer Perceptron,多层感知器)回归是一种基于神经网络的回归算法,主要用于解决非线性回归问题。它通过多个隐藏层将输入特征映射到输出,能够捕捉复杂的模式和关系。MLP回归的训练过程涉及前向传播、损失计算、反向传播及参数更新的多个步骤,通过这些步骤模型可以逐渐学习并优化,从而准确预测输出结果。

阿里云文档 2024-12-30

图像生成训练

图像生成训练算法提供主流的GAN模型训练功能,用于图像生成。通过对原始图片素材进行训练,支持DCGAN、WGAN-GP、LSGAN、GGAN、PGGAN和StyleGAN图像生成模型网络,可生成高质量和多样化的图像生成模型。

阿里云文档 2024-12-25

快速提交Slurm类型的DLC任务

本文为您介绍如何提交Slurm类型的训练任务。

阿里云文档 2024-12-18

使用eRDMA网络进行分布式训练

弹性RDMA(Elastic Remote Direct Memory Access,简称eRDMA)是阿里云自研的云上弹性RDMA网络。PAI通用计算资源中的部分GPU机型已支持eRDMA能力,您只需使用特定镜像提交基于这些GPU机型的DLC任务,系统将自动在容器内挂载eRDMA网卡,从而加速分布式训练过程。

问答 2024-08-16 来自:开发者社区

在机器学习PAI中,训练了一个 dssm 模型,感觉负采样没有生效,这是为什么?

在机器学习PAI中,训练了一个 dssm 模型,但是 predict 概率全是 1,感觉负采样没有生效,这是为什么?

问答 2023-11-30 来自:开发者社区

提一个机器学习PAI问题:在ODPS使用训练好的DSSM负采样版本,请问这个的主要原因是什么呢?

提一个机器学习PAI问题:在ODPS使用训练好的DSSM负采样版本,(指定保存好的.pb模型文件的路径)对比( 指定保存好的.pb模型文件 + 指定checkpoint_path )在同样的数据集上进行evaluate,效果差别非常大,请问这个的主要原因是什么呢?

问答 2023-07-16 来自:开发者社区

想问下机器学习PAI EasyRec 目前是否支持直接在训练的时候进行负采样吗?

想问下机器学习PAI EasyRec 目前是否支持直接在训练的时候进行负采样吗?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

人工智能平台PAI

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

+关注