问答 2023-05-14 来自:开发者社区

在机器学习PAI里我训练2个epoch后,想再训练1个epoch,就会被叫停,为什么?

问题1:请问一下,在机器学习PAI里我训练2个epoch之后,想continue再训练1个epoch,但下1000步就会被checkpointSaverListener叫停训练是因为什么? 这是我的训练配置。没有设置num_step, 设置了num_epochs。 问题2:每次continue训练都需要删除ESTIMATOR_TRAIN_DONE这个文件吗?

问答 2023-05-14 来自:开发者社区

在机器学习PAI里训练step已经到200k了,这时候提示错误,请问可能是什么原因呢?

在机器学习PAI里训练step已经到200k了,这时候提示oss host和oss bucket不匹配,请问可能是什么原因呢?

问答 2023-05-14 来自:开发者社区

请问在机器学习PAI里AutoGraph的warning会对模型训练产生影响吗?

请问在机器学习PAI里AutoGraph的warning会对模型训练产生影响吗?

文章 2023-05-13 来自:开发者社区

物理系统执行机器学习计算,一种使用反向传播训练的深度物理神经网络

深度学习模型已成为科学和工程领域的普遍工具。然而,它们的能源需求现在越来越限制它们的可扩展性。深度学习加速器旨在高效地执行深度学习,通常针对推理阶段,并且通常通过利用传统电子设备之外的物理基板。迄今为止的方法一直无法应用反向传播算法来原位训练非常规的新型硬件。反向传播的优势使其成为事实上的大规模神经网络训练方法,因此这一缺陷构成了主要障碍。在这里,康奈尔大学的研究人员介绍了一种混合原位-计算机算....

物理系统执行机器学习计算,一种使用反向传播训练的深度物理神经网络
问答 2023-05-07 来自:开发者社区

训练的时候是没问题的,所以为什么机器学习PAI会报错?

export的时候报错AttributeError: 'module' object has no attribute 'CounterFilterOptions'https://logview.aliyun.com/logview/?h=http://service.eu-central-1.maxcompute.aliyun-inc.com/api&p=ads_fenfa_dev&am...

问答 2023-05-07 来自:开发者社区

机器学习PAI训练时如何在work节点打印auc?worker1的日志我看到只有loss。请问在哪里

机器学习PAI训练时如何在work节点打印auc?worker1的日志我看到只有loss。请问在哪里能够看到? 还是需要在config中配置下?

问答 2023-05-06 来自:开发者社区

机器学习PAI、PAI-Designer、PAI-DSW、PAI-EAS中这个图像分类训练(torc

机器学习PAI、PAI-Designer、PAI-DSW、PAI-EAS中这个图像分类训练(torch)组件文档中, 这两部分的意思,是不是如果我没有传预训练模型,就是你们的预训练模型+我的数据选择骨干模型做微调,如果我传了预训练模型,就是我的预训练模型+我的数据选择骨干模型做微调,你们预置的预训练模型失效,是不是不支持做数据增强,跑失败的组件会产生费用吗,还是只有成功计费

问答 2023-05-03 来自:开发者社区

请问下,如果我只需要一个文本分类任务的标注、训练、推理、部署,是否就不需要采购pai服务了?只用采购

请问下,如果我只需要一个文本分类任务的标注、训练、推理、部署,是否就不需要采购pai服务了?只用采购咱们nlp就行了?

问答 2023-05-02 来自:开发者社区

请问机器学习PAI在local模式下如何使用GPU训练,可以使用多个GPU吗?

请问机器学习PAI在local模式下如何使用GPU训练,可以使用多个GPU吗?

问答 2023-05-02 来自:开发者社区

用PAI easyrec里fg训练方式,遇到了报错问题,辛苦帮忙看一下吧?

你好,用PAI easyrec里fg训练方式,遇到了报错问题,fg.config和输入数据是用阿里云提供的jar包生成的,辛苦帮忙看一下吧? https://logview.aliyun.com/logview/?h=http://service.cn.maxcompute.aliyun-inc.com/api&p=yidui_rec_dev&i=2023042510080989g...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

人工智能平台PAI

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

+关注