文章 2024-07-29 来自:开发者社区

人工智能平台PAI使用问题之worker的events没有合并是什么原因

问题一:我的机器学习PAI序列特征就像示例一样做一个attention再进入模型,这样可以吗? 我的机器学习PAI序列特征就像示例一样做一个attention再进入模型,我现在想把所有特征进模型之前加个senet模块,比如示例中的group name:"user"是否包含下面的seq_fea 这样可以吗? ...

人工智能平台PAI使用问题之worker的events没有合并是什么原因
问答 2024-05-20 来自:开发者社区

想请教下 机器学习PAI_worker_queue 这个是干什么用的啊?

想请教下 机器学习PAI_worker_queue 这个是干什么用的啊?pai.data.WorkQueue()shuffle worker queue?对这里不太熟悉~

问答 2024-05-03 来自:开发者社区

机器学习PAI logview的stdErr打不开,看不到什么报错其中一个worker失败了为什么?

机器学习PAI logview的stdErr打不开,看不到什么报错,其中一个worker失败了?

文章 2024-03-27 来自:开发者社区

机器学习PAI常见问题之多worker卡会报错如何解决

问题一:机器学习PAI为啥这个多worker多卡会报错? 机器学习PAI为啥这个多worker多卡会报错? 参考回答: 从你提供的图片中,我看到了一些关于PAI(阿里云的机器学习平台)的错误信息。为...

机器学习PAI常见问题之多worker卡会报错如何解决
问答 2024-03-26 来自:开发者社区

机器学习PAI遇到一只问题,worker0 完成后,这种可能什么问题啊?

"机器学习PAI遇到一个问题,worker0 完成后,其他几个worker一直报 [INFO] [77#215] [tensorflow/core/distributed_runtime/master.cc:172] CreateSession still waiting for response from worker: /job:worker/replica:0/task:0这种可能有什么问....

问答 2024-01-21 来自:开发者社区

机器学习PAI为啥这个多worker多卡会报错?

机器学习PAI为啥这个多worker多卡会报错?

问答 2024-01-04 来自:开发者社区

请教下机器学习PAI,训练如果想用3个worker是不是就要配4个worker?

请教下机器学习PAI,node1如果只做eval,训练如果想用3个worker是不是就要配4个worker?我看现在node1好像只做eval?

问答 2024-01-04 来自:开发者社区

想问下机器学习PAI我几个worker的events最后没有合并到一起~这是什么原因导致的啊?

想问下机器学习PAI我几个worker的events最后没有合并到一起~这是什么原因导致的啊?

问答 2023-11-12 来自:开发者社区

机器学习PAI我们用了分布式训练(4个Worker),比单机(1个Worker),麻烦帮忙看下?

机器学习PAI我们用了分布式训练(4个Worker),比单机(1个Worker),用PAI-TF进行训练,时间上看分布式训练和单机训练是一样的(甚至还慢一些)。麻烦帮忙看下?

问答 2023-07-31 来自:开发者社区

机器学习PAI使用这个配置,chief和worker训练结束进程都正常退出了,但是chief和?

问题1:机器学习PAI使用这个配置,chief和worker训练结束进程都正常退出了,但是chief和worker都报了这个错误日志 ,2023-07-26 16:50:52.772911: E tensorflow/contrib/star/star_workerservice.cc:442] env->rendezvous_mgr->RecvLocalAsync failed, e...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

人工智能平台PAI

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等