问答 2023-07-31 来自:开发者社区

你好,我用机器学习PAI业务数据训练了easy_transfer的bert双塔文本匹配,约10w样?

你好,我用机器学习PAI业务数据训练了easy_transfer的bert双塔文本匹配,约10w样本,训练5个epoch,得到oss中的模型结果如下图所示,请问如何查看训练过程中的loss变化,哪个保存的checkpoint在验证集上的效果最好?也就是avg_loss和eval中的数据怎么看?

问答 2023-07-31 来自:开发者社区

机器学习PAI使用这个配置,chief和worker训练结束进程都正常退出了,但是chief和?

问题1:机器学习PAI使用这个配置,chief和worker训练结束进程都正常退出了,但是chief和worker都报了这个错误日志 ,2023-07-26 16:50:52.772911: E tensorflow/contrib/star/star_workerservice.cc:442] env->rendezvous_mgr->RecvLocalAsync failed, e...

问答 2023-07-31 来自:开发者社区

机器学习PAI使用DeepRec运行estimator分布式训练,protocol 使用star_?

机器学习PAI使用DeepRec运行estimator分布式训练,protocol 使用star_server ,tf_config:1个ps 1个chief 2个worker,其中一个worker训练正常结束,其他节点还在尝试连接该worker,进程一直不会正常退出 Seastar conn timeout for: xxx:3333, now do retry with max retry ....

问答 2023-07-30 来自:开发者社区

麻烦问一下机器学习PAI使用框架训练时有时候报这个错是什么原因?

麻烦问一下机器学习PAI使用框架训练时有时候报这个错是什么原因?tensorflow.python.framework.errors_impl.DataLossError: truncated record at 5275623

文章 2023-07-28 来自:开发者社区

快速玩转 Llama2!机器学习 PAI 最佳实践(二)—全参数微调训练

阿里云大语言模型(LLM)实战训练营火热开营中,点击报名参与前言近期,Meta 宣布大语言模型 Llama2 开源,包含7B、13B、70B不同尺寸,分别对应70亿、130亿、700亿参数量,并在每个规格下都有专门适配对话场景的优化模型Llama-2-Chat。Llama2 可免费用于研究场景和商业用途(但月活超过7亿以上的企业需要申请),对企业和开发者来说,提供了大模型研究的最新利器。目前,.....

问答 2023-07-22 来自:开发者社区

机器学习PAI 序列最大长度为25,为什么训练过程中会出现21的序列呢,是有什么配置没配吗?

问题1:机器学习PAI 序列最大长度为25,为什么训练过程中会出现21的序列呢,是有什么配置没配吗?tensorflow.python.framework.errors_impl.InvalidArgumentError: From /job:chief/replica:0/task:0:All dimensions except 2 must match. Input 1 has shape ....

问答 2023-07-22 来自:开发者社区

机器学习PAI train_input_path ,这个参数,如果我的训练数据是多个csv文件,这?

机器学习PAI train_input_path ,这个参数,如果我的训练数据是多个csv文件,这边怎么填?;逗号分隔还是直接不支持

问答 2023-07-19 来自:开发者社区

函数计算FC模型训练,有具体的文档以及操作方法吗 ?这个 模型训练 是怎么个训练方法?

函数计算FC模型训练,有具体的文档以及操作方法吗 ?这个 模型训练 是怎么个训练方法?

文章 2023-07-19 来自:开发者社区

基于分布式平台的机器学习模型训练以及上线部署方案总结

基于分布式平台的机器学习模型训练以及上线部署方案总结

基于分布式平台的机器学习模型训练以及上线部署方案总结
问答 2023-07-18 来自:开发者社区

hello能帮忙看下机器学习PAI这个问题嘛 我们这边在designer用[图像检测训练]组件(而非

hello能帮忙看下机器学习PAI这个问题嘛 我们这边在designer用[图像检测训练]组件(而非[图像检测训练(easycv)])训练了一个yolox的模型 但是尝试使用[通用图像预测]组件调起的时候 遇到了报错Segmentation fault方便帮忙排查下什么原因吗分享链接: https://pai.console.aliyun.com/?regionId=cn-shanghai&...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

人工智能平台PAI

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

+关注