问答 2024-08-26 来自:开发者社区

在机器学习PAI中,负采样的 item 也是不一样的吧?

在机器学习PAI中,使用 hard_negative_sampler_v2 , batch_size = 512, num_sample = 40, 负采样期望排除掉用户交互过的 item 和 batch 内的 item; 这个时候负采样出来的 item 个数应该为 512 40, 然后 reshape 成 batch_size 40, 而不是把负采样出来 512 个 item 截断到 40...

问答 2024-07-31 来自:开发者社区

机器学习PAI给的dssm 负采样的demo中 模型结构是双塔,输出N个候选item的概率吗?

机器学习PAI给的dssm 负采样的demo中 模型结构是双塔,loss 是softmax_Cross_entropy, 是双塔算内积,输出N个候选item的概率吗?然后为啥建议使用inner product呢,常见的是cosine sim? 这块有什么考虑吗?

文章 2024-04-28 来自:开发者社区

人工智能平台PAI产品使用合集之如何配置DSSM模型负采样item表的schema

问题一:机器学习PAI odps上跑是不是默认环境是跑的py2.7? 机器学习PAI odps上跑是不是默认环境是跑的py2.7?配置文件如何指定跑py3.7的版本?PAI命令可以指定吗? 参考答案: 现在好像都是py3了。你代码还是没改,应该没什么影响吧.在config文件里,指定你的特征分隔符 关于本问题的更多回答可点击...

人工智能平台PAI产品使用合集之如何配置DSSM模型负采样item表的schema
文章 2024-04-28 来自:开发者社区

人工智能平台PAI产品使用合集之负采样版本DSSM双塔模型训练好之后,怎么分别获取user tower的embedding和item tower的embedding

问题一:机器学习PAI ODPS默认是python2的version吗? 机器学习PAI ODPS默认是python2的version吗?我们看logviewe日志是python2.7 参考答案: 是的,ODPS默认使用的是Python 2.7。你在使用PAI命令进行模型训练或预测时,如果需要使用Python 3,可以在命令后面加上--py_versi...

人工智能平台PAI产品使用合集之负采样版本DSSM双塔模型训练好之后,怎么分别获取user tower的embedding和item tower的embedding
问答 2023-11-19 来自:开发者社区

请问一下机器学习PAI DSSM模型负采样item表的schema要求是什么?

请问一下机器学习PAI DSSM模型负采样item表的schema要求是什么?负采样item表的字段是不是要求都在训练数据表里出现并且在data_configs里进行配置?

问答 2023-10-29 来自:开发者社区

机器学习PAI负采样的时候,有必要加上用户明确dislike的item吗?

机器学习PAI负采样的时候,有必要加上用户明确dislike的item吗?我看现在四种负采样方式貌似只能加到hard_neg_edge_input_path里面

问答 2023-09-17 来自:开发者社区

机器学习PAI ,需要保证负采样的item在正样本的时间之前吗,以及应该选择哪个时间段的样本呢?

"机器学习PAI ,dssm对item做采样的时候,因为同一个itemid会有多个不同时段的样本(因为点击量、曝光量等统计特征是实时变化的),需要保证负采样的item在正样本的时间之前吗,以及应该选择哪个时间段的样本呢?"

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

人工智能平台PAI

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

+关注