问答 2023-04-03 来自:开发者社区

想问下ModelScope训练的话 这个报错要怎么设置参数呢? 在PAI平台

GPT3Trainer: GPT3ForTextGeneration: CUDA out of memory. Tried to allocate 100.00 MiB (GPU 0; 22.20 GiB total capacity; 5.90 GiB already allocated; 70.12 MiB free; 5.90 GiB reserved in total by PyTorc....

问答 2023-03-01 来自:开发者社区

modelscope 训练时,cfg.train.checkpoint的保存中间结果设置不管用?

modelscope跑的模型, 请问这个saving checkpoint at 200 iterations,怎么把200改的大一点,在哪里设置,我按照你们给出的格式cfg.train.checkpoint,把"by_epoch": True, 但是结果还是按照iter进行保存的,interval不管怎么设置,跑的结果还是200个interval就保存一次,这怎么弄。求答复,谢谢。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等