文章 2025-02-17 来自:开发者社区

深度学习实践技巧:提升模型性能的详尽指南

 目录 1. 引言 2. 数据处理技巧 2.1 数据增强的进阶方法 2.2 自动化数据清理 3. 模型架构优化 3.1 使用不同类型的层来提升模型能力 3.2 网络深度与残差连接 4. 训练策略优化 4.1 动态学习率调度策略 4.2 增加 Dropout 防止过拟合 4.3 提前停止训练 ...

深度学习实践技巧:提升模型性能的详尽指南
文章 2023-08-31 来自:开发者社区

深度学习实践篇 第五章:模型保存与加载

参考教程:https://pytorch.org/tutorials/beginner/basics/saveloadrun_tutorial.html 训练好的模型,可以保存下来,用于后续的预测或者训练过程的重启。为了便于理解模型保存和加载的过程,我们定义一个简单的小模型作为例子,进行后续的讲解。 这个模型里面包含一个名为self.p1的Parameter和一个名为conv1的卷积层。我们...

深度学习实践篇 第五章:模型保存与加载
文章 2023-08-31 来自:开发者社区

深度学习实践篇 第三章:模型与模型的搭建

写在前面的话这部分只解释代码,不对线性层(全连接层),卷积层等layer的原理进行解释。尽量写的比较全了,但是自身水平有限,不太确定是否有遗漏重要的部分。 教程参考:https://pytorch.org/tutorials/https://github.com/TingsongYu/PyTorch_Tutorialhttps://github.com/yunjey/pytorch-tutor.....

深度学习实践篇 第三章:模型与模型的搭建
文章 2023-06-16 来自:开发者社区

深度学习实践篇[17]:模型压缩技术、模型蒸馏算法:Patient-KD、DistilBERT、DynaBERT、TinyBERT

深度学习实践篇[17]:模型压缩技术、模型蒸馏算法:Patient-KD、DistilBERT、DynaBERT、TinyBERT 1.模型压缩概述 1.2模型压缩原有 理论上来说,深度神经网络模型越深,非线性程度也就越大,相应的对现实问题的表达能力越强,但相应的代价是,训练成本和模型大小的增加。同时,在部署时,大模型预测速度较低且需要更好的硬件支持。但随着深度学习越来越多的参与到产业中,...

深度学习实践篇[17]:模型压缩技术、模型蒸馏算法:Patient-KD、DistilBERT、DynaBERT、TinyBERT
文章 2022-02-17 来自:开发者社区

【阿里算法天才盖坤】解读阿里深度学习实践,CTR 预估、MLR 模型、兴趣分布网络等

作为阿里妈妈精准展示技术部资深总监的盖坤在阿里的花名是靖世,被外界成为“算法天才”。2011 年,刚进阿里的盖坤提出了分片线性模型 MLR,这对当时主要使用简单线性模型做 CTR 预估的业界来说,因为极大地提高了 CTR 预估的准确性而颇具意义。几年来,MLR 模型已经被广泛应用在直通车定向和钻展业务中。 盖坤又带领团队在 CTR 预估方面推出了一个新的模型结构——深层用户网络兴趣分布网络,提出....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

深度学习更多实践相关

产品推荐

智能引擎技术

AI Online Serving,阿里巴巴集团搜推广算法与工程技术的大本营,大数据深度学习时代的创新主场。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问