社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

一周十大热门主题

ChatGPT-5即将发布，相关方向梳理

AI 与机器学习领域必关注的十大优质YouTube频道，涵盖理论-20250801105144

官方 PyTorch 初学者系列，全面覆盖深度学习入门：• 从基-20250801100416

国泰海通｜金工：基于GRU、TCN模型的深度学习因子选股效果研究

【#ChatGPT或推出新订阅计划#】8 月 2 日，科技媒体 -20250802135912

扣子开源，三天揽获1.5W GitHub Star

独家｜阿里推出AI医学助手App“氢原子”；京东测试AIGC产品“小星绪”，以情绪驱动漫画故事生成

机器学习学术速递[7.30]

【3 个月新增 500 万，#微软GitHubCopilot累计-20250731160404

ChatGPT 新推“Study Mode”本质是一段精心设计的-20250730113201

关注

Py学习 » 机器学习算法

深度学习：如何进行优雅的优化？

计算机视觉life • 3 年前 • 268 次点击

点击上方“计算机视觉life”，选择“星标”

快速获得最新干货

以下文章来源于AI有道，作者武强。文章仅用于学术分享。

深度学习中我们总结出 5 大技巧：

本节继续从第三个开始讲起。

3. Early stopping and Regularization

本节我们一起探讨 Early stopping and Regularization，这两个技巧不是深度学习特有的方法，是机器学习通用的方法。

Early stopping

在训练过程中，往往会得出训练的最后的结果还可能不如以前的，原因很有可能出现overfitting。我们需要提前踩刹车，得出更好的效果。

Regularizaton

当我们努力降低Loss函数的数值的时候，我们会发现，我们找到的参数集weights，不仅仅要让Loss变小，而且weights 自身也需要接近于0，这样我们的结果会更加理想。

L1 正则化：

新的Loss函数将会被最小化：

L2正则化：

新的Loss函数将会被最小化：

到这里，很多同学会疑问，为什么weights小了，结果就很更好，我在这里举例说明：6岁的时候和14岁的时候，大脑的神经元密度明显降低，说明一些无效的神经元是阻碍大脑进步的。

4. Dropout

Dropout 在2012年imagenet 比赛中大放异彩，是当时CNN模型夺冠的功勋环节之一。

那什么是Dropout 我们先直观的理解：

练武功的时候，训练的时候脚上绑上重物

等到练成下山的时候：

我们从几个方面来解释Dropout

基础定义

当训练的时候，每一个神经元都有p%的可能“靠边站”

当测试的时候，所有的神经元齐心协力，共同努力：

Dropout是一种Ensemble学习

Ensemble 学习我们在机器学习专栏中一起讨论过，链接是集成学习。每次训练的时候的网络结构都是不一样的，是一个thinner network：

其实在训练的时候训练了很多thinner network：

测试的时候，取各个网络的平均值

所以在深度学习中，我们的整个训练测试方法如下：

本专栏图片、公式很多来自台湾大学李弘毅老师、斯坦福大学cs229、cs231n 、斯坦福大学cs224n课程。在这里，感谢这些经典课程，向他们致敬！

独家重磅课程官网：cvlife.net

1、视觉SLAM基础：疫情在家，想入门SLAM实战，最适合学哪个开源框架？

2、机器人导航运动规划：机器人核心技术运动规划：让机器人想去哪就去哪！

3、详解Cartographer：谷歌开源的激光SLAM算法Cartographer为什么这么牛X？

4、深度学习三维重建总共60讲全部上线！详解深度学习三维重建网络

5、三维视觉基础详解视觉深度估计算法（单/双目/RGB-D+特征匹配+极线矫正+代码实战）

6、 VINS:Mono+Fusion SLAM面试官：看你简历上写精通VINS，麻烦现场手推一下预积分！

7、图像三维重建课程：视觉几何三维重建教程（第2期）：稠密重建，曲面重建，点云融合，纹理贴图

8、系统全面的相机标定课程：单目/鱼眼/双目/阵列相机标定：原理与实战

全国最棒的SLAM、三维视觉学习社区↓

技术交流微信群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群，请添加微信号 chichui502 或扫描下方加群，备注：”名字/昵称+学校/公司+研究方向“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~

投稿、合作也欢迎联系：simiter@126.com

— 版权声明 —

本公众号原创内容版权属计算机视觉life所有；从公开渠道收集、整理及授权转载的非原创文字、图片和音视频资料，版权属原作者。如果侵权，请联系我们，会及时删除。

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/132262

268 次点击

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号