深度学习基础：激活函数以及什么时候使用它们？

（点击上方公众号，可快速关注）

翻译：数据派THU-王紫岳，作者：Dishashree Gupta

摘要

激活函数是神经网络的组成部分之一。
学习深度学习中不同的激活函数。
在python中编写激活函数并在实时编码窗口中将结果可视化。

本文最初发表于2017年10月，并于2020年1月进行了更新，增加了三个新的激活函数和python代码。

引言

今天，因特网提供了获取大量信息的途径。无论我们需要什么，只需要谷歌搜索一下即可。然而，当我们获取了这么多的信息时，我们又面临着如何区分相关和无关的信息的挑战。

当我们的大脑被同时灌输大量信息时，它会努力去理解这些信息并将其分为“有用的”和“不那么有用的”。对于神经网络而言，我们需要类似的机制来将输入的信息分为“有用的”或“不太有用的”。

这是网络学习的重要方式，因为并不是所有的信息都同样有用。它们中的一些仅仅是噪音，而这就是激活函数的用武之地了。激活函数帮助神经网络使用重要信息，并抑制不相关的数据点。

接下来让我们来看看这些激活函数，了解它们是如何工作的，并找出哪些激活函数适合于什么样的问题情景。

对于分类器，Sigmoid函数及其组合通常工作得更好。
由于有梯度消失的问题，有时会避免使用sigmoid和tanh函数。
ReLU函数是一种通用的激活函数，目前被广泛使用。
如果在我们的网络中遇到神经元未激活的情况，Leaky ReLU函数是最好的选择。
始终记住，ReLU函数应该只在隐藏层中使用。
根据经验，您可以从使用ReLU函数开始，然后在ReLU不能提供最佳结果的情况下转移到其他激活函数。

项目

现在，是时候冒险尝试一下其他真实的数据集了。那么你准备好接受挑战了吗?通过以下实践问题加速你的深度学习之旅:

l Practice Problem: Identify the Apparels(见下面链接)

https://datahack.analyticsvidhya.com/contest/practice-problem-identify-the-apparels/?utm_source=fundamentals-deep-learning-activation-functions-when-to-use-them&utm_medium=blog

l Practice Problem: Identify the Digits（见下面链接）

https://datahack.analyticsvidhya.com/contest/practice-problem-identify-the-digits/?utm_source=fundamentals-deep-learning-activation-functions-when-to-use-them&utm_medium=blog

结语：在本文中，我讨论了各种类型的激活函数，以及在使用它们时可能遇到的问题类型。我建议你先从ReLU函数开始，并随着你慢慢深入时，探索其他函数。你还可以设计自己的激活函数，为你的神经网络提供一个非线性组件。如果您使用了自己的激活函数并且效果非常好，请与我们分享，我们将很乐意将其纳入列表。

原文链接：

https://www.analyticsvidhya.com/blog/2020/01/fundamentals-deep-learning-activation-functions-when-to-use-them/

原文标题：

Fundamentals of Deep Learning – Activation Functions and When to Use Them?

推荐阅读点击标题可跳转

想入门图深度学习？这篇 55 页的教程帮你理清楚了脉络

深度学习必懂的 13 种概率分布

17种深度强化学习算法用Pytorch实现（附链接）

看完本文有收获？请转发分享给更多人

关注「大数据与机器学习文摘」，成为Top 1%