系列笔记 | 深度学习连载(1):神经网络

神经网络


自2012年CNN的imagenet 上的突破,以神经网络网络为基础的深度学习开始风靡学界和工业界。我们来看一张图片,关于google 内部深度学习项目的数量。而且应用领域极广,从Android 到 药品发现,到youtube。


系列笔记 | 深度学习连载(1):神经网络


我们从一起回顾下神经网络的额前世今生:


• 1958: Perceptron (linear model)

• 1969: Perceptron has limitation

• 1980s: Multi-layer perceptron

• Do not have significant difference from DNN today

• 1986: Backpropagation

• Usually more than 3 hidden layers is not helpful

• 1989: 1 hidden layer is “good enough”, why deep?

• 2006: RBM initialization (breakthrough)

• 2009: GPU

• 2011: Start to be popular in speech recognition

• 2012: win ILSVRC image competition


深度学习是机器学习的一个分支,目前讲是最重要的一个分支。 怎么学好深度学些呢?


其实还是关键的三步:


1. 选择神经网络

2. 定义神经网络的好坏

3. 选择最好的参数集合


系列笔记 | 深度学习连载(1):神经网络

以下是神经网络的示意图:


系列笔记 | 深度学习连载(1):神经网络

所有的 θ 和 b 都在神经元内


1. 全连接网络(Fully Connection)


系列笔记 | 深度学习连载(1):神经网络

2. 深度网络 DEEP


深度 = 很多层


系列笔记 | 深度学习连载(1):神经网络

那么有人就会问:


* 到底多少层深度合适?每层多个神经元?

答:这个看经验和实验的结果,不断调整。


* 结构能被自动设定吗?

答:可以通过进化网络实现。


* 我们能自己设计网络结构吗?

答: CNN 就是设计出来的网络结构。


3. 定义神经网络的好坏Loss


我们以minist 数字识别为例,一组数字识别为例


系列笔记 | 深度学习连载(1):神经网络

系列笔记 | 深度学习连载(1):神经网络


4. 选择最好的神经网络(找到参数集)


核心方法:


* Gradient Descent

* BackPropagation


系列笔记 | 深度学习连载(1):神经网络

系列笔记 | 深度学习连载(1):神经网络



深度学习基本知识点了解到了,但是为什么越Deep,效果会越好? 以前都是做类比思考,比如电路模型,但是近期的lpaper上在理论上有严格的证明,我们后续博客会介绍

上一篇:应用统计学与R语言实现学习笔记后记


下一篇:系列笔记 | 深度学习连载(4):优化技巧(上)