CNN经典算法之Inception V1(GoogLeNet)
本文是深度学习经典算法解读的一部分:https://www.datalearner.com/blog/1051558603213207
GoogLeNet是谷歌在2014年提出的一种CNN深度学习方法,它赢得了2014年ILSVRC的冠军,其错误率要低于当时的VGGNet。它于2015年发表在CVPR上。GoogLeNet也称为Inception v1。因为后面它还提出了很多的改进版本,包括v2、v3、v4等。
与之前的深度学习网络思路不同,之前的CNN网络的主要目标还是加深网络的深度,而GoogLeNet则提出了一种新的结构,称之为inception。本文将详细讲述这种结构,以及基于此结构提出的GoogLeNet。
一般来说,同一个物体在不同图像中的位置差别很大,大小也不同。识别这种物体是很困难的。为了识别这种物体,需要准确的卷积操作。大的卷积核通常倾向于全局信息,而小的卷积核则主要捕获局部信息。为了解决这个问题,GoogLeNet的思路是在同一层使用多个不同大小的卷积核来捕捉信息,这种结构就是inception。下面我们根据论文思路来说明。




