我们将CNN分为分类网络,检测网络,分割网络,跟踪网络,以及轻量化网络5大类。图像识别有这样几种类型的任务
图像分类,可抽象成将一张图像映射成一个类别标签;目标检测,可以抽象为将一张图像映射为一个目标序列,包括目标的类型,坐标,大小;图像分割,将图像映射为一张等尺寸的图像,结果图像中的一个像素为输入图像中对应像素所属物体的类别。边缘检测,轮廓检测等任务类似于图像分割。
对于卷积神经网络的综述可以阅读SIGAI之前的文章“深度卷积神经网络演化历史及结构改进脉络-40页长文全面解读”。
首先来看分类网络。自1989年LeCun提出第一个真正意义上的卷积神经网络,到今年为止,CNN已经走过了30个年头。高速发展起始于202年AlexNet,此后的GoogLeNet,ResNet,DenseNet等不停的刷新ImageNet图像分类的记录,朝着更准这条路迈进。在网络结构上,从之前单一线性结构扩展到多分支,跨层连接,以及更灵活的拓扑结构。
检测网络则是CNN中变种最多的家族。为了完成检测任务中的目标分类的定位两个子任务,出现了五花八门的网络结构。这场技术革命始于RCNN,Fastr RCNN,YOLO,SSD,mask RCNN等网络带来了令人不可思议的效果,这在人工特征+AdaBoost/SVM时代是不可想象的。目标检测算法可以阅读SIGAI之前的文章“基于深度学习的目标检测算法综述”。
分割网络也是CNN中的一个大家族,为机器视觉中的语义分割任务而生。其网络变种之多,较之检测网络丝毫不拜下风。而这一切的起点是FCN,去掉了卷积网络中全连接层,代之以卷积层这样一个神奇的结构,特别适合解决图像分割这样的密集映射
跟踪网络的要解决的核心问题是通过少量的在线训练样本学习得到被跟踪物体的检测模型。对于这一领域,大部分人可能相对陌生。
神经网络的精度越来越高,但不可避免的,模型的结构越来越复杂。这限制了深度学习的应用,如在移动端,嵌入式设备这类计算和存储资源有限的平台。轻量化网络应运而生,从MobileNet V1到后续的各种新模型,在看似简单的卷积网络结构上,研究人员硬是想出了各种新花样,将网络的规模,运行速度优化到了惊艳的程度。轻量化网络的综述可以阅读SIGAI之前的文章“轻量化神经网络综述”。