1、深度学习在图像处理问题中的应用,目录,手写数字识别的例子深度学习到底是什么卷积神经网络卷积神经网络的经典结构常见的图像处理问题卷积神经网络的问题,手写数字识别的例子,问题:对手写邮政编码的识别每张图像是28*28的灰度图像,常用784维的向量x表示。目的是设计一个算法(函数、机器),输入是上述向量x,输出是数字y(0,1,29)。,手写数字识别的例子,解决方法,方案1:根据手写数字图像中笔画的形状、粗细的特点来人为的制定一些规则,基于这些规则判断输入图像是哪个数字。,方案2:通过训练集(xi,yi)i=1,2N学习一个模型f的参数,使y=f(x),目录,手写数字识别的例子深度学习到底是什么卷积
2、神经网络卷积神经网络的经典结构常见的图像处理问题卷积神经网络的问题,特征提取,将原始图像直接作为分类器的输入,效果并不好。常用的分类器有Logistic Regression,Decision Tree,Support Vector Machine等,于是研究人员就根据图像的特点,提出一些特征,把对图像提取的特征输入到分类器,效果提升了。常用的特征有直方图,梯度直方图,SIFT等。,特征提取,1.不需要专业知识2.多层学习,特征学习,特征提取,1.图像的二维结构被破坏2.全连接网路权重(参数)数量太多,容易过拟合,需要大量训练样本,特征学习,深度学习,深度神经网络在图像中应用广泛的最主要原因是
3、:效果好!,目录,手写数字识别的例子深度学习到底是什么卷积神经网络卷积激活池化生物学依据卷积神经网络的经典结构常见的图像处理问题卷积神经网络的问题,卷积神经网络,卷积操作,卷积操作的特点,二维(或多维)运算,保持图像的结构关系,全连接神经网络,卷积神经网络,输入图像向量化后再输入到神经网络中,图像的二维(或三维)结构关系被打破。,输入图像直接输入卷积神经网络中,保持图像的二维(或三维)结构关系。,卷积操作的特点,局部感知,减少参数数量,图像的空间联系也是局部的像素联系较为紧密,而距离较远的像素相关性则较弱。因此,每个神经元其实没有必要对全局图像进行感知,只需要对局部进行感知,然后在更高层将局部
4、的信息综合起来就得到了全局的信息。,卷积操作的特点,参数共享,减少参数数量,采用局部感知后,参数依然非常多。由于卷积的操作是为了提取图像特征,而图像特征与位置无关,于是可以采用参数共享的策略。,卷积操作的特点,多卷积核,一个卷积核只能学习一种特征多卷积核可以学习多种特征,非线性激活操作,非线性激活操作不是卷积网络特有的,一般的神经网络也会有非线性激活操作。如果没有非线性激活,神经网络只有线性表达,表达能力不够强。,x31=w311*x21+w321*x22+b31,x21=w211*x11+w221*x12+b21,x22=w212*x11+w222*x12+b22,=w311*(w211*x
5、11+w221*x12+b21)+w321*(w212*x11+w222*x12+b22)+b31=w1*x11+w2*x12+b,池化操作,池化操作可以对输入的特征图进行压缩,一方面使特征图变小,简化网络计算复杂度;另一方面进行特征压缩,提取主要特征。,卷积神经网络,特征学习,卷积神经网络与人类视觉,卷积神经网络,卷积神经网络在图像中应用广泛的最主要原因是:效果好!,目录,手写数字识别的例子深度学习到底是什么卷积神经网络卷积神经网络的经典结构常见的图像处理问题卷积神经网络的问题,卷积神经网络的经典结构,LeNetAlexNetVGGGoogleNetResNetDenseNet,LeNet,
6、用于对10类问题的分类(MNIST)最早的卷积神经网络conv2的卷积实际上并不是55616的,而是对6个feature maps做了一些选取池化的方法与现在略有不同使用高斯分布进行分类,而不是现在主流的softmax,AlexNet,用于对1000类问题的分类(Imagenet)使用了ReLU的非线性激活使用了dropout使用了LRN对feature maps进行归一化,VGG,GoogleNet,ResNet,DenseNet,目录,手写数字识别的例子深度学习到底是什么卷积神经网络卷积神经网络的经典结构常见的图像处理问题分类检测分割视线估计卷积神经网络的问题,分类,检测,检测,分割,In
7、ference的加速方法,The time is test on NVIDIA Tesla K80.And the input of the model is 416*416.Theoretically,pruning reduces the number of parameters by 10 and computation by 10.In fact,the model can be pruned 1/10 of its original size without impacting accuracy,and speed up 4x.After pruning the time of the model is 24 millisecond test on Jetson TX1.,目录,手写数字识别的例子深度学习到底是什么卷积神经网络卷积神经网络的经典结构常见的图像处理问题卷积神经网络的问题,卷积神经网络的问题,由于池化操作,丢失了空间关系,因此个人觉得池化操作未来一定会被改进。,卷积操作提取的特征本身并不是旋转不变的。,总结,深度学习在图像处理问题中的主要作用是“特征学习”深度学习之所以比较流行的原因是“效果好”,