基于深度学习目标检测进展.pptx
- 文档编号:334408
- 上传时间:2023-04-29
- 格式:PPTX
- 页数:25
- 大小:5.77MB
基于深度学习目标检测进展.pptx
《基于深度学习目标检测进展.pptx》由会员分享,可在线阅读,更多相关《基于深度学习目标检测进展.pptx(25页珍藏版)》请在冰点文库上搜索。
深度学习综述,报时间:
2016.11.,深度学习是什么?
深度学习的概念源于人工神经网络的研究。
含多隐层的多层感知器就是一种深度学习结构。
深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
1深度学习是机器学习领域中对模式(声音、图像等等)进行建模的一种方法,它也是一种基于统计的概率模型。
在对各种模式进行建模之后,便可以对各种模式进行识别了,例如待建模的模式是声音的话,那么这种识别便可以理解为语音识别(RNNHinton32013)。
概念入门,深度学习神经网络的发展神经网络(上世纪五六十年代)深度神经网络(Hinton22006)卷积神经网络(AlexNet12021)基于深度学习的目标检测进展,一、神经网络的发展,感知机的出现神经网络技术起源于上世纪五、六十年代,当时叫感知机(perceptron),拥有输入层、输出层和一个隐含层。
输入的特征向量通过隐含层变换达到输出层,在输出层得到分类结果。
早期感知机对于计算稍微复杂的函数其计算力显得无能为力。
多层感知机,多层感知机可以摆脱早期离散传输函数的束缚,使用sigmoid或tanh等连续函数模拟神经元对激励的响应,在训练算法上则使用反向传播BP算法。
对,这就是我们现在所说的神经网络(NN)!
激活函数,构成:
由“神经元”构成输入、偏置节点、激活函数、输出,这个“神经元”是一个以及截距为输入值的运算单元,其输出为,其中函数为激活函数前向参数计算:
反向传播损失函数:
我们的目标是针对参数W和b,来求函数J(W,b)最小值梯度下降法中每一次迭代都按照如下公式对参数是学习率,二、卷积神经网络,1、卷积神经网络,二、卷积神经网络,卷积操作AlexNet1,二、卷积神经网络,与传统视觉算法区别:
二、卷积神经网络,二、卷积神经网络,主要应用:
图像分类,三、基于深度学习的目标检测,目标检测?
其实刚刚的这个过程就是目标检测,目标检测就是“给定一张图像或者视频帧,找出其中所有目标的位置,并给出每个目标的具体类别”。
传统的objectproposal方法,Whatmakesforeffectivedetectionproposals?
4,三、基于深度学习的目标检测,检测SelectiveSearchDL:
faster-rcnn,适应不同尺度多样化,RPN+CNN,传统目标检测方法,区域选择采用滑动窗口的策略对整幅图像进行遍历,而且需要设置不同的尺度,不同的长宽比。
特征提取这个阶段常用的特征有SIFT、HOG等分类器SVM、Adaboost传统目标检测存在的两个主要问题:
一个是基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余;二是手工设计的特征对于多样性的变化并没有很好的鲁棒性。
三、基于深度学习的目标检测,Faster-rcnn(TowardsReal-TimeObjectDetectionwithRegionProposalNetworks)5)网络结构:
在regionproposal+CNN分类的这种目标检测框架中,regionproposal质量好坏直接影响到目标检测任务的精度。
Faster-rcnn,RegionProposalNetworks(RPN),3*3滑窗对应的每个特征区域同时预测输入图像3种尺度(128,256,512),3种长宽比(1:
1,1:
2,2:
1)的regionproposal,这种映射的机制称为anchor。
所以对于这个40*60的featuremap,总共有约20000(40*60*9)个anchor,也就是预测20000个regionproposal.,Faster-rcnn,RPN的核心思想是使用卷积神经网络直接产生regionproposal,使用的方法本质上就是滑动窗口。
RPN的设计比较巧妙,RPN只需在最后的卷积层上滑动一遍,因为anchor机制和边框回归可以得到多尺度多长宽比的regionproposal。
Modify机制NMS(Non-maximumsuppression)非极大值抑制消除多余的boundingbox,找到最佳的物体检测位置,NMS,Intersection-over-union(IOU),Faster-rcnn,1、网络结构一览(caffemodel)2、FasterR-CNN将一直以来分离的regionproposal和CNN分类融合到了一起,使用端到端的网络进行目标检测,无论在速度上还是精度上都得到质的提高提高。
四、基于深度学习的目标检测应用实例,个人经验,研究生生活正确的打开方式研一:
研究什么研二:
研究出点什么研三:
科研与工作,参考文献,1KrizhevskyA,SutskeverI,HintonGE.ImageNetClassificationwithDeepConvolutionalNeuralNetworksJ.AdvancesinNeuralInformationProcessingSystems,2012,25
(2):
2012.2HintonGE,SalakhutdinovRR.ReducingtheDimensionalityofDatawithNeuralNetworksJ.Science,2006,313(5786):
504-7.3GravesA,MohamedAR,HintonG.SpeechrecognitionwithdeeprecurrentneuralnetworksJ.2013,1(2003):
6645-6649.4HosangJ,BenensonR,DollarP,etal.Whatmakesforeffectivedetectionproposals?
J.IEEETransactionsonPatternAnalysis&MachineIntelligence,2015,38(4):
814-830.5RenS,HeK,GirshickR,etal.FasterR-CNN:
TowardsReal-TimeObjectDetectionwithRegionProposalNetworksJ.IEEETransactionsonPatternAnalysis&MachineIntelligence,2016:
1-1.,Thanks,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 深度 学习 目标 检测 进展