换一换

冰点文库 > 资源分类 > PDF文档下载

预览

基于深度学习的目标检测算法研究及应用资料下载.pdf

资源ID：5975842 资源大小：5.02MB 全文页数：76页
资源格式： PDF 下载积分：10金币

快捷下载

账号登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要10金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

加入VIP,免费下载

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

基于深度学习的目标检测算法研究及应用资料下载.pdf

1、（保密的学位论文在解密后应遵守此规定）签名，导师签名，日期，年月日摘要I摘要目标检测是计算机视觉领域中一个富有挑战性的课题，其主要目的是从静态图片或视频中检测并定位特定的目标。它综合运用了图像处理、模式识别、人工智能和自动控制等技术，在道路交通事故预防、工厂可疑危险品警告、军事禁区监控、高级人机交互等方面有着广泛的应用。由于目标所处环境复杂多变，目前还没有一种比较通用成熟的检测方法，在实际应用中目标检测算法研究的机遇与挑战并存。本论文首先分析了国内外目标检测算法的研究现状，着重介绍了当前应用较为广泛的方法，使用目标特征训练分类器进行目标分类检测。针对使用现有特征训练的分类器进行目标分类检测时存

2、在误检率较高的缺点，本文在深度学习的基础上提出了一种基于卷积神经网络的行人目标检测算法。为了解决直接使用卷积神经网络进行滑动窗口检测效率较低的问题，本文将算法分为两大步骤：（1）疑似存在行人窗口确认;（2）行人检测。在疑似存在行人窗口确认中，本文使用融合特征作为行人的描述特征训练分类器，采用了邻近尺度特征值相似的思想构建分类器金字塔，在待检图像上利用不同尺度的滑动窗口进行滑动遍历确定疑是存在行人窗口；在行人检测中，使用大量正负样本训练了一个卷积神经网络，为了更好的适应行人检测，将该卷积神经网络的拓扑结构进行改进。将疑似存在行人的窗口输入改进后的卷积神经网络进行行人检测，在保持原有的检测率的基础

3、下降低了误检率。为了验证本文所提出算法的准确性，在 INRIA 行人数据库进行行人检测实验。分别以每个窗口和每幅图像为检测单位，统计本文算法的检测率和误检率，在平均每幅图像存在一个误检窗口的标准下，达到了 93%的检测率。检测率比使用 ACF特征训练的检测器高三个百分点，检测速度比单独使用卷积神经网络检测提升四倍以上。实验结果证明了本文算法的有效性。关键字关键字：目标检测；行人检测；深度学习；卷积神经网络ABSTRACTIIABSTRACTObject detection is a challenging problem in the field of computer vision andw

4、hich main purpose is to detect and locate specific goals from static images or video.Itis based on the technology of technology of image processing,pattern recognition,artificial intelligence and automatic control and widely used in traffic accidentprevention,suspicious warned of dangerous goods in

5、factory,military restricted zonemonitoring and senior human-computer interaction.The current lack of a mature andgeneral method to detect object because of the environment is complicated.Objectdetection research exist opportunities and challenges in practical application.This thesis first analyzes t

6、he domestic and foreign research status of objectdetection algorithm,emphatically introduces the application method which are widelyused is based on the object feature trained classifier to classify object.Because of theexisting feature of the trained classifier to classify object has high false pos

7、itives rate,this thesis present a pedestrian object detection algorithm based on convolution neuralnetwork on the basis of deep learning.The algorithm consists of two steps in order tosolve the low efficiency of sliding window with convolution neural network,（1）thesuspected pedestrian window confirm

8、ation;（2）the pedestrian detection.In suspectedexisting pedestrian window confirmation,this thesis use the fusion feature as thedescription of the pedestrian training classifier and the ideal of nearby scale featuresimilar to build classifier pyramid.On the inspected images,this thesis use differents

9、cales of sliding window to slide traversal to confirm suspected exist pedestrian window.In the pedestrian detection,this thesis rely a large number of positive and negativesamples to train and get a convolution neural network.In order to better adept thepedestrian detection,this thesis improve the t

10、opology of traditional convolution network.Input suspected existence of pedestrians window into the improved convolution neuralnetwork to detect the pedestrian.In order to verify the accuracy of the proposed algorithm,this thesis test pedestriandetection experiments in the INRIA pedestrian database.

11、Separately treat each windowand each image as detection unit,this thesis statistics the detection rate and errordetection rate of the algorithm.On the standard of the existence of an error in everyimagedetectionwindow,thisthesisgets93%detectionrate.ComparedtheABSTRACTIIIexperimental results with tra

12、in detector using ACF feature,under the same false positiverate,the algorithm in this thesis has 3%detection rate higher than the detector trainedfrom ACF feature and detection time less four folds than single use convolutional neuralnetworks.The experimental results certify the effectiveness of the

13、 algorithm in thisthesis.Keywords:Object Detection,Pedestrian Detaction,Deep Learning,ConvolutionalNeural Network目录IV目录第一章绪论.11.1 研究背景及意义.11.2 国内外研究现状.21.3 本文主要内容及结构安排.4第二章相关基础知识.62.1 行人目标检测算法原理.62.1.1 基于模板匹配的检测算法.62.1.2 基于分类的行人检测算法.72.2 典型的人体特征.92.2.1 HAAR-LIKE 特征.92.2.2 HOG 特征.102.2.3 SIFT 特征.12

14、2.3 典型分类器.152.3.1 支持向量机算法.152.3.2 ADABOOST 算法.182.4 深度学习.202.4.1 深度学习概述.202.4.2 典型的深度学习结构.212.5 本章小结.27第三章基于融合特征的疑是行人窗口确认.283.1提取融合特征.283.2分类器训练.343.2.1训练标准尺度级联分类器.343.2.2快速构建邻近尺度分类器.38目录V3.3滑动窗口检测.383.4本章小结.42第四章基于卷积神经网络的行人检测.434.1本文所使用的卷积神经网络拓扑结构.434.2训练卷积神经网络.444.3卷积神经网络的参数调节.494.4行人目标检测过程.514.

15、5本章小结.52第五章实验结果及性能分析.535.1实验结果说明及对比.535.1.1行人检测评价标准.535.1.2实验过程.545.1.3实验结果与分析.545.1.4性能比较.585.2本章小结.59第六章总结与展望.606.1论文总结.606.2进一步研究工作.60致谢.61参考文献.62攻读硕士学位期间取得的成果.66第一章绪论1第一章绪论1.1 研究背景及意义人类所接触的外界信息大约有 80%属于视觉信息。对人类来说，图像以及视频是对客观事物形象与逼真的描述，是人类最主要的信息来源。目标检测与跟踪是计算机视觉研究领域的热门课题，它融合了图像处理、模式识别、人工智能、自动控

16、制等许多领域的前沿技术,在智能化交通系统、智能监控系统、工业检测、航天航空等诸多领域得到了广泛的应用1。自然界的一切图像都是连续变化的模拟图像，日常生活中，图像里某些特定的目标才是我们比较关心的，例如在军事禁区、工厂中的危险场所里面可疑的行人。因此，目标检测也就成为了近年来理论和应用的研究热点，是图像处理和计算机视觉学科的重要分支。它的目的就是快速、准确的检测出视频中的特定目标，在连续变化的模拟图像中将目标提取出来。其典型的应用主要包括：（1）智能交通监管系统，自动监测车辆和行人在交通中出现的违规及不文明现象，大大减少交通管理的麻烦。（2）安全场合智能监控，主要是来自那些对安全要求敏感的场合，

17、如银行、商店、停车场等。自动完成对复杂环境中人和车辆进行实时观测及对感兴趣目标的行为进行分析和描述。（3）军事应用中，在雷达跟踪、制导、遥感定位等领域，目标检测都占有极其重要的地位。由于现实世界中的物体（尤其是行人）、场景存在多变性，使其很难用一个同意的方法进行研究。目前目标检测所遇到的主要问题有：如何准确快速分割目标、尽量减小复杂背景对目标检测的影响以及如何降低因目标尺度、大小和形状发生变化引起的目标检测精确度下降的问题。此外，在目标检测系统中，系统的鲁棒性与实时性这两方面的性能存在矛盾。鲁棒性对目标检测系统，特别是行人检测系统十分重要，因为行人检测系统通常需要自动、连续的工作，对噪声、光照

18、、天气等因素的影响不能太敏感；实时性是系统必须满足的要求，这也就说明系统采用的图像处理算法不能太复杂。鉴于传统的目标检测算法在不同场景下进行准确检测比较困难，结合现有的研究现状和技术水平，本文通过结合传统的行人特征与深度学习的方法，对目标检测技术具有重要的理论和实际意义。电子科技大学硕士学位论文21.2 国内外研究现状目标检测是图像处理和计算机视觉的一个重要分支，在理论和实践上都有重大意义。近年来，随着物联网的高速发展与智能终端的广泛普及，目标检测技术成了机器视觉领域的研究热点，被国内外学者广泛关注。目标检测的研究主要包括了基于视频图像的目标检测和基于静态图片的目标检测。本文主要讨论基于静态图

19、片的目标检测算法，即在静态图片中检测并定位所设定种类的目标。基于静态图片的目标检测的难点主要在于图片中的目标会因光照、视角以及目标内部等变化而产生变化2。针对以上的难点，国内外学者进行了很多尝试。目前提出的方法主要分为基于形状轮廓的目标检测算法和基于目标特征的检测方法。基于形状的目标检测方法一般是通过对目标外部轮廓进行提取来完成检测任务。在行人目标检测中，形状是人体明显的一个特征，例如头肩部呈“”形，躯干部分呈竖直型等。Gavril 等人3构建人体轮廓模板库，计算待检窗口与人体的相似度，提出了基于轮廓的分层匹配算法；Farhadi 等人4在对改算法进行进一步改进，其将行人的形状特征同边缘信息结

20、合，该方法表示行人有更好的效果。在Felzenszwalb P.F.等人5从大量正样本中学习到行人的轮廓模板，通过 Hausdorff 距离测量待检窗口的边缘信息和模板判定该窗口是否为行人。上述三种方法优点是实现简单，不需要对图像进行预处理，可以保留图像的全部信息。但是由于行人姿态各异，基于模板匹配的行人检测算法需要构建大量的形状模板才能取得较好的匹配效果，并且对行人目标存在遮挡的情况下分类效果不好。基于特征及机器学习的方法是通过对目标进行特征提取、特征学习和检测等过程实现目标检测。人体特征一般通过统计图像的局部亮度变化，用该变化近似表达人体。常见的人体特征有 Haar 小波特征6、HOG 特

21、征7、Edlgelet8特征和混合特征9-11。Haar 小波特征6由 Papageorgiou 和 Poggio 等人提出，该特征使用检测窗口中指定位置的相邻矩形，计算每一个矩形的像素和并取其差值，然后用这些差值对图像的子区域进行分类。Haar 特征最初用于人脸目标检测；然后 Viola 使用积分图计算 Haar 特征12，积分图是一个与原始图像一样尺寸的二维矩形的查找表，每一个元素是原始图像在对应位置左上角所有像素和，可以使用查表的方法快速找出指定区域的 Haar 特征。Viola 将该方法用于行人检测，取得了较好的检测效果，为行人检测技术的发展奠定了基础。研究人员提出了大量基于 Haar

22、小波特征的改进算法进行行人检测13。Dalal 等人7首先提出了使用梯度方向直方图进行行人检测，梯度方向直方图第一章绪论3将图像分成小的连通区域，采集连通区域中各像素点的梯度的边缘或边缘的方向直方图，最后将这些直方图组合起来构成特征描述。HOG 描述器对图像几何和光学的变化都能保持较好的不变性，而且在粗空间采样、精细方向抽样和较强的光学归一化等条件下，行人保持站立的姿态做一些轻微的肢体动作，这些肢体动作可以忽略而不影响检测效果。综上所述，HOG 特别适合于做图像的行人检测，其在 MIT 行人数据库14获得了接近 100%的检测成功率；在 INRIA 行人数据库11上，也获得了约 90%的检

23、测成功率。随后 HOG 成为了使用最广泛的行人特征描述子。Zhu 等人15使用积分直方图计算 HOG 特征，加速了 HOG 特征的提取速度，然后训练了多个不同尺度的分类器，构成了一个级联分类器用于检测行人；Qu 等人16在检测视频中的行人时，将行人与背景分离出来后提取行人的 HOG 特征，减少了背景对目标 HOG 的影响，又加快了 HOG 特征的提取速度。B.Wu17等人首先提出了 Edgelet 特征，使用该特征检测在复杂场景中的单幅图像行人，获得了较好的检测效果。文献18将 Edgelet 特征用于对已知类别的物体进行检测和分割，取得了较好的效果。Edgelet 特征对光照变化的鲁棒性强；

24、只存储位置和方向信息用来计算，匹配计算简单快速；对行人的遮挡、视角和姿态的变化不敏感。但是 Edgelet 特征是依靠人工进行标定，工作量比较大，且标定完全符合人体曲线的 Edgelet 特征十分困难。Tuzel9等人使用各种不同特征的协方差矩阵描述行人的局部区域，将协方差矩阵视为联通的黎曼流，在黎曼几何空间中对行人分类。Watanabe10等人提出了共生梯度方向直方图特征（Co-occurrence Histograms of Oriented Gradients），该特征类似灰度共生矩阵，能更好的描述梯度空间的分布，但是向量维数太高。Dollar等人11使用积分图的技术对图像各特征通道（线

25、性或非线性变换后的图像）进行快速计算，提出了积分通道特征。该特征不仅可以将多种特征有机的结合起来，且解决了融合计算较慢的缺点。Geoffrey Hinton 等人19在Science上首次提出了深度学习的概念，其主要思想是通过深度神经网络模拟人脑学习认识目标的过程，依靠该神经网络从低到高逐层传递目标的特征，层次越高特征越抽象，输出结果为该目标最准确的特征表达20。深度学习提出后，在诸多领域均取得了巨大成功，受到广泛关注。在 2012年，Hinton 等人21采用深度学习赢得了 ImageNet22图像分类比赛的冠军，他们在原始的 RGB 像素空间训练了深度卷积神经网络模型，该模型包含 6000

26、万个像素，65 万个神经元构成的 5 层卷积网络，准确率超过使用传统手工设计特征的亚军 10十个百分点。Ji 等人23提出多层的 3D 卷积神经网络来学习视频块的时空特征，并通过卷积操作来实现对整个视频的特征学习，从而替代之前的时空兴趣点检测和电子科技大学硕士学位论文4特征描述符提取。Taylor 等人24提出使用卷积限制波兹曼来学习视频中相邻两帧的时空特征，在 KTH 和 Hollywoods2 视频数据库中的对比试验结果表明，利用深度学习得到的特征与手工设计的 HOG 等特征具有类似效果。而 Y.Sun25,26等人通过卷积神经网络学习人的脸部特征，将该特征用来训练贝叶斯分类器进行人脸识

27、别，获得了 99.47%的识别率，而非深度学习算法中，最好的识别率只能达到 96.33%。深度学习在学术界受到了广泛关注，同时在工业界也产生了巨大影响。百度和谷歌在 Hinton等人赢得 ImageNet比赛之后6 个月都更新了自己的图像内容搜索引擎。他们使用 Hinton 在比赛中的深度学习模型，应用在各自的数据上，图像搜索的准确率都得到了大幅度提高。鉴于深度学习在学术界和工业界的巨大影响力，2013 年被 MIT Technology Review 列为世界十大技术突破之首。1.3 本文主要内容及结构安排本文首先介绍了目标检测算法的发展现状，讲解了目标检测的基本步骤以及一些常用的行人目标特

28、征，接着介绍了深度学习的原理和几个深度学习模型，然后使用卷积神经网络加上积分通道特征训练一个能精确判断静态图像中行人的行人检测器。本文结合传统的行人特征与卷积神经网络学习的行人特征进行行人检测，检测的具体步骤如图 1-1 所示。本文的章节安排如下：第一章简单讲解目标检测的研究背景意义，以及目标检测和深度学习在当前的研究状况。第二章简述了行人目标检测的基础知识，阐述了基于模板匹配和基于分类这两种行人目标检测算法的基本流程；详细讲解了三种常用的行人特征：Haar-like特征、HOG 特征和 SIFT 特征，并比较了这三种特征的优缺点；介绍了支持向量机和 AdaBoost 这两种分类算法，并详细讲

29、解了他们的训练过程。简述了深度学习的背景原理，并详细讲解了稀疏自编码器、深度信念网和卷积神经网络这三种常用的深度学习模型。第三章详细给出了疑是行人窗口确认的过程，首先对样本图像做各种线性和非线性变换求出其图像通道，使用积分图快速求出其通道的矩形特征，随机选取一组特征进行分类器训练；利用邻近尺度相似性的原理，使用公式计算出于标准尺度分类器邻近的分类器参数；使用不同尺度的分类器对待捡图像进行滑动窗口处理，找出疑是存在行人的窗口并输出至卷积神经网络。第四章给出了本文所使用卷积神经网络的拓扑结构图，根据实际情况对原有的神经网络进行了改进，使其适合于做行人检测；详细说明了该卷积神经网络的第一章绪论5训

30、练过程；使用不同参数的网络进行行人检测实验，证明本文使用的网络效果最佳。第五章给出了使用本文算法的实验结果，并与使用 ACF 训练的检测器进行对比试验，证明了本文算法的有效性。第六章对本文研究工作进行总结并提出了一些需要继续深入研究的问题。待检图片提取融合特征多尺度分类器滑动窗口检测确认疑是行人窗口疑是存在行人窗口确认基于卷积神经网络的行人检测卷积神经网络提取特征单层神经网络分类根据分类结果确定窗口是否存在行人检测结果图 1-1 本文检测行人步骤电子科技大学硕士学位论文6第二章相关基础知识要设计出具有良好环境适应能力的检测方法，首先需要充分分析了解现有的行人检测技术，了解现有技术在特征选择和分类器设计的优势与不足，才能做出针对性的改进。本章将重点分析介绍行人检测技术的相关知识，典型的行人特征和典型的分类器两个

注意事项

本文（基于深度学习的目标检测算法研究及应用资料下载.pdf）为本站会员主动上传，冰点文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知冰点文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。