书签分享收藏举报版权申诉 / 35

立即下载加入VIP,免费下载

当前位置：首页 > 职业教育 > 中职中专 > CNN卷积神经网络原理Word文档下载推荐.docx

CNN卷积神经网络原理Word文档下载推荐.docx

文档编号：5197051
上传时间：2023-05-04
格式：DOCX
页数：35
大小：170.26KB

《CNN卷积神经网络原理Word文档下载推荐.docx》由会员分享，可在线阅读，更多相关《CNN卷积神经网络原理Word文档下载推荐.docx（35页珍藏版）》请在冰点文库上搜索。

CNN卷积神经网络原理Word文档下载推荐.docx

gzip

3.import

os

4.import

sys

5.import

time

6.

7.import

numpy

8.

9.import

theano

10.import

theano.tensor

as

T

11.from

theano.tensor.signal

import

downsample

12.from

theano.tensor.nnet

conv

（2）定义CNN的基本"

构件"

CNN的基本构件包括卷积采样层、隐含层、分类器，如下

∙定义LeNetConvPoolLayer（卷积+采样层）

见代码注释：

1."

"

2.卷积+下采样合成一个层LeNetConvPoolLayer

3.rng:

随机数生成器，用于初始化W

4.input:

4维的向量，theano.tensor.dtensor4

5.filter_shape:

（number

of

filters,

num

input

feature

maps,filter

height,

filter

width）

6.image_shape:

（batch

size,

maps,image

image

7.poolsize:

（#rows,

#cols）

8."

9.class

LeNetConvPoolLayer（object）:

10.

def

__init__（self,

rng,

input,

filter_shape,

image_shape,

poolsize=（2,

2））:

11.

12.#assert

condition，condition为True，则继续往下执行，condition为False，中断程序

13.#image_shape[1]和filter_shape[1]都是num

maps，它们必须是一样的。

14.

assert

image_shape[1]

==

filter_shape[1]

15.

self.input

=

16.

17.#每个隐层神经元（即像素）与上一层的连接数为num

maps

*

height

width。

18.#可以用numpy.prod（filter_shape[1:

]）来求得

19.

fan_in

numpy.prod（filter_shape[1:

]）

20.

21.#lower

layer上每个神经元获得的梯度来自于：

output

width"

/pooling

size

22.

fan_out

（filter_shape[0]

numpy.prod（filter_shape[2:

/

23.

numpy.prod（poolsize））

24.

25.#以上求得fan_in、fan_out

，将它们代入公式，以此来随机初始化W,W就是线性卷积核

26.

W_bound

numpy.sqrt（6.

（fan_in

+

fan_out））

27.

self.W

theano.shared（

28.

numpy.asarray（

29.

rng.uniform（low=-W_bound,

high=W_bound,

size=filter_shape）,

30.

dtype=theano.config.floatX

31.

）,

32.

borrow=True

33.

）

34.

35.#

the

bias

is

a

1D

tensor

--

one

per

map

36.#偏置b是一维向量，每个输出图的特征图都对应一个偏置，

37.#而输出的特征图的个数由filter个数决定，因此用filter_shape[0]即number

filters来初始化

38.

b_values

numpy.zeros（（filter_shape[0],）,

dtype=theano.config.floatX）

39.

self.b

theano.shared（value=b_values,

borrow=True）

40.

41.#将输入图像与filter卷积，conv.conv2d函数

42.#卷积完没有加b再通过sigmoid，这里是一处简化。

43.

conv_out

conv.conv2d（

44.

input=input,

45.

filters=self.W,

46.

filter_shape=filter_shape,

47.

image_shape=image_shape

48.

49.

50.#maxpooling，最大子采样过程

51.

pooled_out

downsample.max_pool_2d（

52.

input=conv_out,

53.

ds=poolsize,

54.

ignore_border=True

55.

56.

57.#加偏置，再通过tanh映射，得到卷积+子采样层的最终输出

58.#因为b是一维向量，这里用维度转换函数dimshuffle将其reshape。

比如b是（10,），

59.#则b.dimshuffle（'

x'

0,

'

））将其reshape为（1,10,1,1）

60.

self.output

T.tanh（pooled_out

self.b.dimshuffle（'

））

61.#卷积+采样层的参数

62.

self.params

[self.W,

self.b]

∙定义隐含层HiddenLayer

这个跟上一篇文章《

DeepLearningtutorial（3）MLP多层感知机原理简介+代码详解》中的HiddenLayer是一致的，直接拿过来：

2.注释：

3.这是定义隐藏层的类，首先明确：

隐藏层的输入即input，输出即隐藏层的神经元个数。

输入层与隐藏层是全连接的。

4.假设输入是n_in维的向量（也可以说时n_in个神经元），隐藏层有n_out个神经元，则因为是全连接，

5.一共有n_in*n_out个权重，故W大小时（n_in,n_out）,n_in行n_out列，每一列对应隐藏层的每一个神经元的连接权重。

6.b是偏置，隐藏层有n_out个神经元，故b时n_out维向量。

7.rng即随机数生成器，numpy.random.RandomState，用于初始化W。

8.input训练模型所用到的所有输入，并不是MLP的输入层，MLP的输入层的神经元个数时n_in，而这里的参数input大小是（n_example,n_in）,每一行一个样本，即每一行作为MLP的输入层。

9.activation:

激活函数,这里定义为函数tanh

10."

11.class

HiddenLayer（object）:

12.

n_in,

n_out,

W=None,

b=None,

13.

activation=T.tanh）:

#类HiddenLayer的input即所传递进来的input

17.

注释：

18.

代码要兼容GPU，则必须使用

dtype=theano.config.floatX,并且定义为theano.shared

另外，W的初始化有个规则：

如果使用tanh函数，则在-sqrt（6./（n_in+n_hidden））到sqrt（6./（n_in+n_hidden））之间均匀

抽取数值来初始化W，若时sigmoid函数，则以上再乘4倍。

21.

#如果W未初始化，则根据上述方法初始化。

#加入这个判断的原因是：

有时候我们可以用训练好的参数来初始化W，见我的上一篇文章。

if

W

None:

25.

W_values

rng.uniform（

low=-numpy.sqrt（6.

（n_in

n_out））,

high=numpy.sqrt（6.

size=（n_in,

n_out）

activation

theano.tensor.nnet.sigmoid:

*=

4

35.

theano.shared（value=W_values,

name='

W'

36.

37.

b

numpy.zeros（（n_out,）,

b'

41.

#用上面定义的W、b来初始化类HiddenLayer的W、b

42.

#隐含层的输出

lin_output

T.dot（input,

self.W）

（

None

else

activation（lin_output）

50.

#隐含层的参数

∙定义分类器（Softmax回归）

采用Softmax，这跟《DeepLearningtutorial

（1）Softmax回归原理简介+代码详解》中的LogisticRegression是一样的，直接拿过来：

2.定义分类层LogisticRegression，也即Softmax回归

3.在deeplearning

tutorial中，直接将LogisticRegression视为Softmax，

4.而我们所认识的二类别的逻辑回归就是当n_out=2时的LogisticRegression

5."

6.#参数说明：

7.#input，大小就是（n_example,n_in），其中n_example是一个batch的大小，

8.#因为我们训练时用的是Minibatch

SGD，因此input这样定义

9.#n_in,即上一层（隐含层）的输出

10.#n_out,输出的类别数

LogisticRegression（object）:

n_out）:

14.#W大小是n_in行n_out列，b为n_out维向量。

即：

每个输出对应W的一列以及b的一个元素。

value=numpy.zeros（

（n_in,

n_out）,

（n_out,）,

33.#input是（n_example,n_in），W是（n_in,n_out）,点乘得到（n_example,n_out），加上偏置b，

34.#再作为T.nnet.softmax的输入，得到p_y_given_x

35.#故p_y_given_x每一行代表每一个样本被估计为各类别的概率

36.#PS：

b是n_out维向量，与（n_example,n_out）矩阵相加，内部其实是先复制n_example个b，

37.#然后（n_example,n_out）矩阵的每一行都加b

self.p_y_given_x

T.nnet.softmax（T.dot（input,

self.b）

40.#argmax返回最大值下标，因为本例数据集是MNIST，下标刚好就是类别。

axis=1表示按行操作。

self.y_pred

T.argmax（self.p_y_given_x,

axis=1）

43.#params，LogisticRegression的参数

到这里，CNN的基本”构件“都有了，下面要用这些”构件“组装成LeNet5（当然，是简化的，上面已经说了），具体来说，就是组装成：

LeNet5=input+LeNetConvPoolLayer_1+LeNetConvPoolLayer_2+HiddenLayer+LogisticRegression+output。

然后将其应用于MNIST数据集，用BP算法去解这个模型，得到最优的参数。

（3）加载MNIST数据集（mnist.pkl.gz）

2.加载MNIST数据集load_data（）

3."

4.def

load_data（dataset）:

5.

#

dataset是数据集的路径，程序首先检测该路径下有没有MNIST数据集，没有的话就下载MNIST数据集

#这一部分就不解释了，与softmax回归算法无关。

7.

data_dir,

data_file

os.path.split（dataset）

data_dir

and

not

os.path.isfile（dataset）:

9.

Check

dataset

in

data

directory.

new_path

os.path.join（

os.path.split（__file__）[0],

.."

data"

os.path.isfile（new_path）

or

mnist.pkl.gz'

:

（not

os.path.isfile（dataset））

urllib

origin

http:

//www.iro.umontreal.ca/~lisa/deep/data/mnist/mnist.pkl.gz'

print

Downloading

from

%s'

%

urllib.urlretrieve（origin,

dataset）

...

loading

data'

28.#以上是检测并下载数据集mnist.pkl.gz，不是本文重点。

下面才是load_data的开始

30.#从"

mnist

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: CNN 卷积神经网络原理

冰点文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：CNN卷积神经网络原理Word文档下载推荐.docx
链接地址：https://www.bingdoc.com/p-5197051.html

CNN卷积神经网络原理Word文档下载推荐.docx

热门标签