CNN卷积神经网络原理Word文档下载推荐.docx
- 文档编号:5197051
- 上传时间:2023-05-04
- 格式:DOCX
- 页数:35
- 大小:170.26KB
CNN卷积神经网络原理Word文档下载推荐.docx
《CNN卷积神经网络原理Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《CNN卷积神经网络原理Word文档下载推荐.docx(35页珍藏版)》请在冰点文库上搜索。
gzip
3.import
os
4.import
sys
5.import
time
6.
7.import
numpy
8.
9.import
theano
10.import
theano.tensor
as
T
11.from
theano.tensor.signal
import
downsample
12.from
theano.tensor.nnet
conv
(2)定义CNN的基本"
构件"
CNN的基本构件包括卷积采样层、隐含层、分类器,如下
∙定义LeNetConvPoolLayer(卷积+采样层)
见代码注释:
1."
"
2.卷积+下采样合成一个层LeNetConvPoolLayer
3.rng:
随机数生成器,用于初始化W
4.input:
4维的向量,theano.tensor.dtensor4
5.filter_shape:
(number
of
filters,
num
input
feature
maps,filter
height,
filter
width)
6.image_shape:
(batch
size,
maps,image
image
7.poolsize:
(#rows,
#cols)
8."
9.class
LeNetConvPoolLayer(object):
10.
def
__init__(self,
rng,
input,
filter_shape,
image_shape,
poolsize=(2,
2)):
11.
12.#assert
condition,condition为True,则继续往下执行,condition为False,中断程序
13.#image_shape[1]和filter_shape[1]都是num
maps,它们必须是一样的。
14.
assert
image_shape[1]
==
filter_shape[1]
15.
self.input
=
16.
17.#每个隐层神经元(即像素)与上一层的连接数为num
maps
*
height
width。
18.#可以用numpy.prod(filter_shape[1:
])来求得
19.
fan_in
numpy.prod(filter_shape[1:
])
20.
21.#lower
layer上每个神经元获得的梯度来自于:
output
width"
/pooling
size
22.
fan_out
(filter_shape[0]
numpy.prod(filter_shape[2:
/
23.
numpy.prod(poolsize))
24.
25.#以上求得fan_in、fan_out
,将它们代入公式,以此来随机初始化W,W就是线性卷积核
26.
W_bound
numpy.sqrt(6.
(fan_in
+
fan_out))
27.
self.W
theano.shared(
28.
numpy.asarray(
29.
rng.uniform(low=-W_bound,
high=W_bound,
size=filter_shape),
30.
dtype=theano.config.floatX
31.
),
32.
borrow=True
33.
)
34.
35.#
the
bias
is
a
1D
tensor
--
one
per
map
36.#偏置b是一维向量,每个输出图的特征图都对应一个偏置,
37.#而输出的特征图的个数由filter个数决定,因此用filter_shape[0]即number
filters来初始化
38.
b_values
numpy.zeros((filter_shape[0],),
dtype=theano.config.floatX)
39.
self.b
theano.shared(value=b_values,
borrow=True)
40.
41.#将输入图像与filter卷积,conv.conv2d函数
42.#卷积完没有加b再通过sigmoid,这里是一处简化。
43.
conv_out
conv.conv2d(
44.
input=input,
45.
filters=self.W,
46.
filter_shape=filter_shape,
47.
image_shape=image_shape
48.
49.
50.#maxpooling,最大子采样过程
51.
pooled_out
downsample.max_pool_2d(
52.
input=conv_out,
53.
ds=poolsize,
54.
ignore_border=True
55.
56.
57.#加偏置,再通过tanh映射,得到卷积+子采样层的最终输出
58.#因为b是一维向量,这里用维度转换函数dimshuffle将其reshape。
比如b是(10,),
59.#则b.dimshuffle('
x'
0,
'
))将其reshape为(1,10,1,1)
60.
self.output
T.tanh(pooled_out
self.b.dimshuffle('
))
61.#卷积+采样层的参数
62.
self.params
[self.W,
self.b]
∙定义隐含层HiddenLayer
这个跟上一篇文章《
DeepLearningtutorial(3)MLP多层感知机原理简介+代码详解》中的HiddenLayer是一致的,直接拿过来:
2.注释:
3.这是定义隐藏层的类,首先明确:
隐藏层的输入即input,输出即隐藏层的神经元个数。
输入层与隐藏层是全连接的。
4.假设输入是n_in维的向量(也可以说时n_in个神经元),隐藏层有n_out个神经元,则因为是全连接,
5.一共有n_in*n_out个权重,故W大小时(n_in,n_out),n_in行n_out列,每一列对应隐藏层的每一个神经元的连接权重。
6.b是偏置,隐藏层有n_out个神经元,故b时n_out维向量。
7.rng即随机数生成器,numpy.random.RandomState,用于初始化W。
8.input训练模型所用到的所有输入,并不是MLP的输入层,MLP的输入层的神经元个数时n_in,而这里的参数input大小是(n_example,n_in),每一行一个样本,即每一行作为MLP的输入层。
9.activation:
激活函数,这里定义为函数tanh
10."
11.class
HiddenLayer(object):
12.
n_in,
n_out,
W=None,
b=None,
13.
activation=T.tanh):
#类HiddenLayer的input即所传递进来的input
17.
注释:
18.
代码要兼容GPU,则必须使用
dtype=theano.config.floatX,并且定义为theano.shared
另外,W的初始化有个规则:
如果使用tanh函数,则在-sqrt(6./(n_in+n_hidden))到sqrt(6./(n_in+n_hidden))之间均匀
抽取数值来初始化W,若时sigmoid函数,则以上再乘4倍。
21.
#如果W未初始化,则根据上述方法初始化。
#加入这个判断的原因是:
有时候我们可以用训练好的参数来初始化W,见我的上一篇文章。
if
W
None:
25.
W_values
rng.uniform(
low=-numpy.sqrt(6.
(n_in
n_out)),
high=numpy.sqrt(6.
size=(n_in,
n_out)
activation
theano.tensor.nnet.sigmoid:
*=
4
35.
theano.shared(value=W_values,
name='
W'
36.
37.
b
numpy.zeros((n_out,),
b'
41.
#用上面定义的W、b来初始化类HiddenLayer的W、b
42.
#隐含层的输出
lin_output
T.dot(input,
self.W)
(
None
else
activation(lin_output)
50.
#隐含层的参数
∙定义分类器(Softmax回归)
采用Softmax,这跟《DeepLearningtutorial
(1)Softmax回归原理简介+代码详解》中的LogisticRegression是一样的,直接拿过来:
2.定义分类层LogisticRegression,也即Softmax回归
3.在deeplearning
tutorial中,直接将LogisticRegression视为Softmax,
4.而我们所认识的二类别的逻辑回归就是当n_out=2时的LogisticRegression
5."
6.#参数说明:
7.#input,大小就是(n_example,n_in),其中n_example是一个batch的大小,
8.#因为我们训练时用的是Minibatch
SGD,因此input这样定义
9.#n_in,即上一层(隐含层)的输出
10.#n_out,输出的类别数
LogisticRegression(object):
n_out):
14.#W大小是n_in行n_out列,b为n_out维向量。
即:
每个输出对应W的一列以及b的一个元素。
value=numpy.zeros(
(n_in,
n_out),
(n_out,),
33.#input是(n_example,n_in),W是(n_in,n_out),点乘得到(n_example,n_out),加上偏置b,
34.#再作为T.nnet.softmax的输入,得到p_y_given_x
35.#故p_y_given_x每一行代表每一个样本被估计为各类别的概率
36.#PS:
b是n_out维向量,与(n_example,n_out)矩阵相加,内部其实是先复制n_example个b,
37.#然后(n_example,n_out)矩阵的每一行都加b
self.p_y_given_x
T.nnet.softmax(T.dot(input,
self.b)
40.#argmax返回最大值下标,因为本例数据集是MNIST,下标刚好就是类别。
axis=1表示按行操作。
self.y_pred
T.argmax(self.p_y_given_x,
axis=1)
43.#params,LogisticRegression的参数
到这里,CNN的基本”构件“都有了,下面要用这些”构件“组装成LeNet5(当然,是简化的,上面已经说了),具体来说,就是组装成:
LeNet5=input+LeNetConvPoolLayer_1+LeNetConvPoolLayer_2+HiddenLayer+LogisticRegression+output。
然后将其应用于MNIST数据集,用BP算法去解这个模型,得到最优的参数。
(3)加载MNIST数据集(mnist.pkl.gz)
2.加载MNIST数据集load_data()
3."
4.def
load_data(dataset):
5.
#
dataset是数据集的路径,程序首先检测该路径下有没有MNIST数据集,没有的话就下载MNIST数据集
#这一部分就不解释了,与softmax回归算法无关。
7.
data_dir,
data_file
os.path.split(dataset)
data_dir
and
not
os.path.isfile(dataset):
9.
Check
dataset
in
data
directory.
new_path
os.path.join(
os.path.split(__file__)[0],
.."
data"
os.path.isfile(new_path)
or
mnist.pkl.gz'
:
(not
os.path.isfile(dataset))
urllib
origin
http:
//www.iro.umontreal.ca/~lisa/deep/data/mnist/mnist.pkl.gz'
Downloading
from
%s'
%
urllib.urlretrieve(origin,
dataset)
...
loading
data'
28.#以上是检测并下载数据集mnist.pkl.gz,不是本文重点。
下面才是load_data的开始
30.#从"
mnist
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CNN 卷积 神经网络 原理