了解更多关于这门课。

卷积神经网络是什么?

卷积神经网络(事先/ CNN)是一种深入学习算法,给定一个输入图像时,可以将价值或重要性分配给各个方面或对象的形象,能够区分一个从另一个。CNN的预处理要求远低于在其他分类算法。在过滤器是hand-engineered原始方法,有足够的训练,回旋网或者cnn学习能力这些过滤器/特征。

©约克大学

一个卷积神经网络(事先/ CNN)深度学习算法,给定一个输入图像时,可以将价值或重要性分配给各个方面或对象的形象,能够区分一个从另一个。CNN的预处理要求远低于在其他分类算法。在过滤器是hand-engineered原始方法,有足够的训练,回旋网或者cnn学习能力这些过滤器/特征。

在这里我们将看看卷积神经网络更详细地看到它们是如何工作的。cnn的基石褶积层。

张量

卷积层的输入是一个三维数组。在数学这叫一个顺序张量。张量有两个空间维度(H,高度和宽度,W)和一个功能维度包括一个或多个频道(C)特性的总体规模H x W x C输入图像的色彩,张大小H x W x 3,与C = 3通道存储红色,绿色和蓝色的颜色。输入图像灰度,将H x W x 1大小。

三维张量图像示例

想要保持
学习吗?

此内容来自
约克大学网络课程,

智能系统:介绍深度学习和自治系统

查看课程

在网络,我们通常会获得许多功能通道的数量在更深的卷积可能远远超过3层。

卷积层内部,我们商店一些重量。中长期规划与神经元的然而,我们不需要一个不同的重量为每个输入。相反,权重都存储在张量小过滤器或内核。这是一个不同的空间大小的输入,但必须有相同数量的渠道作为输入。我们叫过滤器尺寸(H_f) x (W_f) x (C)。通常滤波器的空间维度远小于输入。

卷积

我们现在卷积输入的张量与每个过滤器。这涉及到定心过滤器在输入图像中的一个像素,然后结合滤波器中的值与图像中的值在该地区覆盖的过滤器。结合的价值观,我们只是把值在相应位置,并添加所有的产品。因此,卷积在一个位置产生一个输出值。

卷积矩阵

我们重复这个过程,滑动滤波器在图像从左到右,从上到下。我们得到一个输出值为每个像素位置,给我们两个空间维度输出。我们还为每个过滤重复整个过程,给我们一个输出通道的每个F层过滤器。

像素过滤动画

有一些设计决策当指定一个卷积层。这些决定了输出图像的大小:

多少我们应该把过滤器我们每一次幻灯片的图像吗?这就是所谓的步。通常,我们移动一个像素,即跨= 1。
我们应该如何处理边界?如果我们希望中心在边界附近的像素或过滤器,过滤器可能超出输入张量。这是由填充。这需要我们决定我们应该使用什么值缺失的像素。通常,我们只是零(称为补零)或有时最接近的值复制到边界。

是一种很常见的设置一个卷积层(H_f = W_f = 3),跨步= 1和补零填充= 1。在一起,这意味着输出具有相同的空间维度作为输入。具体来说,H x W x F的产量大小。

像在一个延时,非线性激活函数卷积(最常见的是ReLU)应用于每一个输出。这是通常被认为是卷积层的一部分。

池

作为一个图像通过CNN,变得更加抽象的特性。在输入层,只是像素颜色值的特性。在输出层,我们提供了一个高层次的描述如图像中对象的类。出于这个原因,我们深入的空间分辨率通常减少网络。这是通过这一过程被称为池。我们只是更换一块像素(通常是一个2×2块)和一个值。这个值通常意味着平均或最大特征值在块中。使用最大(马克斯池)给了我们一些空间不变性:我们说我们不介意正是我们看到的一个特性,我们只是想知道如果它是礼物。

池矩阵