跳过主导航

卷积神经网络是什么?

卷积神经网络(事先/ CNN)是一种深入学习算法,给定一个输入图像时,可以将价值或重要性分配给各个方面或对象的形象,能够区分一个从另一个。CNN的预处理要求远低于在其他分类算法。在过滤器是hand-engineered原始方法,有足够的训练,回旋网或者cnn学习能力这些过滤器/特征。
神经网络图像
©约克大学

一个卷积神经网络(事先/ CNN)深度学习算法,给定一个输入图像时,可以将价值或重要性分配给各个方面或对象的形象,能够区分一个从另一个。CNN的预处理要求远低于在其他分类算法。在过滤器是hand-engineered原始方法,有足够的训练,回旋网或者cnn学习能力这些过滤器/特征。

在这里我们将看看卷积神经网络更详细地看到它们是如何工作的。cnn的基石褶积层

张量

卷积层的输入是一个三维数组。在数学这叫一个顺序张量。张量有两个空间维度(H,高度和宽度,W)和一个功能维度包括一个或多个频道(C)特性的总体规模H x W x C输入图像的色彩,张大小H x W x 3,与C = 3通道存储红色,绿色和蓝色的颜色。输入图像灰度,将H x W x 1大小。

三维张量图像示例

在网络,我们通常会获得许多功能通道的数量在更深的卷积可能远远超过3层。

卷积层内部,我们商店一些重量。中长期规划与神经元的然而,我们不需要一个不同的重量为每个输入。相反,权重都存储在张量小过滤器内核。这是一个不同的空间大小的输入,但必须有相同数量的渠道作为输入。我们叫过滤器尺寸(H_f) x (W_f) x (C)。通常滤波器的空间维度远小于输入。

卷积

我们现在卷积输入的张量与每个过滤器。这涉及到定心过滤器在输入图像中的一个像素,然后结合滤波器中的值与图像中的值在该地区覆盖的过滤器。结合的价值观,我们只是把值在相应位置,并添加所有的产品。因此,卷积在一个位置产生一个输出值。

卷积矩阵

我们重复这个过程,滑动滤波器在图像从左到右,从上到下。我们得到一个输出值为每个像素位置,给我们两个空间维度输出。我们还为每个过滤重复整个过程,给我们一个输出通道的每个F层过滤器。

像素过滤动画

有一些设计决策当指定一个卷积层。这些决定了输出图像的大小:

  1. 多少我们应该把过滤器我们每一次幻灯片的图像吗?这就是所谓的。通常,我们移动一个像素,即跨= 1。
  2. 我们应该如何处理边界?如果我们希望中心在边界附近的像素或过滤器,过滤器可能超出输入张量。这是由填充。这需要我们决定我们应该使用什么值缺失的像素。通常,我们只是零(称为补零)或有时最接近的值复制到边界。

是一种很常见的设置一个卷积层(H_f = W_f = 3),跨步= 1和补零填充= 1。在一起,这意味着输出具有相同的空间维度作为输入。具体来说,H x W x F的产量大小。

像在一个延时,非线性激活函数卷积(最常见的是ReLU)应用于每一个输出。这是通常被认为是卷积层的一部分。

作为一个图像通过CNN,变得更加抽象的特性。在输入层,只是像素颜色值的特性。在输出层,我们提供了一个高层次的描述如图像中对象的类。出于这个原因,我们深入的空间分辨率通常减少网络。这是通过这一过程被称为池。我们只是更换一块像素(通常是一个2×2块)和一个值。这个值通常意味着平均或最大特征值在块中。使用最大(马克斯池)给了我们一些空间不变性:我们说我们不介意正是我们看到的一个特性,我们只是想知道如果它是礼物。

池矩阵

卷积神经网络

美国有线电视新闻网是由许多这样的结合卷积层,一个接一个。这些层的往往是一些完全连接层与ReLU激活直到最后一层所需的输出神经元和通常不ReLU激活。

作为一个具体的例子,一个非常有名的架构如下所示,从2015年VGG-16架构。你可以看到这有13个卷积完全连接层之后,3层,最后是一个输出层有1000个神经元(与1000种可能的类对象识别)。

卷积神经网络架构

引用

Karen Simonyan安德鲁Zisserman。很深的卷积网络大规模图像识别。在ICLR学报》上。2015年。

©约克大学
本文从免费在线

智能系统:介绍深度学习和自治系统

FutureLearn——终身学习

我们的目的是将受教育的机会。

我们提供多样化的选择来自著名大学的课程和来自世界各地的文化机构。这些都是一步一个脚印,并可以在手机、平板电脑和桌面,所以你可以学习你的生活。

我们认为学习应该是愉快的,社会经验,所以我们的课程提供了机会与他人讨论你的学习,帮助你作出新的发现和形成新的想法。
你可以解锁新的机遇与无限制地成百上千的在线短期课程一年通过订阅我们的无限的包。电竞博彩app有什么与顶尖大学和组织建立你的知识。dota2竞猜吧

了解更多关于如何FutureLearn正在改变的受教育机会