跳过主要导航

什么是机器学习模型?

在本文中,我们将解释什么是机器学习模型,以及如何开发和评估它们。
机器学习图像
©约克大学

什么是机器学习模型?

机器学习模型是应用统计/数学技术的程序或文件,以识别数据中存在的某些类型的模式。

该模型通过使用数据进行训练的经验来学习和改进,还可以从错误中学习。在训练阶段之后,可以将结果模型用于类似于用于培训的数据,但从未见过该模型。

例如,训练有素的模型可以在一组数据上训练脑癌,然后在医院使用以识别新图像的乳腺癌,因为癌细胞的结构非常相似。

扮演至关重要的角色

机器学习模型在自主系统(例如自动驾驶汽车)的许多关键特征中起着至关重要的作用。例如,机器学习模型可用于识别行人在交叉处或穿越街道时。

显然,准确地识别行人对确保整个自动驾驶汽车的安全行为产生重大影响。因此,至关重要的是,该系统具有准确的模型,可以在该模型上进行基于此识别。

分类和回归

模型学习的机制类似于人类学习的方式以及用于模拟人脑工作方式的技术。

机器学习模型可以解决各种各样的问题,这些问题可以分为两个更广泛的类别:分类回归

分类

在一个分类问题,该模型可以预测图像可能属于哪个类别的类别,应用标签识别不同类别的物体的标签 - 例如,不同类型的行人接近穿越(例如,儿童,成人,骑自行车的人)。

回归

在一个回归问题,该模型预测数字价值,例如,在伦敦不同地区的房屋价格可能销售价格。

监督和无监督的学习

这些类型的问题可以通过采用不同的学习范式(如受监督和无监督的学习)来解决。

监督学习

监督学习,在训练阶段,该模型从一组由一对输入/输出组成的数据中学习(例如,行人/类型的行人图像)。基于它学到的知识,它可以预测新数据的输出。

无监督的学习

无监督的学习,在训练阶段考虑的数据仅由输入组成,该模型在输入中学习了相似的模式。无监督学习的流行用途是聚类,其中模型将数据示例分组在不同类别中。

培训数据和测试数据

模型试图解决的任何问题以及我们决定使用的任何学习范式,最关键的选择都是模型将学习的数据集。

在模型开发过程中,通常使用两组数据:培训数据测试数据

培训数据

培训数据集合用于学习模式并解决特定问题。

测试数据

测试数据然后,SET用于评估该模型从所学到的知识中概括的能力,从而评估其在训练阶段从未见过的数据的性能。

该模型的概括能力非常重要,因为它可以感觉到该模型在现实世界数据上的性能。

验证数据

创建模型并在测试集上的性能被认为令人满意之后,我们需要使用名为的第三个数据集验证模型验证数据

验证数据包括由边缘案例和已知模型的案例组成的数据样本,该模型是为了诱导模型中的错误并测试其稳健性的原因。

对模型的验证非常重要,以确保模型在现实世界中部署时在困难的情况下也可以很好地发挥作用。这一方面对于确保模型的行为安全并在遇到罕见情况(例如穿着鸭子西装的人)时正确检测到对象至关重要。

正式验证

在某些情况下,对模型的验证也可以正式进行,以数学公式将确定的属性转换,可以正式证明。

正式验证是首选的,因为它提供了一种数学上证明模型的方法,但是不幸的是,很难将现实世界属性转化为数学公式。

即使有可能,将结果映射到相关的上下文信息也可能具有挑战性:例如,很难看到像素值的变化与它所代表的环境条件中的更改之间的连接。

©约克大学
本文来自免费的在线免费

智能系统:深度学习和自主系统简介

由...制作
FutureLearn-终身学习

我们的目的是改变接受教育的机会。

我们提供来自世界各地的大学和文化机构的各种课程。这些一次是一次交付的一步,并且可以在移动,平板电脑和台式机上访问,因此您可以适合自己的生活。

我们认为,学习应该是一种愉快的社交经验,因此我们的课程为您提供了机会,可以与他人一起讨论您所学的东西,帮助您做出新的发现并形成新的想法。
您可以通过订阅我们无限制的包裹来解锁新的机会,以无限制地访问数百种在线短课程。电竞博彩app有什么通过顶尖的大学和组织建立知识。dota2竞猜吧

了解有关FutureLearn如何转化接受教育的更多信息