跳过主要导航

如何使用数据挖掘来预测未来?

伊恩·维滕(Ian Witten)介绍了本周的第一个大问题

对不起,但是您无法真正使用数据挖掘来预言未来。☹️

我们要看的是一种称为“时间序列数据”的特定数据。这涉及一个属性或属性,通常是数字,其价值随着时间的推移而演变。每个实例都有一个时间戳记 - 可能会定期间隔也可能不会间隔。

我们经常使用线性回归来推断属性的价值为将来的实例。您会问,这不是平凡吗?- 直线外推。而且,您可能会感到惊讶(作为我),了解到有一些简单的方法可以增强数据集以允许其使用线性回归来对周期性现象进行建模。手动增强数据集是一种令人沮丧的体验,我们将学习如何使用WEKA的时间序列预测软件包,该软件包可以自动化此功能和其他相关功能。在一周内,您将分析历史航空公司的客运数据和葡萄酒销售。(不幸的是,您没有喝酒。)

本周,我们关于数据挖掘应用程序的周末示例是关于从红外数据中推断土壤样品的性质。我们还将研究数据挖掘应用程序的一些一般挑战。

在本周结束时,您将能够解释“滞后变量”在时间序列分析中的作用。您将在使用WEKA的时间序列预测软件包方面经验丰富,并能够与每小时,每日,每周,每月和每年的数据一起使用。您会了解,标准的坚持和交叉验证方法根本不适合时间序列,并且知道该怎么做。您将能够解释什么是“覆盖数据”以及它的价值。哦,是的,您将拥有更多的多年生问题的经验过度拟合,以及如何检测它。

本文来自免费的在线免费

使用WEKA的高级数据挖掘

由...制作
FutureLearn-终身学习

我们的目的是改变接受教育的机会。

我们提供来自世界各地的大学和文化机构的各种课程。这些一次是一次交付的一步,并且可以在移动,平板电脑和台式机上访问,因此您可以适合自己的生活。

我们认为,学习应该是一种愉快的社交经验,因此我们的课程为您提供了与他人一起讨论的机会,帮助您做出新的发现并形成新的想法。
您可以通过订阅我们无限制的包裹来解锁新的机会,以无限制地访问数百种在线短课程。电竞博彩app有什么通过顶尖的大学和组织建立知识。dota2竞猜吧

了解有关FutureLearn如何转化接受教育的更多信息