跳过主导航

新的报价!得到30%的每月前2个月无限。开始你的订阅的£29.99£19.99。新用户。条例适用

了解更多

对未来的搜索

对未来的搜索(06:02)
9
所以,让我们开始下面是一个例子的研究托拜厄斯和我一直在做这个新的大数据。我们已经特别着迷是数据从互联网。所以人们在谷歌上找数据,数据页什么人在维基百科上看,或者谁跟谁在推特上的数据为例。让我们开始来自谷歌的数据。这些数据集是特别令人兴奋的其全球广度。我们从未有过一个机会来衡量什么世界各地的人们感兴趣的信息。但它是很难在国家之间比较这些数据,因为人们在不同的国家在不同的语言中搜索。
60.4
在法国人在法国可能搜索的例子。人在德国可能在德国搜索。有一天,托拜厄斯,我和我们的合作者,斯蒂芬•斯坦利主教和基因有灵感的时刻。我们意识到有一件事几乎普遍语言之间。在阿拉伯数字,2014年,2015年,2013年为例。使用数据从2010年开始,所以我们认为所有国家都有超过500万的互联网用户。我们测量了多久他们寻找第二年,2011年,和频率搜索,2009。在这张地图上,国家颜色的蓝色是搜索更多的第二年,2011年。
119.4
国家颜色的红色正在寻找更多的前一年,2009年。灰色的国家的国家没有足够的互联网用户对我们进行这种分析。如果你看看这张地图,你可能会承认一个模式。人生活在国家的蓝色,所以德国或瑞士或澳大利亚,例如,在全球背景下,往往是相对富裕。而住在国家颜色为红色,所以印度为例,同样,在全球背景下,不会那么富裕。所以我们很着迷于这种关系,想进一步的探索研究。
164.6
出于这个原因,我们计算所有45个国家在这项研究中,使用频率之间的比率的居民在一个特定的国家正在寻找明年的阿拉伯数字,2011年,阿拉伯数字,2009年和过去。这比我们所说的未来取向指数。当我们绘制未来取向指数对一个重要的经济变量,人均GDP,我们找到一个非常显著的关系,如这个图所示。所以未来取向指数之一,意味着我们记录在这个特定的国家相同数量的搜索明年的阿拉伯数字比过去一年的阿拉伯数字。
228.8
如果未来取向指数大于1,那么这意味着搜索明年的阿拉伯数字,2011年,占主导地位的关系,而未来取向指数小于1,当过去一年的阿拉伯数字,特别是搜索,主导的行为。我们发现这些45个国家集群的数据点在一条直线。事实上,我们发现一个重要的未来取向指数与人均GDP之间的相关性为0.78。我们想知道什么驱动这种行为,我们可以看到。我们提出了两个主要的假设。
289.1
假设第一,可能确实是一个关系到什么程度的人与未来和过去的和经济上的一个国家是如何做的。第二个假设,我们发现可能的行为反映了互联网基础设施可用到什么程度在全世界的国家。如果互联网基本上是跟随你到任何地方,你可以用它来组织你的日常生活环境几乎实时搜索未来的事件,而国家的互联网和互联网基础设施的水平只允许你也许查找历史事件。
345.8
这些是我们提出的两个假设第一个初步研究。这是我们想要与你分享,还有更多。

让我们开始,这里有一个例子的研究我们一直在做这个新的“大数据”。

一些我们一直是数据从互联网上特别着迷,比如我们在谷歌上搜索数据。这个数据是全球性的:我们从未有过一个机会来衡量世界各地的人们正在寻找什么信息。看这个视频找出这些数据我们发现,我们利用这一全球深度和挑战。

您将有机会下载和分析原始数据来自谷歌和维基百科,如果你愿意,通过练习,下周开始。

本文从免费在线

大数据:测量和预测人类的行为

FutureLearn——终身学习

达到你的个人和职业目标

解锁进入顶尖大学的数百名专家在线课程和学位和教育工作者获得认证资格和专业电子竞技公开赛CV-building证书。dota2竞猜吧

加入1800万多个学习者启动,开关或建立你的职业,都以自己的节奏,在广泛的领域。

现在开始学习