• Packt标志
  • FutureLearn标志

介绍使用Hadoop大数据分析

磨练你的数据分析技能和提高你的工作流,您将了解如何存储,使用Hadoop大数据分析,和规模。

一个女人点紫色背景色彩鲜艳的条形图。
  • 持续时间

    3周
  • 每周学习

    2小时
  • 高级课程

    79美元 包括什么?

学习如何使用Hadoop生态系统

理解Hadoop是一个非常有价值的技能对于任何处理大量的数据。公司如亚马逊,eBay、Facebook、Google、LinkedIn、Spotify和Twitter使用Hadoop以某种方式来处理大量的数据。

在这三个星期的课程,您将熟悉Hadoop的生态系统和理解如何应用Hadoop技能在现实世界中。

探索历史和Hadoop的关键术语,然后将演练在桌面上安装过程来帮助你开始。

探索Hadoop分布式文件系统(HDFS)

与固体介绍Hadoop,您将了解如何管理大数据集群上使用Hadoop分布式文件系统(HDFS)。

你也会发现MapReduce理解它是什么和如何使用它之前到Hadoop编程与猪和火花。

与这方面的知识,你就可以开始分析数据在Hadoop。

了解MySQL和NoSQL

接下来,您将学习如何做更多的与你的数据作为您了解如何存储和查询数据。帮助你做到这一点,您将学习如何使用应用程序如Sqoop、蜂巢,MySQL,菲尼克斯,MongoDB。

开发核心数据分析技能

最后,你会磨练你的数据分析师技能通过学习如何查询数据交互。你也会得到很快的概述和学习如何安装,以确保您可以快速查询任意大小的数据。

课程结束后,你将有能力有效地处理大数据使用Hadoop并能简化流程。

跳到0分1秒演讲者:大数据是件大事。学习基本的Hadoop和大数据分析在三个短周。学习一切Hadoop的专家。让弗兰克·凯恩从假日教育介绍你认识,这是大数据分析。本课程旨在帮助您使用Hadoop分布式文件系统,描述MapReduce,使用Hadoop猪和火花,使用Hadoop关系和非关系数据存储,处理Hadoop愉快。学习在任何地方在任何速度。进入你的未来与大数据分析概论Hadoop Packt和FutureLearn。

教学大纲

  • 星期1

    Hadoop和使用HDFS的介绍

    • 介绍课程

      欢迎使用Hadoop介绍大数据分析,开始你的学习旅程,由Packt。

    • Hadoop概论

      在这个活动中,我们将讨论如何安装Hadoop, Hortonworks和Cloudera合并的影响,一个Hadoop的概述和历史和Hadoop生态系统。

    • 使用Hadoop分布式文件系统(HDFS)

      在这个活动中,我们将讨论Hadoop分布式文件系统(HDFS),安装MovieLens数据集,数据集安装到HDFS使用命令行和MapReduce。

    • 使用Hadoop的核心:MapReduce

      在这个活动中,我们将讨论MapReduce, MapReduce分布处理和MapReduce的例子。

    • 使用Hadoop的核心:锻炼活动和挑战

      在这个活动中,我们将探索Python MRJob, Nano和MapReduce工作。我们还将描述如何排电影的受欢迎程度,检查我们的结果。

    • 总结

      你已经达到了第一周的结束。在这个活动中,您将反思所学到的东西。

  • 星期2

    Hadoop编程与猪和火花

    • 介绍第2周

      欢迎来到第二周。在这个活动我们将强调将本周的主题。

    • 介绍编程Hadoop猪

      在这个活动中,我们将讨论和介绍洋麻和介绍猪。我们还将猪适用于一个活动。

    • 猪继续

      在这个活动中,我们将详细讨论猪和猪适用于运动的一个挑战。

    • Hadoop编程与火花

      在这个活动中,我们将讨论与火花Hadoop,弹性分布式数据集(抽样),使用抽样。

    • 2.0数据集和火花

      在这个活动中,我们将讨论数据集和火花2.0。

    • 总结

      周2的你已走到了尽头。在这个活动中,您将反思所学到的东西。

  • 星期3

    使用Hadoop使用关系和非关系数据存储

    • 介绍周3

      欢迎到星期3。在这个活动我们将强调将本周的主题。

    • 第1部分使用Hadoop使用关系数据存储

      在这个活动中,我们将讨论什么是蜂巢,蜂巢是如何工作的。

    • 第2部分使用Hadoop使用关系数据存储

      在这个活动中,我们将讨论使用Hadoop将MySQL。我们将描述安装MySQL和导入数据并使用Sqoop导入和导出数据。

    • 使用Hadoop的非关系数据存储(1)

      在这个活动中,我们将讨论NoSQL和HBase。

    • 使用Hadoop的非关系数据存储(2)

      在这个活动中,我们将讨论卡桑德拉,安装卡桑德拉和写作火花输出到卡桑德拉。

    • 使用Hadoop的非关系数据存储(3)

      在这个活动中,我们将讨论MongoDB,将MongoDB与火花和使用MongoDB shell。

    • 总结

      你已经达到了3周的最后一天。在这个活动中,您将反思所学到的东西。

你想什么时候开始?

马上开始,加入全球学习者的课堂。如果课程还没有开始你会看到未来的日期下面列出。

学习这门课程

在过程的每一步你可以遇到其他学习者,分享你的想法和加入活跃在评论中讨论。

你能得到什么呢?

课程结束后,你将能够……

  • 讨论了Hadoop分布式文件系统。
  • 描述MapReduce。
  • 练习使用Hadoop和猪。
  • 练习使用Hadoop与火花。
  • 使用Hadoop演示使用关系数据存储。
  • 使用Hadoop演示使用非关系数据存储。

这门课程是为谁设置的?

本课程是专为那些使用大数据。

你不需要任何经验使用Hadoop将从最基本的开始。

你需要什么软件或工具?

在本课程中,我们将向您展示如何在您的操作系统上安装Hadoop环境。

谁开发的课程?

Packt

在英国伯明翰,成立于2004年,Packt的使命是帮助世界将软件以新的方式工作,通过有效的学习和信息服务的交付IT专业人员。

FutureLearn

FutureLearn是一个领先的社会学习平台,为学习者提供高质量的网络课程在世界各地在过去的十年。电子竞技公开赛

包括什么?

这是一个高级课程。这些课程是为专业人士设计从具体行业寻求学习和一个小群志趣相投的人。

  • 无限制地这门课
  • 包括任何文章、视频、同行评审和测验
  • 成就证书来证明你的成功当你有资格
  • 随时下载和打印你的成绩证书

还想知道更多吗?检查我们的常见问题

学习FutureLearn

你的学习,你的规则

  • 课程分为几周,活动,和步骤来帮助你跟踪你的学习
  • 通过混合学习的视频,长期和短小精悍的文章,音频,和实践活动
  • 保持动力通过进步页面记录你的步骤完成和评估分数

加入一个全球教室

  • 体验社会学习的力量,启发学习者的国际网络
  • 分享想法与你的同行和教育者在过程的每一步
  • 喜欢加入谈话通过阅读,@,书签和回复别人的评论

地图你的进步

  • 当你通过工作时,使用通知和指导你的学习进度页面
  • 只要你准备好了,每一步都标记为完成,你在控制
  • 完成90%的课程和所有的评估步骤取得证书

想知道更多关于学习FutureLearn吗?盖世电竞里钱如何提现

你知道一个人会爱这门课吗?告诉他们…