当前位置: 首页 / 技术干货 / 正文
大数据教程之Spark需要什么基础?

2020-10-15

大数据教程

  大数据教程之Spark需要什么基础?作为大数据主流框架之一的Spark,也是大数据开发人员必须要掌握的重要技术框架,在企业招聘当中,掌握Spark框架的大数据人才,也更加具备竞争优势。那么Spark需要什么基础?

大数据1

  首先,学习大数据,不管是Hadoop还是Spark,基本功都少不了LinuxJava。搭建集群环境,Linux基础是必须的,系统操作命令是基础中的基础。而Java,主要以JavaSE的知识为重点,包括面向对象、集合、io、多线程以及JDBC操作等,这部分是大数据开发当中常常需要用到的。

  其次,是要建立起大数据技术背景,对于大数据处理各个环节,以及对应的解决方案,系统框架要有基本的认识:

  1、数据采集:FlumeKafkaLogstashFilebeat...

  2、数据存储:MysqlRedisHbaseHDFS...

  3、数据查询:HiveElasticsearch...

  4、实时数据计算:StormSpark-streamingFlink...

  5、离线数据计算:HadoopSpark...

  6、其他框架:Zookeeper...

  有了这样的背景基础之后,开始Spark学习也能够更快地理解很多东西,特点建议在Spark学习之间要先对Hadoop框架有比较全面的认识,包括核心的HDFSMapReduceYarn等,这部分和Spark联系紧密,对于像Spark为什么计算性能优异,架构设计为什么会这样设计等等这样的问题,也能更快理解和消化。

  对于Spark框架的学习,Spark生态圈各组件需要着重掌握,包括Spark-coreSpark-streamingSpark-mlibSpark-graphx,刚开始学习的时候主要学习Spark-coreSpark-streamingSpark-mlibSpark-graphx可以等后期工作需要或者有时间了在研究即可。

  Spark需要什么基础?相信看完上面的介绍,大家也都有了基本的了解了。Spark作为大数据计算第二代引擎的代表,在越来越多的平台当中得以应用,可以这样说,想进入大数据行业,Spark是必须要掌握的。

大数据教程:http://www.goodprogrammer.org/studyline/bigdata.html

好程序员公众号

  • · 剖析行业发展趋势
  • · 汇聚企业项目源码

好程序员开班动态

More+
  • HTML5大前端 <高端班>

    开班时间:2021-04-12(深圳)

    开班盛况

    开班时间:2021-05-17(北京)

    开班盛况
  • 大数据+人工智能 <高端班>

    开班时间:2021-03-22(杭州)

    开班盛况

    开班时间:2021-04-26(北京)

    开班盛况
  • JavaEE分布式开发 <高端班>

    开班时间:2021-05-10(北京)

    开班盛况

    开班时间:2021-02-22(北京)

    开班盛况
  • Python人工智能+数据分析 <高端班>

    开班时间:2021-07-12(北京)

    预约报名

    开班时间:2020-09-21(上海)

    开班盛况
  • 云计算开发 <高端班>

    开班时间:2021-07-12(北京)

    预约报名

    开班时间:2019-07-22(北京)

    开班盛况
IT培训IT培训
在线咨询
IT培训IT培训
试听
IT培训IT培训
入学教程
IT培训IT培训
立即报名
IT培训

Copyright 2011-2023 北京千锋互联科技有限公司 .All Right 京ICP备12003911号-5 京公网安备 11010802035720号