想自学大数据,不知道从哪里学起,有什么书籍和学习路线推荐么?

作为一名IT从业者,同时也是一名教育工作者,我来回答一下这个问题。
首先,要自学大数据还是具有一定难度的,大数据不仅内容比较多,难度比较高,同时还需要学习者具有一定的场景支撑,

本文最后更新时间:  2023-02-26 09:36:53

谢邀!笔者刚签约大数据挖掘工程师岗位,也是在研究生阶段才转为大数据方向。大数据目前正火热,很多同学想要转入,但学习路线对于自学的人来讲因人而异。

拿自身举例,笔者之前是Python数据分析出生,编程能力一般,因此在这个基础上先学习linux基本操作命令,安装ubuntu双系统并进一步安装Hadoop和Spark组件,在此基础上利用Pyspark操作Spark大数据框架进行学习。可以推荐如下书籍:

《Pyspark实战指南》

而要完全进入大数据领域还不够,因为大数据框架比较侧重开发,所以需要有scala语言功底(scala语言是Spark的原生语言),而scala语言跟JAVA关联性很强且完全兼容,所以如果有一定JAVA基础的话完全可以从scala入手,推荐的书籍如下:

《Spark编程基础(scala版)》

视频教程强烈推荐林子雨老师在MOOC慕课上的国家精品免费课程,由浅入深,非常容易上手。

温馨提示:内容均由网友自行发布提供,仅用于学习交流,如有版权问题,请联系我们。