具备Linux及Hadoop基础或对Spark开发感兴趣的人群。
Spark是目前比较流行的大数据处理框架,以简单、易用、性能卓越著称。丰富的程序接口和库文件也使得Spark成为业内数据快速处理和分布式机器学习的必备工具。
学习目标:
1.了解Spark的组件和应用场景 ;
2.能够部署Spark Standalone模式 ;
3.能够使用Spark进行交互式开发 ;
4.能够发布独立应用程序并使用spark-submit 提交 。
学习建议:
建议先熟悉linux基本操作,了解eclipse基本的使用。
下载资料:有