有一定Hadoop基础或对Hive感兴趣的人群。
Hive是基于Hadoop之上的数据仓库,可以将我们提交的Hive QL语句转换成MapReduce作业并提交到集群上去执行,那么Hive QL的编写就是非常重要的一个环节,那么对于Hive QL中的DDL和DML就是必须要掌握的基础;表的定义、数据导出以及常用的查询语句的掌握是完成大数据统计分析的基础。
学习目标:
1.了解什么是DDL和DML ;
2.能够进行Hive中数据库和表的DDL操作 ;
3.掌握Hive中表的DML操作 ;
4.掌握Hive中分区表的使用 ;
5.了解Hive中基本数据类型和复杂数据类型 。
学习建议:
1.Hive wiki中有非常详细的DDL和DML操作,建议详细阅读wiki中的内容;
2.分区表是提升Hive查询效率非常有效的方案,建议查阅网络上一些对于动态分区的文章。
下载资料:有