標籤：

《Accessing Hadoop Data Using Hive》第三章Hive DML問題集

02-05

1.如何把數據導入到HIVE？

第一種，從本地文件導入：

第二種：從hdfs導入

第三種，從Query導入：

2.如何從HIVE導出數據呢？

第一種：直接拷貝hdfs數據（如果已經是你需要的格式的話）

第二種：可以通過HIVE導出到本地或hdfs

3.常用的HQL？

注意有些是和SQL有區別的。

Join時大表應該放在右邊。原因是會把左邊的小表放到內存中，右邊的大表在硬碟中。

4.什麼是map join？

5.什麼是bucket map join？

推薦閱讀：

※Hive On Spark， SparkSQL On Spark, 與Spark On YARN如何定義呢？
※為何Hive中的數據不均勻分布會導致數據傾斜?
※《Accessing Hadoop Data Using Hive》第一章Introduction To Hive問題集
※在Hive中適不適合像傳統數據倉庫一樣利用維度建模？

TAG:Hive |