《Accessing Hadoop Data Using Hive》第三章Hive DML問題集
02-05
1.如何把數據導入到HIVE?
推薦閱讀:
第一種,從本地文件導入:

第二種:從hdfs導入


第一種:直接拷貝hdfs數據(如果已經是你需要的格式的話)
第二種:可以通過HIVE導出到本地或hdfs

注意有些是和SQL有區別的。





Join時大表應該放在右邊。原因是會把左邊的小表放到內存中,右邊的大表在硬碟中。




4.什麼是map join?
5.什麼是bucket map join?
推薦閱讀:
※Hive On Spark, SparkSQL On Spark, 與Spark On YARN如何定義呢?
※為何Hive中的數據不均勻分布會導致數據傾斜?
※《Accessing Hadoop Data Using Hive》第一章Introduction To Hive問題集
※在Hive中適不適合像傳統數據倉庫一樣利用維度建模?
TAG:Hive |
