從頭學習大數據培訓課程 hadoop,mapreducer 分散式計算框架(二) Windows 偽分散式環境部署
1. mapreducer shuffle過程回顧

2. 需要的軟體
https://github.com/steveloughran/winutils
winutils-master
以下內容回帖刷新可見………………
編譯之後的hadoop2.7.3的tar包
3. 把hadoop和winutils解壓
4. 複製解壓之後的winutils文件
複製到解壓之後的hadoop文件夾的bin目錄裡面,不要覆蓋已存在的文件


5. 在WINDOWS上配置環境變數
(1).HADOOP_HOME

(2).把hadoop的bin和sbin配置到path環境變數里
;%HADOOP_HOME%bin;%HADOOP_HOME%sbin;
6. 設置hadoop配置文件
core-site.xml

hdfs-site.xml

maprd-site.xml

yarn-site.xml

hadoop-env.cmd

把修改好的配置文件覆蓋hadoop-2.7.3etchadoop目錄

7. 測試hadoop命令
打開cmd輸入set查看設置的環境變成是否生效

輸入hadoop version查看hadoop的版本

8. 格式化namenode
hadoop namenode -format

9. 啟動dfs
start-dfs.cmd 之後彈出兩個窗口
namenode
datanode

之後在電腦上的c盤就能看到tmp目錄,裡面有namenode文件和datanode文件
啟動成功之後就可以查看hdfs的web頁面

10. 啟動yarn
start-yarn.cmd之後彈出兩個窗口
resourceManager
nodeManager

查看yarn的web界面

11. 測試hdfs是否好用

12. 開啟和關閉
start-all.cmd開啟hadoop
stop-all.cmd關閉hadoop更多學習資料:海牛大數據社區
推薦閱讀:
※Hadoop 一般用在哪些業務場景?
※MooseFS和Hadoop兩個分散式文件系統各有什麼優缺點?
※Kafka 2017技術峰會摘要(pipeline分類)
※Spark編程有哪些有用技巧?
※想轉行做大數據技術相關的工作,需要學習語言還是學什麼?
