ところが,一度通常のHadoopをインストールしていると,どうも動きがおかしいということが分かったので,いっそOSから再インストール.
参考URL
http://www.ne.jp/asahi/hishidama/home/tech/apache/hadoop/hadoopCDH3.html
まずは,yumでCDHがダウンロードできるようにリポジトリを更新.
# cd /etc/yum.repos.d/
# wget http://archive.cloudera.com/redhat/cdh/cloudera-cdh3.repo
# yum update yum
次に,Hadoopをインストール.
# yum install hadoop-0.20
実行してみたら,エラー.何かと思ったら,
JAVAをインストールしていなかったw
素直にsun.javaからインストール.
rpmなら何も考えずにインストール可能.
次に実行したら,今度はホスト名が見つからないと怒られたので,
/etc/host
にホスト名を追加
最後に,
Hadoopの擬似分散モード用設定ファイル集のダウンロード
# yum -y install hadoop-0.20-conf-pseudo
# alternatives --display hadoop-0.20-conf
# alternatives --config hadoop-0.20-conf
で,
conf.pseudoを選択
最後に無事動いたかどうかを確認.
$ hadoop jar /usr/lib/hadoop/hadoop-*-examples.jar pi 4 2000
無事実行完了
ちなみに,実行中は
で,namenode情報
http://localhost:50030
で,MapReduce情報
を見ることが可能.
ちょっと重たいものを走らせてMapReduce情報を見ると,ちゃんと進行状況が分かって面白い.
通常版はインストールにめちゃめちゃ手間取ったけど,CDH版は一瞬でインストール完了.
さて,これから色々遊んでみよう.
0 件のコメント:
コメントを投稿