2012年7月10日火曜日

Hadoop再インストール

Hadoopのインストールにチャレンジ中だけど,どうも通常のHadoopをインストールするよりも,CDH(Cloudera's Distribution including Apache Hadoop)をインストールする方が色々良さそうなので,インストールを試みた.
ところが,一度通常のHadoopをインストールしていると,どうも動きがおかしいということが分かったので,いっそOSから再インストール.


参考URL
http://www.ne.jp/asahi/hishidama/home/tech/apache/hadoop/hadoopCDH3.html

まずは,yumでCDHがダウンロードできるようにリポジトリを更新.
# cd /etc/yum.repos.d/
# wget http://archive.cloudera.com/redhat/cdh/cloudera-cdh3.repo
# yum update yum

次に,Hadoopをインストール.
# yum install hadoop-0.20
実行してみたら,エラー.何かと思ったら,
JAVAをインストールしていなかったw

素直にsun.javaからインストール.
rpmなら何も考えずにインストール可能.

次に実行したら,今度はホスト名が見つからないと怒られたので,
/etc/host
ホスト名を追加

最後に,
Hadoopの擬似分散モード用設定ファイル集のダウンロード
# yum -y install hadoop-0.20-conf-pseudo

# alternatives --display hadoop-0.20-conf
# alternatives --config hadoop-0.20-conf
で,
conf.pseudoを選択

最後に無事動いたかどうかを確認.
$ hadoop jar /usr/lib/hadoop/hadoop-*-examples.jar pi 4 2000
無事実行完了
ちなみに,実行中は
で,namenode情報
http://localhost:50030
で,MapReduce情報
を見ることが可能.
ちょっと重たいものを走らせてMapReduce情報を見ると,ちゃんと進行状況が分かって面白い.
通常版はインストールにめちゃめちゃ手間取ったけど,CDH版は一瞬でインストール完了.
さて,これから色々遊んでみよう.



0 件のコメント: