ClouderaのHadoop(CDH4.3.0)を簡単に試す方法

ClouderaのCDH4.3.0のHadoopを簡単に試す

HadoopやHDFSやHBase、さらにはHiveやImparaの勉強はしたくても手始めに何を始めたらいいのか迷う方は沢山いると思います。でも、心配いりません。ClouderaではQuick Start VMとして、VMwareやKVMやVirtualBoxに対応したCloudera関連のパッケージがつまったVMを配布しています。このVMを使えば、5分〜10分くらいでClouderaのHadoop開発環境や検証環境(CDH4.3.0)を仮想環境に構築することができます。

ClouderaのVMをダウンロードするには

まず、Cloudera Quick Start VMのページにアクセスします。そこで、VMware、KVM、VirtualBoxなど使用している仮想環境に応じたVMファイルをダウンロードします。

Cloudera QuickStart VM - Cloudera Support(1)

私はVirtualBox対応のVMをダウンロードしました。

ClouderaのVMを起動可能な状態にする

VirtualBoxの「仮想アプライアンスのインポート」から先ほどダウンロードしたVMを指定します。これで設定が読み込まれてVMが起動可能な状態になります。メモリは4GB以上にしておいた方が無難でしょう。

06015815eac0fb2d8893795dd61f267c

起動させると普通のCentOSの起動画面が出てきます。その後、起動が完了すると以下の画面が表示されます。

2ef8d72ab5b5d4f3db129de0349d83cc

これでインストールは完了です。

CDH4.3.0のHUeやImparaもいじれます

2f54804edca105dc222be3b286ab32ea

Flume、HBase、HDFS、Hive、Hue、Imparaなどがこの管理画面でスタート・ストップできます。

7ce7cb450db1f73102fe9b5b31f1e746

Hueのログイン画面。ID・パスワードは「admin」「admin」。

030c9022ba0b297bb9c301a66cace33b

Hueの管理画面。

テスト環境にもってこいですね。HBaseの場合は擬似クラスタをつくったり色々検証する手続きが面倒でしたが、これならば簡単にCDH4.3.0の検証・開発環境を構築できます。