Hadoopクラスター構築実践ガイドのまとめ
上記の本を読破したので、要点を纏める。
Hadoopの参考資料
目次
この本の目次は以下。
第1章:ビッグデータ分析基盤の概要 ※30
第2章:Hadoopのシステム構成 ※30
第3章:ハードウェアの事前設定とHadoopのインストール ※70
第4章:Hadoopのクラスターの運用管理 ※70
第5章:Spark - SQL、ストリーミング、グラフデータの処理、分類器の利用 ※70
第6章:Hive/impala/HBase/Pig - データベース操作 ※50
第7章:Spoop/Flume -データのインポート/エクスポート ※30
第8章:Mahout - 機械学習(クラス分類と強調フィルタリング) ※20
「※{数値}」 はその章のページ数
個人的には3章・4章が特に読み応えありました。
また、ページ的にもボリュームが多いため、何度も読み返そうと思います。
3章・4章の抜粋
一番重要と思うところを抜粋しました。
本当に読みごたえがあるので、3回は読み返したいと思います。
ClusterShell
ClusterShellのコマンドにあたる「 clush 」というコマンドがとても多くでてきます。
ClusterShellについても、勉強をしていく必要があります。
ClusterShellの参考サイト
ClusterShellをインストールした。
ClusterShellで始めるSSHで並列・分散サーバー管理
雑記
上記でも書いたのですが、
サンプルコード等をコピペすることができない。
というのは、技術書だと電子書籍のよさが消えてしまっていると改めて感じました。
よいと思ってもらえたら、「スキ」をお願いします。
「スキ」は、継続の源泉です。
kindle unlimited
定額で様々な本が読み放題。特に技術書の入門編のものが読み放題なので、いつもお世話になっています。
amazon audible
時短で読書できるので、とても重宝しています。
いいなと思ったら応援しよう!
いつもサポートありがとうございます。
あなたの100円がモチベーションアップの起爆剤です。
毎日更新頑張ります
Twitterはこちら
https://twitter.com/7010Rei