ホーム > Hadoop

Hadoop

Hadoopとは

Hadoopとは大規模なデータを複数のコンピュータに分散する多mのオープンソースソフトウェアである。
このソフトはGoogleによって公開された「MapReduce」と「GFS」の技術を元にしている。
MapReduceは1つのプログラムを複数のマシーンに分散/処理させるMapと分散した結果を集約するReduceがセットになって提供されている。
GFSは分散処理のファイルデータがストレージの際大容量を超えても扱えるためのファイルシステムで
HadoopにはHDFSと言う名前で使われている。
現在、HadoopはApacheプロジェクトによって運営されており、Hadoopの関連パッケージも登場している。

  • Pig
  • Hive
  • Chukwa
  • HBase
  • Avro
  • ZooKeeper
  • Core(common)
このページを共有:
  • このページをはてなブックマークに追加 このページを含むはてなブックマーク
  • このページをlivedoor クリップに追加 このページを含むlivedoor クリップ
  • このページをYahoo!ブックマークに追加
  • このページを@niftyクリップに追加
  • このページをdel.icio.usに追加
  • このページをGoogleブックマークに追加

このページのURL:

TOP