ホーム > Hadoop
Hadoop
Hadoopとは
Hadoopとは大規模なデータを複数のコンピュータに分散する多mのオープンソースソフトウェアである。
このソフトはGoogleによって公開された「MapReduce」と「GFS」の技術を元にしている。
MapReduceは1つのプログラムを複数のマシーンに分散/処理させるMapと分散した結果を集約するReduceがセットになって提供されている。
GFSは分散処理のファイルデータがストレージの際大容量を超えても扱えるためのファイルシステムで
HadoopにはHDFSと言う名前で使われている。
現在、HadoopはApacheプロジェクトによって運営されており、Hadoopの関連パッケージも登場している。
- Pig
- Hive
- Chukwa
- HBase
- Avro
- ZooKeeper
- Core(common)
このページのURL: