当前位置:首页>开发>正文

hadoop 简介 Hadoop是什么

2023-04-10 13:36:07 互联网 未知 开发

hadoop 简介 Hadoop是什么

Hadoop是什么?

Hadoop是一个用于运行应用2113程序在大型集群的廉价硬件设备上的框架。Hadoop为应用程序透明的提供了一组稳定/可靠的接口和数据运动。5261在Hadoop中实现了Google的MapReduce算法,它能够把应用程序分割成许多很小的工作单元,每个单元可以在任何集群节点4102上执行或重复执行。此外,1653Hadoop还提供一个分布式文件版系统用来在各个计算节点上存储数据,并提供了对数据读写的高吞吐率。由于应用了map/reduce和分布式文件系统使得Hadoop框架具有高容错性,它会自权动处理失败节点。已经在具有600个节点的集群测试过Hadoop框架。

hadoop和spark是什么关系啊?

Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法。
优势应该在于分布式架构比较相似能快速上手吧

最新文章

随便看看