补交 04 08

发布时间:2022-06-27 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了补交 04 08脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。

04Hadoop思想与原理

 

1.Hadoop的介绍2.Hadoop是什么?3.Hadoop的起4.Hadoop的发展历史5.Hadoop的四大特性(优点)6.hadoop的历史版本介绍7.hadoop三大公司发型版本介绍8.hadoop的架构模型(1.x,2.x的各种架构模型介绍)

 

1.Hadoop的介绍

Hadoop最早起源于Nutch。Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页抓取、索引、查询等功能,但随着抓取网页数量的增加,遇到了严重的可扩展性问题——如何解决数十亿网页的存储和索引问题。2003年、2004谷歌发表的两篇论文为该问题提供了可行的解决方案。——分布式文件系统(GFS),可用于处理海量网页的存储——分布式计算框架MAPredUCE,可用于处理海量网页的索引计算问题。Nutch的开发人员完成了相应的开源实现HDFS和MAPREDUCE,并从Nutch中剥离成为独立项目HADOOP,到2008年1月,HADOOP成为apache顶级项目(同年,cloudera公司成立),迎来了它的快速发展期。狭义上来说,hadoop就是单独指代hadoop这个软件,广义上来说,hadoop指代大数据的一个生态圈,包括很多其他的软件

 

补交 04 08

2.Hadoop是什么?

Hadoop: 适合大数据的分布式存储和计算平台Hadoop不是指具体一个框架或者组件,它是Apache软件基金会下用Java语言开发的一个开源分布式计算平台。实现在大量计算机组成的集群中对海量数据进行分布式计算。适合大数据的分布式存储和计算平台。Hadoop1.x中包括两个核心组件:MapReduce和Hadoop Distributed File System(HDFS)其中HDFS负责将海量数据进行分布式存储,而MapReduce负责提供对数据的计算结果的汇总

3.Hadoop的起源

2003-2004年,GOOGLE公布了部分GFS和MapReduce思想的细节,受此启发的Doug Cutting等人用2年的业余时间实现了DFS和MapReduce机制,使Nutch性能飙升。然后Yahoo招安Doug Gutting及其项目。2005年,Hadoop作为Lucene的子项目Nutch的一部分正式引入Apache基金会。2006年2月被分离出来,成为一套完整独立的软件,起名为HadoopHadoop名字不是一个缩写,而是一个生造出来的词。是Hadoop之父Doug Cutting儿子毛绒玩具象命名的。Hadoop的成长过程Lucene–>Nutch—>Hadoop

总结起来,Hadoop起源于Google的三大论文GFS:Google的分布式文件系统Google File SystemMapReduce:Google的MapReduce开源分布式并行计算框架BigTable:一个大型的分布式数据库

演变关系GFS—->HDFSGoogle MapReduce—->Hadoop MapReduceBigTable—->HBase

 

2.用图与自己的话,简要描述名称节点、数据节点的主要功能及相互关系。

答:名称节点:负责管理分布式文件系统的命名空间,里面包含了两个核心的数据结构,即FsImage和EdITLOG。FsImage用户文件树以及所有的文件和文件夹的元数据。EfitLog记录的是文件的增删改查。首次安装format格式化就是在本地生成FsImage。首次安装format格式化就是在本地生成FsImage。HDFS的更新都会被写入到FsImage中而不是EditLog,因为对于分布式而言,FsImage非常庞大,直接对FsImage速度非常慢。HDFS的更新都会被写入到FsImage中而不是EditLog,因为对于分布式而言,FsImage非常庞大,直接对FsImage速度非常慢。数据节点(DataNode):定期向名称节点发送自己的存储块的列表。数据节点(DataNode):定期向名称节点发送自己的存储块的列表。

因为HDFS文件会逐渐地变大,不断变大的EditLog文件通常不会对系统文件产生影响,但是当EditLog很大时,使得在HDFS重启时,将EditLog合并到FsImage中的过程十分缓慢,系统长期处于“安全模式”,用户的使用收到影响。

HDFS的第二名称节点(secondary NameNode)的作用:完成EditLog合并到FsImage的过程,缩短合并的重启时间,其次作为“检查点”保存元数据的信息。

补交 04 08

 

 

补交 04 08

 

08第八次作业

补交 04 08

补交 04 08

 

 

补交 04 08

 

脚本宝典总结

以上是脚本宝典为你收集整理的补交 04 08全部内容,希望文章能够帮你解决补交 04 08所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。