Hadoop(一)-HDFS
HDFS(Hadoop Distirbuted File System)hadoop分布式文件系统。 原博客地址:http://blog.csdn.net/u013963380/article/details/61616046
1.HDFS的设计理念
- 存储大文件:这里的大文件是指GB甚至TB级别的文件
- 高效的访问模式:一次写入,多次读取(流式数据访问)
- 运行在普通廉价的服务器上:能运行在普通的硬件上,即使硬件出现故障,也可以通过容错策略来保证数据的完整性 注:由于HDFS是为高数据吞吐量应用而设计的,必然以高延迟为代价所以不会将hdfs用于对数据访问要求低延迟的场景;hdfs的元数据存储在namenode的内存中,而namenode是单节点,小文件的数量大到一定的程度,namenode的内存就吃不消,所以也不可用来存储大量的小文件。
