- 相關(guān)推薦
Hadoop并非完美:8個代替 HDFS 的絕佳方案
HDFS(Hadoop Distributed File System)是Hadoop項目的核心子項目,是分布式計算中數(shù)據(jù)存儲管理的基礎(chǔ),坦白說HDFS是一個不錯的分布式文件系統(tǒng),它有很多的優(yōu)點,但也存在有一些缺點,包括:不適合低延遲數(shù)據(jù)訪問、無法高效存儲大量小文件、不支持多用戶寫入及任意修改文件。
Apache軟件基金會成立的時候,HDFS就一直在想辦法提高它的性能和可用性,坦白說,這也許對試點項目、非常規(guī)項目、要求不嚴格的大環(huán)境中比較適用,但是對于某些Hadoop用戶來說,他們對于性能、可用性、企業(yè)級特性有較高的要求,且注重直接附加存儲(DAS)架構(gòu),特別是老版本的Hadoop沒有高性能的主節(jié)點,那么接下來8個產(chǎn)品就是代替HDFS的絕佳方案。
1.Cassandra(DataStax)
并非一個完全的文件系統(tǒng),而是一個開源、NoSQL 鍵值(key-value)商店。這給依靠快速數(shù)據(jù)訪問的Web 應(yīng)用多了一個HDFS選擇。簡單來說它把Hadoop融合在Cassandra里面,支持Web應(yīng)用通過Hadoop快速訪問數(shù)據(jù), 而Hadoop可以快速訪問流入Cassandra的數(shù)據(jù)。
2.Ceph
Ceph 是一個開源、多管齊下的操作系統(tǒng),因為其高性能并行文件系統(tǒng)的特性,有人甚至認為它是基于Hadoop環(huán)境下的HDFS的接班人,因為自2010年就有研究者在尋找這個特性。
3.Cleversafe:分散存儲網(wǎng)絡(luò)
本周一Cleversafe宣布將融合Hadoop的并行編程技術(shù)和自己的分散存貯網(wǎng)絡(luò)。其原理是通過把整個元數(shù)據(jù)分布在集群中(不是依靠單個主節(jié)點、不是依靠復(fù)制),Cleversafe表示這比HDFS更快、更穩(wěn)定、更具擴展性。
4.GPFS(IBM)
IBM一直在向高性能要求的用戶銷售其并行文件系統(tǒng),包括世界上最快的超級電腦,2010年它推出了基于Hadoop的GPFS, 并宣布GPFS不共享集群版本比Hadoop快多了,因為
它在內(nèi)核級別中運行,而不是在操作系統(tǒng)中運行例如HDFS。
5.Isilon(EMC)
EMC提供Hadoop發(fā)行版已經(jīng)一年了,但2012年1月轉(zhuǎn)型為HDFS企業(yè)級別的新方案Isilon 的 OneFS文件系統(tǒng)。因為Isilon可以讀取 NFS, CIFS以及 HDFS 協(xié)議, 一個單獨的 Isilon NAS系統(tǒng)可以攝入、處理、分析數(shù)據(jù)。
6.Lustre
HPC存儲提供商Xyratex 增在2011年的一份報道中寫到, 基于Lustre的集群會比基于HDFS的集群更快更便宜。
7. MapR文件系統(tǒng)
MapR 文件系統(tǒng)在業(yè)內(nèi)已經(jīng)具有一定知名度了,不僅MapR宣布它自己的文件系統(tǒng)比HDFS快2-5倍(實際上有20倍),它還具有鏡像、快照、高性能這些企業(yè)用戶喜歡的特點。
8.NetAppHadoop開放方案
NetApp重新改版了物理Hadoop結(jié)構(gòu):把HDFS放在磁盤陣列中,通過這樣來達到更快、更穩(wěn)定、更安全的Hadoop工作。
[Hadoop并非完美:8個代替 HDFS 的絕佳方案]相關(guān)文章:
【Hadoop并非完美:8個代替 HDFS 的絕佳方案】相關(guān)文章:
其實并非這樣作文06-04
其實并非這樣作文5篇06-04
cpu散熱硅膠可以用什么代替05-24
我的完美哲學(xué)作文07-03
演講如何完美收尾04-27
完美戚風(fēng)的做法步驟02-10
我不是完美小孩作文07-01
澄粉是什么粉-澄粉可以用什么代替08-04
我的完美哲學(xué)作文3篇07-31