
閃存的疑惑 企業(yè)必須用PCIe閃存?
當我和正在研究在服務(wù)器端固態(tài)硬盤使用的用戶與廠商交談時,我發(fā)現(xiàn)許多人認為服務(wù)器固態(tài)硬盤必須是那種由比如Fusion-IO, Micron, Virident和LSI這樣的廠商制造的超高性能的SLC PCIe閃存卡。雖然人們非常清楚地知道售出的大多數(shù)固態(tài)硬盤是2.5英寸尺寸的設(shè)備,帶有SAS或SATA接口,他們似乎認為這些設(shè)備只適用于筆記本電腦和臺式機愛好者的。
當然,市場上大多數(shù)的SATA固態(tài)硬盤達不到嚴酷的數(shù)據(jù)中心應用,但是在Akbar and Jeff's Computer Hut賣的這種低價的固態(tài)硬盤與不計成本只求快的家伙生產(chǎn)的PCIe之間還有很多級別。大多數(shù)人都害怕他們要在磁盤陣列或服務(wù)器中安放固態(tài)硬盤,而且在某些時候它們會耗盡耐力并弄丟他們的全部數(shù)據(jù)。
我認為一部分問題是我們在數(shù)據(jù)中心的設(shè)備實際上已經(jīng)壞了好長時間了。如今的密封的硬盤在任何可以預見的方式下都不會用壞--它們只會偶然的出錯,大多數(shù)存儲系統(tǒng)把硬盤視為二元設(shè)備,要么工作正常,要么完全不能用。因此當一個驅(qū)動器有一頭前置放大器故障,它連接的RAID控制器會認為驅(qū)動器已經(jīng)損壞并停止使用。
固態(tài)硬盤寫入損耗不是不可預見的故障,但它是一個相對好理解的過程,固態(tài)硬盤里的閃存已經(jīng)被編程過并擦寫了足夠多次,由這個閃存的錯誤陣列開始超出閃存控制器的能力來改正這個錯誤。這種損耗不會一下發(fā)生在整個固態(tài)硬盤上,而是一個個地閃存頁,只有很少能維持正常運轉(zhuǎn)的閃存了。最終完全沒有空閑的閃存,固態(tài)硬盤就不能再寫入了。
多數(shù)閃存控制器很注意記錄它們覆蓋閃存每個頁的頻率,并可以通過智能診斷系統(tǒng)擴展報告給存儲系統(tǒng)多少寫壽命已經(jīng)被消耗。如果我能在閃存損耗將要出現(xiàn)問題的幾周或幾個月前就已經(jīng)知道,那么在它達到壽命的80%或90%的時候,更換它就是一件很容易的事情。
RAID控制器可以發(fā)送一個信息,SSD 14已經(jīng)達到了其壽命閾值,確定一個新的或空閑的固態(tài)硬盤,并且為新的存儲器重建RAID.如果固態(tài)硬盤作為讀緩存使用,它不會包含有意義的數(shù)據(jù),那這種更換就會更容易。
因為MLC固態(tài)硬盤(寫壽命僅為5000個程序擦寫周期)通常成本是eMLC或SLC固態(tài)硬盤的十分之一,把MLC固態(tài)硬盤當成一次性設(shè)備對于數(shù)據(jù)中心來說就行得通了。雖然我們也許不能預測MLC固態(tài)硬盤是否能持續(xù)18個月或5年之久,但買三個MLC固態(tài)硬盤并隨需要時更換仍然比買一個實質(zhì)上更貴的SLC固態(tài)硬盤便宜。
當然,這不只是人們?yōu)閿?shù)據(jù)中心購買設(shè)備的方式--我們購買設(shè)備基于對未來峰值需要的推測,乘以我們覺得也許必要的因子來防止儲存庫用光。就我個人而言,我喜歡乘上圓周率。如果一個項目需要10TB的存儲,我們對該項目要確保的預算包括30TB的存儲,以便我們在將來不會陷入短缺。
當然,對數(shù)據(jù)中心引入一次性設(shè)備的概念可能給人帶來更多工作來替換一個快掛了的服務(wù)器固態(tài)硬盤。在我們將來有了神奇的非易失性存儲器之前,這也許是在沒有巨大資本支出下獲得性能的一種方式。
當然,有些人可能會關(guān)心人們會從你廢棄的固態(tài)硬盤上恢復敏感的公司數(shù)據(jù)的問題。雖然這的確是個擔憂,但它很容易就能解決,只要把你不用的固態(tài)硬盤放進一個Blendtec攪拌機里運行就成了。如果它能把一個iPad碾成灰,那它同樣可以對付Micron P400 RealSSD。
摘自:硅谷動力