閃存的疑惑 企業必須用PCIe閃存?
當我和正在研究在服務器端固態硬盤使用的用戶與廠商交談時,我發現許多人認為服務器固態硬盤必須是那種由比如Fusion-IO, Micron, Virident和LSI這樣的廠商制造的超高性能的SLC PCIe閃存卡。雖然人們非常清楚地知道售出的大多數固態硬盤是2.5英寸尺寸的設備,帶有SAS或SATA接口,他們似乎認為這些設備只適用于筆記本電腦和臺式機愛好者的。
當然,市場上大多數的SATA固態硬盤達不到嚴酷的數據中心應用,但是在Akbar and Jeff's Computer Hut賣的這種低價的固態硬盤與不計成本只求快的家伙生產的PCIe之間還有很多級別。大多數人都害怕他們要在磁盤陣列或服務器中安放固態硬盤,而且在某些時候它們會耗盡耐力并弄丟他們的全部數據。
我認為一部分問題是我們在數據中心的設備實際上已經壞了好長時間了。如今的密封的硬盤在任何可以預見的方式下都不會用壞--它們只會偶然的出錯,大多數存儲系統把硬盤視為二元設備,要么工作正常,要么完全不能用。因此當一個驅動器有一頭前置放大器故障,它連接的RAID控制器會認為驅動器已經損壞并停止使用。
固態硬盤寫入損耗不是不可預見的故障,但它是一個相對好理解的過程,固態硬盤里的閃存已經被編程過并擦寫了足夠多次,由這個閃存的錯誤陣列開始超出閃存控制器的能力來改正這個錯誤。這種損耗不會一下發生在整個固態硬盤上,而是一個個地閃存頁,只有很少能維持正常運轉的閃存了。最終完全沒有空閑的閃存,固態硬盤就不能再寫入了。
多數閃存控制器很注意記錄它們覆蓋閃存每個頁的頻率,并可以通過智能診斷系統擴展報告給存儲系統多少寫壽命已經被消耗。如果我能在閃存損耗將要出現問題的幾周或幾個月前就已經知道,那么在它達到壽命的80%或90%的時候,更換它就是一件很容易的事情。
RAID控制器可以發送一個信息,SSD 14已經達到了其壽命閾值,確定一個新的或空閑的固態硬盤,并且為新的存儲器重建RAID.如果固態硬盤作為讀緩存使用,它不會包含有意義的數據,那這種更換就會更容易。
因為MLC固態硬盤(寫壽命僅為5000個程序擦寫周期)通常成本是eMLC或SLC固態硬盤的十分之一,把MLC固態硬盤當成一次性設備對于數據中心來說就行得通了。雖然我們也許不能預測MLC固態硬盤是否能持續18個月或5年之久,但買三個MLC固態硬盤并隨需要時更換仍然比買一個實質上更貴的SLC固態硬盤便宜。
當然,這不只是人們為數據中心購買設備的方式--我們購買設備基于對未來峰值需要的推測,乘以我們覺得也許必要的因子來防止儲存庫用光。就我個人而言,我喜歡乘上圓周率。如果一個項目需要10TB的存儲,我們對該項目要確保的預算包括30TB的存儲,以便我們在將來不會陷入短缺。
當然,對數據中心引入一次性設備的概念可能給人帶來更多工作來替換一個快掛了的服務器固態硬盤。在我們將來有了神奇的非易失性存儲器之前,這也許是在沒有巨大資本支出下獲得性能的一種方式。
當然,有些人可能會關心人們會從你廢棄的固態硬盤上恢復敏感的公司數據的問題。雖然這的確是個擔憂,但它很容易就能解決,只要把你不用的固態硬盤放進一個Blendtec攪拌機里運行就成了。如果它能把一個iPad碾成灰,那它同樣可以對付Micron P400 RealSSD。
摘自:硅谷動力