上海2017年5月11日電 /美通社/ -- 本文為Dostor主編宋家雨所撰寫的文章,以下為全文內(nèi)容詳情:
NVMe標(biāo)準(zhǔn)推廣速度之快出乎意料,如今U.2接口已成為x86服務(wù)器標(biāo)配,作為御用接口(兼容SAS/SATA),如此也就掃除NVMe PCIe SSD盤最后障礙,一句話,SSD盤也實(shí)現(xiàn)PCIe連接了,卡和盤的界限消失了。
從卡到盤的演進(jìn)
通過NVMe協(xié)議,SSD盤透過PCIe直連CPU,不似以往還要轉(zhuǎn)換為SAS/SATA,因而開啟了一個(gè)新時(shí)代。
從技術(shù)上,在磁盤(HDD)的時(shí)代,由于磁盤屬于低速設(shè)備,因此SAS/SATA協(xié)議自身帶來的開銷可以忽略不計(jì)。但在SSD時(shí)代,SSD太快了,以至于SAS/SATA協(xié)議開銷變得沒法接受,作為SAS/SATA換代的協(xié)議,NVMe協(xié)議專為閃存介質(zhì)設(shè)計(jì),可以較大釋放SSD的性能,特別是延遲的能力。
相比PCIe閃存卡的形式,以往外置SSD要經(jīng)過SAS/SATA,延遲高,在性能上存在差距,因此在需要數(shù)據(jù)加速的應(yīng)用場(chǎng)景,如數(shù)據(jù)庫的OLTP應(yīng)用,PCIe閃存卡就成為了不二選擇。Fusion IO首創(chuàng)了PCIe閃存卡產(chǎn)品形態(tài),隨后Intel、三星、寶存(Shannon Systems)、Memblaze等紛紛涉足PCIe閃存卡市場(chǎng),根據(jù)設(shè)計(jì)方式不同,PCIe閃存卡可以區(qū)分Host-Based、Device-Based兩種類型,其中差別在于嵌入式處理器的使用,其中Host-Base依賴主機(jī)處理器性能,自身不配處理器,在成本、功耗上表現(xiàn)優(yōu)異。Device-Based則擺脫了閃存顆粒對(duì)于主機(jī)處理器資源的依賴,適用性更好。
“從卡到盤,只是封裝形式的不同,其本質(zhì)是一樣的?!?寶存科技CEO陽學(xué)仕強(qiáng)調(diào)說。
“以往主機(jī)沒有PCIe外置接口,要使用就只有基于主板上的接口,這就有了PCIe閃存卡這種形態(tài)。如今,U.2接口讓PCIe外置,NVMe外置SSD盤是水到渠成的事情。”他說。
適配應(yīng)用層是關(guān)鍵
在盤的世界中, Intel、三星、東芝、希捷、西部數(shù)據(jù)、HGST等是真正的“大咔”。從卡的世界來到盤的市場(chǎng),寶存、Memblaze這樣品牌如何才能夠?qū)崿F(xiàn)“猛龍過江”呢?
“我們和這些大品牌的競(jìng)爭(zhēng)始終存在,并非始自閃存卡‘紅利’的消失?!标枌W(xué)仕說。
陽學(xué)仕表示:需要看到,Intel、三星這樣的廠商都有PCIe閃存卡的產(chǎn)品,在競(jìng)爭(zhēng)中,寶存之所以在市場(chǎng)表現(xiàn)優(yōu)異,是有其深刻原因的。
“本質(zhì)上說,閃存存儲(chǔ)介質(zhì)并不是一個(gè)可靠的介質(zhì),存在著寫入壽命受限等問題,需要通過校驗(yàn)、RAID和磨損均衡設(shè)計(jì)等一系列措施,讓SSD設(shè)備能夠滿足應(yīng)用的需要。這需要上層的應(yīng)用軟件,如數(shù)據(jù)庫等和SSD硬件管理緊密配合,如此才能夠較大釋放閃存的優(yōu)勢(shì)?!?陽學(xué)仕說。
與國際廠商相比,國內(nèi)廠商在本地化服務(wù)和響應(yīng)速度上占有明顯優(yōu)勢(shì),深入應(yīng)用,密切配合這是國內(nèi)品牌取成功的重要原因。
“這些優(yōu)勢(shì),以及技術(shù)上的沉淀積累,并不會(huì)因?yàn)橛布螒B(tài)的改變而消失?!标枌W(xué)仕說。
軟件定義,殊途同歸
在閃存卡加速卡世界中,Host-Based、Device-Based之爭(zhēng)曾是一道亮麗的風(fēng)景。如今,在NVMe的時(shí)代,由于早期的NVMe標(biāo)準(zhǔn)采用Device-Based方式,Host-Based似乎也處于下風(fēng)。會(huì)有很多人認(rèn)為,Host-Based很難轉(zhuǎn)型到Device-Based,即使轉(zhuǎn)型,經(jīng)驗(yàn)積累不夠也使其難以實(shí)現(xiàn)超越。
實(shí)際上,陽學(xué)仕曾是Marvell第一代閃存控制器的技術(shù)負(fù)責(zé)人,對(duì)于閃存控制器技術(shù)非常熟悉。但在2011年,當(dāng)他舉家歸國創(chuàng)辦上海寶存信息科技有限公司的時(shí)候,他卻選擇了Host-Based,也就是沒有CPU處理器的方案。
談到其中的原因,陽學(xué)仕表示:用戶并不關(guān)注Host-Based還是Device-Based,用戶關(guān)注的是如何較大程度發(fā)揮閃存的能力,解決實(shí)際應(yīng)用中的性能瓶頸問題。
“我們不說Host-Based和Device-Based,我們說軟件定義設(shè)計(jì)和嵌入式設(shè)計(jì)。我們認(rèn)為軟件定義的方式更加有利于釋放閃存的特性。此外,在可靠性、功耗,以及成本上,軟件定義均占有優(yōu)勢(shì)。” 陽學(xué)仕說。
NVMe標(biāo)準(zhǔn)從1.0,到1.2、1.3始終堅(jiān)持開放的策略,其中,類似HMB(Host Memory Buffer), CMB(Controller Memory Buffer), open-channel SSD這樣技術(shù),NVMe over Fabric等就是要將原本嵌入式控制器承擔(dān)資源和任務(wù)向主機(jī)、網(wǎng)絡(luò)進(jìn)行遷移。所以未來,嵌入式和軟件定義應(yīng)該是殊途同歸。
陽學(xué)仕表示:“未來的技術(shù)趨勢(shì),就是將適合的軟件向主機(jī)進(jìn)行遷移。”
DRAM-less的話題
DRAM-less設(shè)計(jì),是寶存在產(chǎn)品可靠性上獨(dú)有的技術(shù)優(yōu)勢(shì),確保在極少量控制器緩存的情況下,應(yīng)對(duì)在突發(fā)掉電情況下,由于緩存數(shù)據(jù)沒有落盤(沒有寫入NAND顆粒)所導(dǎo)致的數(shù)據(jù)丟失。
但是片上緩存的減少是否會(huì)影響系統(tǒng)的性能呢?以寫放大為例,對(duì)于SSD來說是要努力減少的,理論是緩存計(jì)算應(yīng)該非常有效的辦法。對(duì)此,陽學(xué)仕指出,理論上是可以的,但在實(shí)際的產(chǎn)品實(shí)踐中,這個(gè)度是非常難以把握的。如果不是從單一產(chǎn)品(如盤)而是從系統(tǒng)應(yīng)用的角度,系統(tǒng)會(huì)有非常多層緩存(buffer)的設(shè)計(jì),但主機(jī)側(cè)的緩存是最為有效的,這也是為什么寶存堅(jiān)持采用軟件定義設(shè)計(jì)方式的原因之一。
目前為止,寶存對(duì)外提供多種形式的產(chǎn)品方案。從軟件定義的Direct-IO PCIe Flash到Hyper-IO NVMe G5,包括SATA3 SSD的產(chǎn)品。寶存始終堅(jiān)持針對(duì)應(yīng)用軟件進(jìn)行定制化和優(yōu)化,在性能保持和通用型產(chǎn)品的技術(shù)優(yōu)勢(shì)?!耙栽訉懠夹g(shù)為例,寶存是少數(shù)能夠?qū)⑵洚a(chǎn)品化的廠商之一?!?陽學(xué)仕說。
NVMe時(shí)代到來,推動(dòng)閃存技術(shù)應(yīng)用跨越了一個(gè)新的臺(tái)階,但這并不意味通用型產(chǎn)品時(shí)代的到來。技術(shù)的差異始終是存在的。其中,很多差異沒有辦法用簡單的方法分辨出來,特別是可靠性、穩(wěn)定性需要時(shí)間的檢驗(yàn)。在應(yīng)用產(chǎn)品初期,產(chǎn)品之間來不開差距,但是隨著時(shí)間的累積,SSD壞塊的增加,不同的設(shè)計(jì)方案就會(huì)變現(xiàn)出很大的差異。
一句話,技術(shù)還在不斷進(jìn)步之中,Host還是Device,嵌入式還是軟件定義,遠(yuǎn)沒有到水落石出的時(shí)候。