Nykyajan konesaleissa vaatimukset kasvavat eksponentiaalisesti. Tekoäly, koneoppiminen ja raskaat analytiikkatyökuormat vaativat tallennusjärjestelmiltä massiivista I/O-suorituskykyä ja matalaa viivettä. Samaan aikaan petatavuluokan datamassojen tallentaminen perinteiselle All-Flash-arkkitehtuurille on ollut taloudellisesti kestämätöntä.
Tämä on johtanut kompromissiin, jonka jokainen infrastruktuuriarkkitehti tuntee: tallennuksen kerrostamiseen (storage tiering). Kuumalle datalle on varattu kalliit NVMe-levyt ja kylmä data on siirretty hitaille, mutta edullisille pyöriville levyille. Tämä tuo mukanaan monimutkaisuutta, datan siirtelyn pullonkauloja ja hallinnollista taakkaa.
VAST Data on ottanut tähän ongelmaan täysin uudenlaisen, puhtaalta pöydältä suunnitellun lähestymistavan, joka tunnetaan nimellä Universal Storage. Tavoite on yksinkertainen: tarjota All-Flash-suorituskyky arkistotallennuksen hinnalla.
DASE: Disaggregated Shared Everything
VAST Datan arkkitehtuurin sydän on DASE (Disaggregated Shared Everything). Perinteisissä Scale-Out -järjestelmissä (Shared Nothing) jokainen solmu (node) sisältää sekä laskentatehoa että tallennuskapasiteettia. Kun järjestelmää skaalataan, joudutaan datan eheydestä huolehtimaan itä-länsi-suuntaisella liikenteellä solmujen välillä, mikä aiheuttaa skaalautuvuuden rajoitteita.
DASE-arkkitehtuurissa tallennuslogiikka (Compute) ja itse data (State) on eriytetty toisistaan:
- Stateless Compute Nodes (C-Nodes): Nämä palvelimet hoitavat kaiken tallennuslogiikan, protokollat (NFS, SMB, S3) ja datan prosessoinnin. Koska ne eivät tallenna tilaa, niitä voidaan skaalata vapaasti ja jokaisella C-Nodella on suora, viiveetön pääsy kaikkeen dataan.
- Highly Available Enclosures (D-Nodes): Nämä yksiköt sisältävät itse tallennusmedian. Ne on kytketty C-Nodeihin NVMe over Fabrics (NVMe-oF) -verkon yli.
NVRAM ja QLC Flash: Kustannustehokas suorituskyky
Miten VAST saavuttaa luvatun kustannustehokkuuden tinkimättä suorituskyvystä tai levyjen eliniästä? Vastaus piilee tallennusmedian innovatiivisessa hyödyntämisessä:
- SCM / NVRAM -puskuri: Kaikki sisääntuleva kirjoitusliikenne ja järjestelmän metatieto ohjataan ensin huippunopeaan ja kestävään Storage Class Memoryyn (tai uudemmissa järjestelmissä NVRAM-muistiin). Tämä toimii valtavana puskurina, joka eliminoi kirjoitusviiveet täysin.
- Edullinen QLC Flash: Varsinainen pitkäaikaistallennus tapahtuu QLC (Quad-Level Cell) NAND -levyille, jotka tarjoavat massiivista kapasiteettia edullisesti.
Koska QLC-levyjen heikkous on niiden rajallinen kirjoituskestävyys (Endurance), VASTin arkkitehtuuri on elintärkeä. Data viipyy NVRAM-puskurissa niin kauan, että järjestelmä ehtii pakata, deduplikoida (VASTin Similarity-Based Data Reduction) ja muotoilla sen täydellisesti ennen kuin se kirjoitetaan täysinä, suurina lohkoina QLC-levyille. Tämä minimoi QLC-levyjen kulumisen ja mahdollistaa edullisen median käytön enterprisetason järjestelmissä.
Miksi tällä on väliä konesaliylläpitäjälle?
Infrastruktuurin näkökulmasta VAST Datan lähestymistapa ratkaisee useita perinteisiä kipupisteitä:
- Ei enää Tieringiä: Koko tallennusympäristö on yhtä nopeaa All-Flash -allasta. Sinun ei tarvitse miettiä, sijaitseeko tietokanta vai varmuuskopio nopealla vai hitaalla levyllä.
- Massiivinen datan deduplikointi: Uudenlainen algoritmi tunnistaa samankaltaisuuksia jopa täysin erilaisten tiedostojen ja blokkien välillä (vaikka ne eivät olisi 100 % identtisiä), mikä johtaa poikkeuksellisen korkeisiin tiivistyssuhteisiin.
- Skaalautuvuus: Laskentaa (I/O-vaatimukset) ja kapasiteettia (tallennustila) voidaan skaalata toisistaan riippumatta täysin lineaarisesti ilman klusterin sisäistä pullonkaulaa.
VAST Data edustaa merkittävää arkkitehtuurista hyppyä. Se ei ole vain uusi tallennuslaite, vaan tapa rakentaa infrastruktuuri, jossa tallennussiilot puretaan ja data on aidosti, nopeasti ja edullisesti aina saatavilla. Modernissa, datavetoisessa konesalissa DASE-arkkitehtuuri saattaa hyvinkin olla uusi standardi.