Οι εξελίξεις στην τεχνολογία στον τομέα της αποθήκευσης δεδομένων έχουν οδηγήσει στην εμφάνιση νέων μεθόδων διαχείρισης του όγκου των πληροφοριών σε μία επιχείρηση, που αλλάζουν συνολικά τον τρόπο προσέγγισης της αποθήκευσης.
Οι νέες τεχνολογίες στο storage δεν αποτελούν απλώς αντικείμενο μελέτης και διερεύνησης ως προς την εφαρμοστικότητά τους στο εταιρικό γίγνεσθαι, αλλά είναι έτοιμες προς χρήση και οι περισσότερες ήδη βρίσκονται στην αγορά με αρκετούς υποστηρικτές. Καλούμαστε λοιπόν να αναζητήσουμε τους σημαντικότερους νέους τρόπους αποθήκευσης, που κερδίζουν έδαφος μέρα με τη μέρα και σύντομα θα αποτελούν το επόμενο βήμα επένδυσης κάθε Οργανισμού.
Σύμφωνα, με τα δεδομένα που προκύπτουν από έρευνες αγοράς στον τομέα του ΙΤ, εκτιμάται ότι μέσα στο 2013 οι περισσότεροι προμηθευτές αποθηκευτικών μέσων θα αποκλίνουν από το μονοπάτι των σκληρών δίσκων και θα κατευθυνθούν προς τις νέες τεχνολογίες, όπως είναι τα all-flash arrays, μιας και το κόστος τους μειώνεται αισθητά ενώ η απόδοσή τους βελτιώνεται θεαματικά. Παράλληλα, στον τομέα της υποστήριξης των εταιρικών εφαρμογών και της αύξησης της ταχύτητας απόκρισης των αποθηκευτικών μέσων, οι SSD δίσκοι θεωρούνται πλέον η καταλληλότερη επιλογή. Από αυτή την πορεία δεν θα μπορούσαν να λείπουν οι cloud τεχνολογίες, που μεταξύ άλλων εισάγουν ευκολίες και στο Business Continuity, προσφέροντας φθηνές virtual υποδομές και σχεδόν άμεση αποκατάσταση. Η τεχνολογία snapshot για τη λήψη αντιγράφων, επίσης αναδεικνύεται ως μια εξελίξιμη πρόταση αποθήκευσης, μιας και απλοποιεί τις καθημερινές διεργασίες διασφάλισης των δεδομένων, ενώ πολλά από τα διατηρούμενα δεδομένα ίσως τελικά καταλήγουν σε συστήματα που είναι ειδικά σχεδιασμένα να λειτουργούν σε virtual περιβάλλοντα. Όλες οι προαναφερόμενες τεχνολογίες διευκολύνουν και απλοποιούν τις διαδικασίες αποθήκευσης και φύλαξης των δεδομένων και καθεμία προσφέρει υπηρεσίες που μέχρι σήμερα ήταν χρονοβόρες και απαιτούσαν υψηλή επεξεργαστική ισχύ.
Αποθήκευση σε all-flash arrays
Αναζητώντας υψηλότερες ταχύτητες απόκρισης από τα αποθηκευτικά μέσα, η αγορά κατευθύνθηκε προς τα flash συστήματα. Ως flash array ορίζεται ένα solid state σύστημα αποθήκευσης που αποτελείται από πολλαπλές flash μνήμες, αντί για δίσκους. Ως κορυφαία βαθμίδα στον τομέα θεωρούνται τα αμιγώς SSD συστήματα, τα οποία αποδίδουν 500.000 – 1.000.000 IOPS (Input/Output Operations Per Second). Στην αμέσως προηγούμενη βαθμίδα βρίσκονται συστήματα που παρέχουν 100.000 – 200.000 IOPS, αλλά ως δομές δεν απαρτίζονται καθ’ ολοκληρία από SSDs. Ο λόγος λοιπόν που οι εταιρείες κατευθύνθηκαν προς τα all-flash arrays ως αποθηκευτικά μέσα, ήταν το χαμηλότερο κόστος τους, ενώ με τον καιρό παρατηρήθηκε υψηλό ποσοστό υιοθέτησής τους.
Από την άλλη μεριά, η χρήση των αμιγών SSD συστημάτων προέκυψε από την ανάγκη της αύξησης των IOPS ή γενικότερα της απόδοσης των αποθηκευτικών μέσων, χρησιμοποιώντας το λιγότερο δυνατό φυσικό χώρο και επενδύοντας το λιγότερο δυνατό κεφάλαιο. Σε αναλογίες τιμής ανά GB, το κόστος των SSD συστημάτων φαίνεται υπέρογκο – αν όμως μετρηθεί η αναλογία τιμής ανά IOPS, τότε η επένδυση φαίνεται λογική. Ουσιαστικά η τεχνολογία χρησιμοποιείται από επιχειρήσεις που οι καθημερινές διεργασίες τους βασίζονται σε συγκεκριμένες εφαρμογές, οι οποίες πρέπει να διατηρούν μια σταθερά υψηλή απόδοση. Διεργασίες όπως είναι η ανάλυση δεδομένων, η ψηφιακή απεικόνιση, οι δομές virtual σταθμών εργασίας, οι εφαρμογές βάσεων δεδομένων, τα συστήματα οικονομικών συναλλαγών και γενικότερα τα συστήματα που απαιτούν υψηλό όγκο διακίνησης δεδομένων.
Στις μέρες μας όλοι οι κατασκευαστές SSD συστημάτων πασχίζουν να ελαττώσουν το κόστος αγοράς τους, καθώς και να τα τελειοποιήσουν σχεδιαστικά ώστε να παρέχουν τη μεγαλύτερη απόδοση. Ένας τρόπος μείωσης του κόστους είναι η χρήση MLC (πολλαπλών κελιών) συστημάτων SSD, αντί για SLC (απλού κελιού) που είναι πιο ακριβά. Οι SLC flash μνήμες έχουν μεγαλύτερο χρόνο ζωής, επιτρέποντας έως 100.000 κύκλους εγγραφής, ενώ είναι πιο αξιόπιστες. Οι MLC μνήμες επιτρέπουν έως 10.000 κύκλους εγγραφής, αλλά οι κατασκευαστές μέσω ειδικών πρωτοκόλλων που ρυθμίζουν τον τρόπο εγγραφής, έχουν επιτύχει την αύξηση της απόδοσης και της διάρκειας των μνημών. Αναμένεται λοιπόν μέσα στο 2013 να σημειωθεί μια αισθητή απομάκρυνση από τα παραδοσιακά συστήματα αποθήκευσης των σκληρών δίσκων και ακόμα και σε μικρές επιχειρήσεις να υιοθετηθούν συστήματα flash arrays.
Business Continuity μέσω cloud
Πολλοί Οργανισμοί στις μέρες μας δεν διαθέτουν την επαρκή προστασία στον τομέα της αποκατάστασης των δεδομένων και υπηρεσιών τους από ενδεχόμενη καταστροφή. Και αυτό, γιατί το κόστος είναι υψηλό, η διαδικασία πολύπλοκη και ίσως αναποτελεσματική για να αξίζει να προστατευθεί μια επιχείρηση στο σύνολό της. Συνήθως οι πιο κρίσιμες εφαρμογές είναι εκείνες που χαίρουν πλήρους προστασίας και όλες οι υπόλοιπες εταιρικές διεργασίες καλύπτονται στο ελάχιστο και απλούστερο δυνατό.
Η τεχνολογία cloud θεωρείται ότι έχει ως έμφυτο χαρακτηριστικό της την προστασία των δεδομένων και εφαρμογών από μια ενδεχόμενη καταστροφή των εταιρικών υποδομών και είναι προσιτή από επιχειρήσεις όλων των βαθμίδων, μιας και όλοι μπορούν να αποστείλουν ένα αντίγραφο ασφαλείας σε μία cloud υπηρεσία αποθήκευσης. Επιπρόσθετα, μέσω του server virtualization, όταν οι διεργασίες τοπικά διακοπούν, είναι εφικτό άμεσα να δημιουργηθούν νέοι servers μέσω cloud και έτσι να προσπελαθούν τα εταιρικά δεδομένα.
Γενικά, σήμερα θεωρείται ολιγωρία από τα ΙΤ τμήματα των Οργανισμών, αν δεν έχουν ήδη αποστείλει ένα αντίγραφο ασφαλείας σε κάποια cloud υπηρεσία, μιας και με αυτόν τον τρόπο μετακινούνται από τα παραδοσιακά συστήματα αποκατάστασης καταστροφών σε ένα περιβάλλον cloud, που παρέχεται από ένα τρίτο κατασκευαστή. Έτσι, ακόμα και οι μικρές επιχειρήσεις δεν απαιτείται να επενδύσουν σε υλικό και λογισμικό για τη διατήρηση των εταιρικών δεδομένων, το οποίο συνήθως είναι πολύπλοκο ως δομή και έχει υψηλό κόστος, ενώ απαιτεί εργατικό δυναμικό για να είναι αξιόπιστο ως προς τη λειτουργία του.
Η τεχνολογία εισάγει προβληματισμούς στον τομέα του τρόπου αποθήκευσης των δεδομένων στο cloud περιβάλλον. Δηλαδή ανακύπτουν θέματα όπως αν θα εφαρμόζεται η συγχρονισμένη ή ασύγχρονη ενημέρωση των cloud δεδομένων, με τα διαρκώς τοπικά μεταβαλλόμενα εταιρικά δεδομένα, ειδικότερα όταν υπάρχουν προβλήματα δικτυακού εύρους επικοινωνίας. Επίσης το είδος των δεδομένων που αποθηκεύονται σε ένα cloud αποθηκευτικό χώρο είναι προς συζήτηση, μιας και δεν υπάρχει ο απαιτούμενος βαθμός εφησυχασμού από μεριάς εταιρειών, ώστε να εμπιστευτούν τα κρίσιμα εταιρικά δεδομένα όπως είναι οι βάσεις δεδομένων τους ή οι κρίσιμες εφαρμογές τους σε έναν τρίτο κατασκευαστή. Είθισται να προτείνεται ένα συνδυαστικό σύστημα αποκατάστασης καταστροφών, στο οποίο μετέχουν τόσο τα παραδοσιακά συστήματα αποθήκευσης όσο και τα νέα cloud περιβάλλοντα, με τέτοιο τρόπο ώστε να επιτυγχάνεται ο υψηλότερος βαθμός προστασίας χωρίς να ανακύπτουν θέματα αξιοπιστίας και με το χαμηλότερο δυνατό κόστος.
Λήψη Αντιγράφων Ασφαλείας μέσω snapshot
Την τελευταία δεκαετία η προστασία των εταιρικών δεδομένων άρχισε να βασίζεται και στην τεχνολογία array-based snapshot με λογισμικό λήψης αντιγράφων ασφαλείας. Στις μέρες μας, όλο και περισσότερες πλατφόρμες λογισμικού λήψης αντιγράφων ασφαλείας φέρουν δυνατότητες ελέγχου και αρχειοθέτησης των snapshots, ενώ σε μερικές εξ αυτών δίνεται η δυνατότητα ανάκτησης συγκεκριμένων αρχείων ή αντικειμένων από ένα στιγμιότυπο, μετατρέποντας έτσι τα στιγμιότυπα σε ουσιαστικό μέρος της στρατηγικής προστασίας των δεδομένων.
Υπάρχουν πέντε βασικοί λόγοι για τους οποίους τα array-based snapshots βρίσκονται στην πρώτη γραμμή της προστασίας των δεδομένων. Αρχικά δεν επιβαρύνουν καθόλου την απόδοση του συστήματος (μνήμη, επεξεργαστική ισχύ, εύρος) κατά τη λήψη των snapshots και δεν απαιτούν υψηλό όγκο μετακίνησης δεδομένων. Δεν διακόπτουν τις εταιρικές διεργασίες παρά για μερικά δευτερόλεπτα, διατηρώντας την απόδοση του συστήματος υψηλή και έτσι εξασφαλίζουν ότι τα δεδομένα δεν έχουν αλλάξει από τη στιγμή έναρξης της λήψης έως την ολοκλήρωση της διεργασίας. Τέλος υποστηρίζουν την πλήρη ανάκτηση των δεδομένων σε χρόνο λιγότερο από 30 λεπτά.
Από την άλλη μεριά, τα array-based snapshots καταναλώνουν περισσότερο αποθηκευτικό χώρο για την αποθήκευση των αντιγράφων που λαμβάνουν, τα οποία επιπρόσθετα τοποθετούν στο ίδιο σημείο αποθήκευσης. Αυτό σημαίνει ότι μια τυχόν αστοχία υλικού οδηγεί σε πλήρη απώλεια των αντιγράφων, κάτι από το οποίο δεν υποφέρουν τα παραδοσιακά συστήματα και οι μέθοδοι διατήρησης αντιγράφων ασφαλείας. Γενικότερα, τα array-based snapshots χρησιμοποιούνται για τη διατήρηση βραχύβιων αντιγράφων ασφαλείας. Η ιδανική λύση περιλαμβάνει συνεργασία των array-based snapshots με τα παραδοσιακά συστήματα αποθήκευσης, ώστε να εξασφαλίζεται γρήγορη και καθημερινή λήψη αντιγράφων χωρίς να διακόπτονται οι εταιρικές διεργασίες, ενώ ταυτόχρονα να διατηρούνται μόνιμα αντίγραφα για περιπτώσεις καταστροφής και σε βάθος χρόνου.
Προσωρινή Flash Μνήμη server-based
Η server-based flash cache αναδείχθηκε σε σημαίνουσα τεχνολογία των ημερών, μιας και κορυφαίοι κατασκευαστές (Dell, EMC, NetApp Inc.) την εισήγαγαν δυναμικά στην αγορά. Αναμένεται δε να αυξηθεί η ζήτηση γύρω από τη συγκεκριμένη τεχνολογία, αφού αποτελεί μια απλή τεχνική εισαγωγής προσωρινής μνήμης σε ένα server, χωρίς να απαιτεί αλλαγές στις ρυθμίσεις των εφαρμογών ή των υπαρχόντων συστημάτων αποθήκευσης, ενώ ταυτόχρονα βελτιώνει σημαντικά την τελική απόδοση του συστήματος. Ουσιαστικά πρόκειται για την τοποθέτηση μιας flash cache στο server των εφαρμογών αντί για την τοποθέτησή της στο σύστημα αποθήκευσης, κάτι που περιορίζει τα φαινόμενα αδράνειας στο δίκτυο. Για περαιτέρω περιορισμό της αδράνειας – καθυστέρησης, η μνήμη συνδέεται μέσω διαύλου PCI Express απευθείας στην ΚΜΕ και το σύστημα μνήμης, από το να συνδεόταν στα SAS/SATA-based SSDs.
Εν γένει το λογισμικό που υποστηρίζει τις cache καθορίζει ποια είναι τα πιο συχνά χρησιμοποιούμενα δεδομένα και δημιουργεί ένα αντίγραφό τους στην cache. Οι αλγόριθμοί που εκτελούν τα ανωτέρω, διαφέρουν ανά κατασκευαστή και συνήθως απαιτούν ένα συγκεκριμένο χρονικό διάστημα έως ότου η μνήμη ενημερωθεί πλήρως για να αποδώσει τα μέγιστα. Οι αρχικές εγγραφές ξεκινούν από το server των εφαρμογών και κατευθύνονται προς το αποθηκευτικό σύστημα, ενώ η PCIe κάρτα ενημερώνεται ασύγχρονα ώστε να μην υποβαθμιστεί η απόδοση της εφαρμογής. Το λογισμικό καθορίζει αν η εφαρμογή μπορεί να εξυπηρετηθεί από την PCIe κάρτα, ώστε να επιταχυνθεί η διεργασία.
Υπάρχουν κατασκευαστές που υποστηρίζουν ένα πιο πολύπλοκο σύστημα server-based flash cache, με το οποίο στοχεύουν να επιταχύνουν τόσο τις εγγραφές όσο και τις αναγνώσεις στη μνήμη. Οι cache ανάγνωσης και εγγραφής απαιτούν τη δημιουργία περιπλοκότερου λογισμικού από τον κατασκευαστή, από ό,τι στις cache μόνο ανάγνωσης, μιας και οι εγγραφές τελούνται προτού τα δεδομένα εγγραφούν στο μόνιμο σύστημα αποθήκευσης και έτσι πρέπει να βρεθεί τρόπος να μη χαθούν τελικά πολύτιμες πληροφορίες.
Πρόβλημα ανακύπτει όταν πρέπει να συνεργαστούν μνήμες και συστήματα αποθήκευσης διαφορετικών κατασκευαστών. Θεωρητικά κάτι τέτοιο είναι εφικτό, αλλά τονίζεται ότι η μέγιστη απόδοση επιτυγχάνεται όταν τα συστήματα που συνεργάζονται ανήκουν στον ίδιο κατασκευαστή.
Συστήματα αποθήκευσης για Virtual Περιβάλλοντα
Οι έννοιες της ενοποίησης και συγκέντρωσης, τα αναμενόμενα οφέλη στην αποτελεσματικότητα και το χαμηλό κόστος που αναμένονταν να επιτευχθούν μέσω των virtual servers και των VDI (virtual desktop infrastructure) επετεύχθησαν πλήρως, με μόνο τον τομέα της αποθήκευσης να υπολείπεται στη συνολική εικόνα. Οι κατασκευαστές καλούνται να αλλάξουν τον τρόπο που παρέχεται και διαχειρίζεται η αποθήκευση, ώστε να γεννάται μέσα από τα vCenter και να ενσωματώνεται πλήρως με τις vMachines (VMs).
Μία ομάδα κατασκευαστών υποστηρίζει την τέλεση των αποθηκευτικών και επεξεργαστικών διεργασιών από το ίδιο σύστημα. Δηλαδή, η επεξεργαστική ισχύς του συστήματος να μοιράζεται μεταξύ της διαδικασίας αποθήκευσης και της υποστήριξης των VMs, με στόχο ουσιαστικά την απλούστευση που προκύπτει μέσω ενιαίας πλατφόρμας διαχείρισης. Φυσικά ο διαμοιρασμός των ίδιων υπολογιστικών πόρων (CPU, μνήμη και δικτύωση) τόσο για επεξεργασία όσο και για αποθήκευση είναι πιθανό να έχει αρνητικές επιπτώσεις στις vMachines – και το αντίστροφο.
Παραδοσιακά, η αποθήκευση παρέχεται και διαχειρίζεται από τους servers σε επίπεδο όγκου δεδομένων ή LUN (logical unit number) και διαμοιράζεται σε όλες τις VMs. Αυτό όμως είχε ως αποτέλεσμα οι διεργασίες διαχείρισης της αποθήκευσης, όπως η λήψη snapshot, να μην είναι εφικτή σε επίπεδο VMs, κάτι που έγινε κατανοητό και αναζητήθηκαν τρόποι διαχείρισης μέσω ενός VM κεντρικού μοντέλου. Έτσι δημιουργήθηκαν διττά συστήματα ελέγχου αποθήκευσης, στα οποία όλες οι διεργασίες διακίνησης δεδομένων των VMs αποθηκεύονται σε SSDs και γίνεται εφικτή η λήψη αντιγράφων, ενώ τα μη ενεργά δεδομένα αποθηκεύονται σε SATA δίσκους στο παρασκήνιο. Το μειονέκτημα της διαχείρισης της αποθήκευσης σε επίπεδο VM είναι ότι αυτά τα συστήματα αποθήκευσης δεν μπορούν πλέον να χρησιμοποιηθούν σε μη virtual περιβάλλοντα.
Επιπρόσθετα, η ενσωμάτωση με τους hypervisors υπήρξε ένας από τους κύριους παράγοντες διαφοροποίησης των προϊόντων αποθήκευσης που στοχεύουν στους virtualized servers. Δημιουργήθηκαν APIs αποθήκευσης, που επιτρέπουν τις διαχειριστικές εργασίες αποθήκευσης να τις αναλάβει ο hypervisor, όπως είναι το VMware vCenter. Η τεχνολογία VSA (Virtual storage appliances) υποστηρίζει ένα λογισμικό αποθήκευσης το οποίο εκτελείται σε μία VM και παρέχεται ως εικόνα VM, με στόχο το διαμοιρασμό διαφορετικών φυσικών μονάδων αποθήκευσης που ανήκουν σε διαφορετικούς servers, σε ένα κοινόχρηστο πόρο στον οποίο εκτελούνται virtualized εφαρμογές. Τέλος διατίθενται ολοκληρωμένες λύσεις UCP (Unified Compute Platform) που περιλαμβάνουν servers, δικτύωση και όλα εκείνα τα εξαρτήματα και τις εφαρμογές που απαιτούνται για την υλοποίηση των virtual servers, των VDI και της cloud υποστήριξής τους, όλα πλήρως υποστηριζόμενα από τους κατασκευαστές τους.
Διαμοιρασμός αρχείων μέσω cloud και υπηρεσίες συγχρονισμού
Με την εξέλιξη των φορητών συσκευών και την ουσιαστική πλέον ένταξή τους στο εταιρικό περιβάλλον λειτουργίας, κρίθηκε αναγκαία η ύπαρξη τεχνικής αποθήκευσης σε cloud επίπεδο όλων εκείνων των δεδομένων που ο χρήστης θα ζητά πρόσβαση όταν εργάζεται μέσω των συσκευών αυτών. Έτσι δημιουργήθηκαν οι cloud «τόποι», όπου πλέον βρίσκονται εταιρικά δεδομένα και μέθοδοι συγχρονισμού όλων των συσκευών του χρήστη με αυτά.
Ο διαμοιρασμός δεδομένων μέσω cloud τελείται με τρεις διαφορετικούς τρόπους: μέσω δημόσιου, ιδιωτικού ή υβριδικού μοντέλου. Αν και η μέθοδος υιοθετήθηκε αρχικά για την απομακρυσμένη επικοινωνία των εργαζομένων με την εταιρεία, οι ΙΤ διαχειριστές χρησιμοποίησαν την τεχνική για να αντικαταστήσουν κάποιους από τους τοπικούς servers αρχείων, μειώνοντας έτσι το λειτουργικό κόστος.
Οι ανωτέρω αποτελούν τις τρέχουσες επιλογές αποθήκευσης στους Οργανισμούς και τις επιχειρήσεις που διαρκώς εξελίσσονται. Στην αγορά ακόμα αναμένονται προϊόντα που αφορούν στην αποθήκευση μεγάλου μεγέθους αρχείων και μείωσης του όγκου των δεδομένων στην πρωτογενή αποθήκευσή τους. Επίσης απαιτούνται πλέον τεχνικές για την υλοποίηση λήψης αντιγράφων ασφαλείας από τις φορητές συσκευές, καθώς και ακόμα αναμένονται οι νέες flash μνήμες TLC (Triple-level cell). Υπό οποιεσδήποτε συνθήκες απαιτείται προσεκτική μελέτη των αποθηκευτικών στόχων και μια καλή πρόβλεψη για τις μελλοντικές ανάγκες, ώστε να αποφασιστεί ποια είναι η καταλληλότερη μέθοδος αποθήκευσης, που θα φέρει το βάρος της εξελικτικής πορείας της εταιρείας.
Της Παναγιώτας Τσώνη