Με τη νέα υπηρεσία, οι ομάδες που ασχολούνται με την επιστήμη των δεδομένων μπορούν να συνεργάζονται εύκολα και γρήγορα για τη δημιουργία και υλοποίηση πανίσχυρων μοντέλων μηχανικής εκμάθησης
Η νέα υποστήριξη Python για αλγόριθμους μηχανικής εκμάθησης με την Oracle Autonomous Database μειώνει την ανάγκη μετακίνησης δεδομένων
Επτά νέες υπηρεσίες, συμπεριλαμβανομένου ενός νέου καταλόγου δεδομένων, για εντοπισμό, εύρεση, οργάνωση, εμπλουτισμό και δημιουργία πόρων δεδομένων. Νέα υπηρεσία big data που παρέχει μια ολοκληρωμένη υλοποίηση Cloudera Hadoop. Νέα υπηρεσία που παρέχει πρόσβαση SQL στο σύστημα αρχείων HDFS. Νέα πλήρως διαχειριζόμενη υπηρεσία για την εκτέλεση εφαρμογών Apache Spark
Η Oracle ανακοίνωσε τη διαθεσιμότητα της πλατφόρμας Oracle Cloud Data Science. Στον πυρήνα βρίσκεται η Oracle Cloud Infrastructure Data Science, βοηθώντας τις εταιρείες να συνεργαστούν για να δημιουργήσουν, να εκπαιδεύσουν, να διαχειριστούν και να υλοποιήσουν μοντέλα μηχανικής εκμάθησης ώστε να αυξήσουν την επιτυχία των έργων της επιστήμης των δεδομένων. Σε αντίθεση με άλλα προϊόντα της επιστήμης των δεδομένων που εστιάζουν σε μεμονωμένους χρήστες, η Oracle Cloud Infrastructure Data Science συνεισφέρει στη βελτίωση της αποτελεσματικότητας των ομάδων που δραστηριοποιούνται στην επιστήμη των δεδομένων με δυνατότητες όπως κοινόχρηστα έργα, καταλόγους μοντέλων, πολιτικές ασφάλειας ομάδων, επαναληψιμότητα και δυνατότητα ελέγχου-επαλήθευσης. Η Oracle Cloud Infrastructure Data Science επιλέγει αυτόματα τα πιο βέλτιστα σετ δεδομένων εκπαίδευσης μέσω επιλογής και λεπτομερούς ρύθμισης αλγόριθμων AutoML, αξιολόγησης μοντέλων και επεξήγησης μοντέλων.
Σήμερα, οι οργανισμοί αξιοποιούν ένα μικρό μόνο κλάσμα των τεράστιων δυνατοτήτων ερμηνείας, κατανόησης και εξαγωγής πληροφοριών από τα δεδομένα, επειδή οι ομάδες που ασχολούνται με την επιστήμη αυτών δεν έχουν εύκολη πρόσβαση στα κατάλληλα δεδομένα και εργαλεία για να δημιουργήσουν και να υλοποιήσουν αποτελεσματικά μοντέλα μηχανικής εκμάθησης. Το τελικό αποτέλεσμα είναι ότι τα μοντέλα χρειάζονται πολύ χρόνο για να σχεδιαστούν, δεν καλύπτουν πάντα τις εταιρικές απαιτήσεις περί ακρίβειας και αξιοπιστίας και πολύ συχνά ούτε καν φτάνουν μέχρι το στάδιο της παραγωγής.
Ο Greg Pavlik, Senior Vice President, Product Development, Oracle Data & AI Services, δήλωσε: «Τα αποτελεσματικά μοντέλα μηχανικής εκμάθησης αποτελούν το υπόβαθρο για επιτυχημένα έργα επιστήμης των δεδομένων, αλλά ο όγκος και η ποικιλία των δεδομένων που αντιμετωπίζουν οι εταιρείες μπορούν να προκαλέσουν εμπλοκή σε τέτοιες πρωτοβουλίες προτού καν ξεκινήσει η υλοποίησή τους. Με την πλατφόρμα Oracle Cloud Infrastructure Data Science, βελτιώνουμε την παραγωγικότητα των μεμονωμένων επιστημόνων χάρη στην αυτοματοποίηση του συνόλου της ροής εργασιών τους και στην προσθήκη ισχυρής υποστήριξης των ομάδων για συνεργασία, ώστε να διασφαλιστεί ότι τα έργα επιστήμης των δεδομένων θα φέρνουν πραγματική αξία για τις επιχειρήσεις.»
Σχεδιασμένη για Ομάδες και Επιστήμονες της Επιστήμης Δεδομένων
Η πλατφόρμα Oracle Cloud Infrastructure Data Science περιλαμβάνει αυτοματοποιημένη ροή εργασιών επιστήμης των δεδομένων, εξοικονομώντας χρόνο και μειώνοντας τα σφάλματα χάρη στις παρακάτω δυνατότητες:
- Αυτοματοποιημένη επιλογή και λεπτομερής ρύθμιση αλγόριθμων AutoML: αυτοματοποιεί τη διαδικασία εκτέλεσης δοκιμών ως προς πολλαπλούς αλγόριθμους και διαμορφώσεις υπερπαραμέτρων. Ελέγχει τα αποτελέσματα ως προς την ακρίβεια και επιβεβαιώνει ότι επιλέγεται το βέλτιστο μοντέλο και διαμόρφωση. Έτσι, εξοικονομείται πολύτιμος χρόνος για τους επιστήμονες των δεδομένων και, ακόμα πιο σημαντικό, κάθε επιστήμονας έχει τη δυνατότητα να πετύχει τα ίδια αποτελέσματα με τους πιο έμπειρους επαγγελματίες.
- Αυτοματοποιημένη επιλογή χαρακτηριστικών πρόβλεψης: απλοποιεί τη διαμόρφωση χαρακτηριστικών μέσα από τον αυτόματο εντοπισμό βασικών χαρακτηριστικών πρόβλεψης από μεγαλύτερα σετ δεδομένων.
- Αξιολόγηση μοντέλων:δημιουργεί μια ολοκληρωμένη σουίτα δεικτών αξιολόγησης και κατάλληλες οπτικοποιήσεις για μέτρηση της απόδοσης του μοντέλου ως προς νέα δεδομένα και έχει τη δυνατότητα να κατατάξει τα μοντέλα διαχρονικά ώστε να υπάρξει βέλτιστη συμπεριφορά στην παραγωγή. Η αξιολόγηση των μοντέλων φτάνει πέρα από την απλή απόδοση ώστε να συνυπολογίζει την αναμενόμενη βασική συμπεριφορά και χρησιμοποιεί ένα μοντέλο κόστους ώστε να μπορούν να ενσωματωθούν πλήρως οι διαφορετικές επιπτώσεις των ψευδώς θετικών και των ψευδώς αρνητικών αποτελεσμάτων.
- Επεξήγηση μοντέλων: Η πλατφόρμα Oracle Cloud Infrastructure Data Science παρέχει αυτοματοποιημένη επεξήγηση των σχετικών συντελεστών στάθμισης και της σπουδαιότητας των παραγόντων που συνυπολογίζονται για τη δημιουργία μιας πρόβλεψης. Η πλατφόρμα Oracle Cloud Infrastructure Data Science παρέχει την πρώτη εμπορική υλοποίηση μιας λύσης επεξήγησης ανεξαρτήτως μοντέλου. Με ένα μοντέλο εντοπισμού περιστατικών απάτης, για παράδειγμα, ένας επιστήμονας δεδομένων μπορεί να εξηγήσει ποιοί παράγοντες είναι τα σημαντικότερα εφαλτήρια για περιστατικά απάτης, ώστε η επιχείρηση να μπορεί να τροποποιήσει τις διαδικασίες ή να εφαρμόσει ασφαλιστικές δικλείδες.
Για να υπάρξουν αποτελεσματικά μοντέλα μηχανικής εκμάθησης που θα ενταχθούν επιτυχώς στην παραγωγή, απαιτούνται πολλά περισσότερα από αφοσιωμένα άτομα. Απαιτείται να υπάρχουν ομάδες από επιστήμονες δεδομένων που θα συνεργάζονται. Η πλατφόρμα Oracle Cloud Infrastructure Data Science παρέχει σημαντικές δυνατότητες για ομάδες, στις οποίες περιλαμβάνονται τα εξής:
- Κοινόχρηστα έργα, που βοηθούν τους χρήστες να οργανώνουν, να κάνουν έλεγχο εκδόσεων και να μοιράζονται αξιόπιστα την εργασία μιας ομάδας, συμπεριλαμβανομένων των δεδομένων και των περιόδων λειτουργίας σημειωματάριου.
- Κατάλογοι μοντέλων, που επιτρέπουν στα μέλη των ομάδων να μοιράζονται με αξιοπιστία έτοιμα μοντέλα και τα τεχνουργήματα που είναι αναγκαία για την τροποποίηση και την υλοποίησή τους.
- Πολιτικές ασφάλειας βασισμένες στις ομάδες, που επιτρέπουν στους χρήστες να ελέγχουν την πρόσβαση σε μοντέλα, κώδικα και δεδομένα, πλήρως ενσωματωμένες στο Oracle Cloud Infrastructure Identity and Access Management.
- Λειτουργίες επαναληψιμότητας και δυνατότητας ελέγχου-επαλήθευσης, που δίνουν στην εταιρεία τη δυνατότητα να παρακολουθεί όλους τους σχετιζόμενους πόρους, ώστε για όλα τα μοντέλα να υπάρχει δυνατότητα επαναληψιμότητας και ελέγχου, ακόμη κι αν αποχωρήσουν μέλη της ομάδας.
Με την πλατφόρμα Oracle Cloud Infrastructure Data Science, οι οργανισμοί μπορούν να επιταχύνουν την επιτυχή υλοποίηση μοντέλων και να έχουν κατάλληλα αποτελέσματα και επιδόσεις, ώστε η προβλεπτική ανάλυση να φέρνει θετικά αποτελέσματα για την επιχείρηση.
Ολοκληρωμένες υπηρεσίες δεδομένων και μηχανικής εκμάθησης
Η πλατφόρμα Oracle Cloud Data Science περιλαμβάνει επτά νέες υπηρεσίες που εξασφαλίζουν μια συνολική και ολοκληρωμένη εμπειρία σχεδιασμένη για επιτάχυνση και βελτίωση των αποτελεσμάτων της επιστήμης δεδομένων:
- Oracle Cloud Infrastructure Data Science: Δίνει στους χρήστες τη δυνατότητα να δημιουργήσουν, να εκπαιδεύσουν και να διαχειριστούν νέα μοντέλα μηχανικής εκμάθησης στο Oracle Cloud, χρησιμοποιώντας την Python και άλλα εργαλεία ανοικτού κώδικα και βιβλιοθήκες, όπως TensorFlow, Keras και Jupyter.
- Πανίσχυρες νέες δυνατότητες μηχανικής εκμάθησης στην Oracle Autonomous Database: Οι αλγόριθμοι μηχανικής εκμάθησης είναι πλήρως ενσωματωμένοι στην Oracle Autonomous Database με νέα υποστήριξη για Python και αυτοματοποιημένη μηχανική εκμάθηση. Η επερχόμενη ενοποίηση με την πλατφόρμα Oracle Cloud Infrastructure Data Science θα δώσει στους επιστήμονες των δεδομένων τη δυνατότητα να αναπτύσσουν μοντέλα χρησιμοποιώντας ταυτόχρονα αλγόριθμους ανοικτού κώδικα και επεκτάσιμους αλγόριθμους της βάσης δεδομένων. Η ενσωμάτωση αλγόριθμων στα δεδομένα στην Oracle Database αποτελεί πρωτοποριακό χαρακτηριστικό που επιταχύνει την παραγωγή αποτελεσμάτων, χάρη στη μείωση των αναγκών για προετοιμασία και μετακίνηση των δεδομένων.
- Oracle Cloud Infrastructure Data Catalog: Επιτρέπει στους χρήστες να εντοπίζουν, να βρίσκουν, να οργανώνουν, να εμπλουτίζουν και να ιχνηλατούν τους πόρους δεδομένων στο Oracle Cloud. Η λύση Oracle Cloud Infrastructure Data Catalog διαθέτει ένα ενσωματωμένο επιχειρηματικό γλωσσάρι που διευκολύνει την επεξεργασία και τον εντοπισμό των κατάλληλων, αξιόπιστων δεδομένων.
- Oracle Big Data Service: Προσφέρει μια πλήρη υλοποίηση Cloudera Hadoop, με σημαντικά απλούστερες διαδικασίες διαχείρισης σε σχέση με άλλες λύσεις Hadoop, όπως η δυνατότητα να οριστεί υψηλή διαθεσιμότητα για ένα σύμπλεγμα (cluster) και να υλοποιηθεί ασφάλεια, με ένα μόνο κλικ. Η Oracle Big Data Service περιλαμβάνει επίσης μηχανική εκμάθηση για Spark, επιτρέποντας στους οργανισμούς να εκτελέσουν μηχανική εκμάθηση Spark στην μνήμη με ένα προϊόν και με ελάχιστη μετακίνηση δεδομένων.
- Oracle Cloud SQL: Επιτρέπει τη χρήση ερωτημάτων SQL σε δεδομένα σε περιβάλλον HDFS, Hive, Kafka, NoSQL και Object Storage. Μόνο η υπηρεσία Cloud SQL επιτρέπει σε κάθε χρήστη, εφαρμογή ή εργαλείο ανάλυσης με δυνατότητα συνομιλίας με βάσεις δεδομένων Oracle, να μπορεί με διαφάνεια να εργαστεί με δεδομένα από άλλους χώρους αποθήκευσης δεδομένων, με το πλεονέκτημα ενός μοντέλου επεξεργασίας push-down με δυνατότητες επέκτασης, για ελαχιστοποίηση των μετακινήσεων δεδομένων.
- Oracle Cloud Infrastructure Data Flow: Μια πλήρως διαχειριζόμενη υπηρεσία Big Data που επιτρέπει στους χρήστες να εκτελούν εφαρμογές Apache Spark χωρίς να χρειάζονται υλοποίηση ή διαχείριση υποδομής. Δίνει στις επιχειρήσεις τη δυνατότητα ταχύτερης παροχής εφαρμογών Big Data και AI. Σε αντίθεση με τις ανταγωνιστικές υπηρεσίες Hadoop και Spark, το Oracle Cloud Infrastructure Data Flow περιλαμβάνει μόνο ένα παράθυρο για την παρακολούθηση όλων των εργασιών Spark, κάνοντας απλή υπόθεση τον εντοπισμό δαπανηρών εργασιών και την αντιμετώπιση προβλημάτων.
- Oracle Cloud Infrastructure Virtual Machines for Data Science: Προδιαμορφωμένα περιβάλλοντα βασισμένα στην GPU, με κοινά IDEs, σημειωματάρια (notebooks) και frameworks που μπορούν να είναι έτοιμα για λειτουργία σε λιγότερο από 15 λεπτά, με κόστος $30 ανά ημέρα.