OLTP εναντίον OLAP



Το ακόλουθο ιστολόγιο μιλά σύντομα για OLTP εναντίον OLAP και τις διάφορες περιπτώσεις χρήσης.

OLTP εναντίον OLAP

Το OLTP λέγεται ότι είναι περισσότερο ένα διαδικτυακό σύστημα συναλλαγών ή σύστημα αποθήκευσης δεδομένων, όπου ο χρήστης κάνει πολλές διαδικτυακές συναλλαγές χρησιμοποιώντας το χώρο αποθήκευσης δεδομένων. Λέγεται επίσης ότι υπάρχουν περισσότερες ad-hoc αναγνώσεις / γραπτά σε πραγματικό χρόνο.





Το OLAP είναι περισσότερο ένα κατάστημα αποθήκευσης δεδομένων εκτός σύνδεσης. Έχει πρόσβασηπόσες φορέςμε τρόπο εκτός σύνδεσης. Για παράδειγμα, τα μαζικά αρχεία καταγραφής διαβάζονται και στη συνέχεια γράφονται πίσω σε αρχεία δεδομένων. Μερικές από τις κοινές περιοχές όπου χρησιμοποιείται το OLAP είναι Εργασίες καταγραφής, Εργασίες εξόρυξης δεδομένων κ.λπ.

Η Cassandra λέγεται ότι είναι περισσότερο OLTP, καθώς είναι σε πραγματικό χρόνο, ενώ το Hadoop είναι περισσότερο OLAP, δεδομένου ότι χρησιμοποιείται για αναλυτικά και μαζικά γράμματα.



Γιατί να ενσωματώσετε OLAP & OLTP;

Εάν σε περίπτωση που ψάχνετε τη φθηνότερη τιμή για κράτηση ξενοδοχείου τις επόμενες 365 ημέρες, εδώ έχετε ένα τεράστιο σύνολο δεδομένων για την Κασσάνδρα και θέλετε να έχετε πρόταση για βάση δεδομένων σε πραγματικό χρόνο, μια προσφορά εκτελείται με βάση την τιμή.

Σε ένα τέτοιο σενάριο, πρέπει να επαναλάβουμε όλα τα αρχεία και να διατηρήσουμε τα analytics πάνω από αυτό, κάτι που είναι μια τεράστια εργασία εκτός σύνδεσης που πρέπει να ξεκινά συχνά. Εδώ, το Hadoop μπαίνει στο παιχνίδι για τον περιορισμό των μαζικών δεδομένων.

Το άλλο πλεονέκτημα είναι ότι μπορούμε να τρέξουμε ένα σύμπλεγμα και να ακυρώσουμε τη λειτουργία ενός διαφορετικού συμπλέγματος Hadoop.



παράδειγμα στατικού μπλοκ στην Java

Το τρίτο όφελος είναι ότι μπορεί κανείς να μειώσει επίσης μεγάλο κόστος λειτουργίας.

Λαμβάνοντας υπόψη ένα σενάριο, στο οποίο, εάν ένας χρήστης είναι καλά έμπειρος σε διάφορα Hadoop Eco-συστήματα, όπως Hive, Pig Latin και πρέπει να ενσωματώσει δεδομένα σε αυτό, τότε πρέπει να συνδέσετε κάποια πηγή δεδομένων στην Κασσάνδρα και να προσπαθήσετε να εκτελέσετε το Map Μειώστε επίσης τις θέσεις εργασίας.

πώς να δοκιμάσετε μια βάση δεδομένων

Υπάρχει ένα αξιοσημείωτο μοτίβο μεταξύ OLTP & OLAP. Στο OLTP, υπάρχει λιγότερος αριθμός εγγραφών, π.χ. Πληροφορίες ξενοδοχείου. Υποθέτοντας ότι οι αλλαγές στην τιμή συμβαίνουν κάθε 5000 φορές το δευτερόλεπτο, οι αναγνώσεις μπορεί να είναι περισσότερες εδώ. Σε ένα τέτοιο σενάριο, μπορεί να υπάρχει 1 εγγραφή ανά δευτερόλεπτο, αλλά οι αναγνώσεις θα μπορούσαν να απομακρυνθούν σε εκατοντάδες και χιλιάδες. Έτσι, ο λόγος εδώ είναι περίπου 1: 1000.

Είναι μια ενδιαφέρουσα παρατήρηση ότι η Cassandra μπορεί να χωρέσει εύκολα σε αυτό το μοντέλο, το οποίο περιλαμβάνει μοντέλα, όπου η ανάγνωση / εγγραφή είναι ίση. Επίσης, όταν πρόκειται για OLTP, ακόμη και αν κάποιος μπαίνει σε ένα μοντέλο με δυνατότητα συντονισμού και ισχυρής συνέπειας, μπορεί κανείς να δει ένα χιλιοστό του δευτερολέπτου κενό μεταξύ των ενδεχόμενων σταθερών μοντέλων και των ισχυρότερων μοντέλων. Έτσι, η Cassandra μπορεί να χωρέσει στο OLTP.

Ερχόμενοι στο OLAP, μπορεί κανείς να δει διαφορετικά μοτίβα OLAP, πράγμα που σημαίνει ότι υπάρχουν πολλές εγγραφές που συμβαίνουν ταυτόχρονα. Στο OLAP, απορρίπτουμε δεδομένα σε μία λήψη, δηλαδή όλα τα αρχεία καταγραφής τοποθετούνται στο χώρο αποθήκευσης δεδομένων και στη συνέχεια αρχίζουμε την επεξεργασία. Το μοτίβο δεδομένων ή το μοτίβο πρόσβασης είναι ακριβώς το αντίθετο του είδους εφαρμογής OLTP. Εδώ, το Hadoop ή το MapReduce θα είναι χρήσιμο.

Έχετε μια ερώτηση για εμάς; Αναφέρετέ τα στην ενότητα σχολίων και θα επικοινωνήσουμε μαζί σας.

Σχετικές αναρτήσεις:

Κορυφαίοι 5 λόγοι για να μάθετε την Κασσάνδρα