Γιατί πρέπει να συνδυάσετε όταν μπορείτε ήδη να συμμετάσχετε στο Tableau;



Ανάμειξη δεδομένων στο Tableau - μια μέθοδος που χρησιμοποιείται όταν υπάρχουν σχετικά δεδομένα σε πολλές πηγές δεδομένων, την οποία θέλετε να αναλύσετε μαζί σε μία προβολή.

Σε έναν κόσμο που παράγει και καταναλώνει 2,5 quintillion byte δεδομένων, μια μέρα, οι οργανισμοί είναι υποχρεωμένοι να αναζητούν νέες μεθόδους για τον μετασχηματισμό και τον συνδυασμό δεδομένων προκειμένου να επιτύχουν τη βέλτιστη απόδοση. Μια τέτοια μέθοδος συνδυασμού δεδομένων είναι Ανάμειξη δεδομένων στο Tableau .

Τώρα, επειδή αυτό εξυπηρετεί έναν τόσο σημαντικό σκοπό στον κύκλο δεδομένων οποιουδήποτε δεδομένου οργανισμού, δημιουργεί μια πολύ ουσιαστική ενότητα στα περισσότερα . Σε αυτό το blog, θα συζητήσουμε τις ακόλουθες έννοιες:





Γιατί χρειάζεστε ανάμειξη δεδομένων στο Tableau;

Ας υποθέσουμε ότι είστε Πίνακας προγραμματιστή ο οποίος έχει αποθηκευμένα δεδομένα συναλλαγών στο Salesforce και δεδομένα ορίων αποθηκευμένα στην Access. Τα δεδομένα που θέλετε να συνδυάσετε αποθηκεύονται σε διαφορετικές βάσεις δεδομένων και η λεπτομέρεια των δεδομένων που καταγράφονται σε κάθε πίνακα είναι διαφορετική στις δύο πηγές δεδομένων, επομένως η ανάμειξη δεδομένων είναι ο καλύτερος τρόπος για να συνδυάσετε αυτά τα δεδομένα.

Η ανάμειξη δεδομένων είναι χρήσιμη υπό τις ακόλουθες συνθήκες:



  1. Θέλετε να συνδυάσετε δεδομένα από διαφορετικές βάσεις δεδομένων που δεν υποστηρίζονται από συνδέσεις μεταξύ βάσεων δεδομένων.

    Οι συνδέσεις μεταξύ βάσεων δεδομένων δεν υποστηρίζουν συνδέσεις σε κύβους (για παράδειγμα, Oracle Essbase) ή σε ορισμένες συνδέσεις μόνο για εξαγωγή (για παράδειγμα, Google Analytics). Σε αυτήν την περίπτωση, ρυθμίστε μεμονωμένες πηγές δεδομένων για τα δεδομένα που θέλετε να αναλύσετε και, στη συνέχεια, χρησιμοποιήστε ανάμειξη δεδομένων για να συνδυάσετε τις πηγές δεδομένων σε ένα μόνο φύλλο.

  2. Τα δεδομένα βρίσκονται σε διαφορετικά επίπεδα λεπτομέρειας.

    Μερικές φορές ένα σύνολο δεδομένων συλλαμβάνει δεδομένα χρησιμοποιώντας διάφορα επίπεδα λεπτομέρειας δηλαδή, μεγαλύτερη ή μικρότερη ευκρίνεια από την άλλη ομάδα δεδομένων.

    Για παράδειγμα, ας υποθέσουμε ότι αναλύετε δεδομένα συναλλαγών και δεδομένα ποσοστώσεων. Τα δεδομένα συναλλαγών ενδέχεται να συλλάβουν όλες τις συναλλαγές. Ωστόσο, τα δεδομένα ποσοστώσεων ενδέχεται να συγκεντρώνουν συναλλαγές σε επίπεδο τριμήνου. Επειδή οι τιμές συναλλαγής καταγράφονται σε διαφορετικά επίπεδα λεπτομέρειας σε κάθε σύνολο δεδομένων, θα πρέπει να χρησιμοποιήσετε την ανάμειξη δεδομένων για να συνδυάσετε τα δεδομένα.



Τι είναι η ανάμειξη δεδομένων στο Tableau;

Το Data Blending είναι ένα πολύ ισχυρό χαρακτηριστικό στο Σανίδα . Χρησιμοποιείται όταν υπάρχουν σχετικά δεδομένα σε πολλές πηγές δεδομένων, τα οποία θέλετε να αναλύσετε μαζί σε μία προβολή. Είναι μια μέθοδος συνδυασμού δεδομένων που συμπληρώνει έναν πίνακα δεδομένων από μία πηγή δεδομένων με στήλες δεδομένων από άλλη πηγή δεδομένων.

Συνήθως, χρησιμοποιείτε συνδέσεις για την εκτέλεση αυτού του είδους συνδυασμού δεδομένων, αλλά υπάρχουν φορές, ανάλογα με παράγοντες όπως ο τύπος των δεδομένων και η λεπτομέρεια, όταν είναι καλύτερα να χρησιμοποιήσετε την ανάμειξη δεδομένων.

Πώς διαφέρει από τη σύνδεση δεδομένων;

Η ανάμειξη δεδομένων προσομοιώνει μια παραδοσιακή αριστερή ένωση. Η κύρια διαφορά μεταξύ των δύο είναι πότε η ένωση πραγματοποιείται σε σχέση με τη συγκέντρωση.

Αριστερή συμμετοχή

Όταν χρησιμοποιείτε έναν αριστερό σύνδεσμο για να συνδυάσετε δεδομένα, αποστέλλεται ένα ερώτημα στη βάση δεδομένων όπου πραγματοποιείται η σύνδεση. Η χρήση ενός αριστερού συνδέσμου επιστρέφει όλες τις σειρές από τον αριστερό πίνακα και τυχόν σειρές από το δεξί πίνακα που αντιστοιχεί σε αντίστοιχη σειρά στον αριστερό πίνακα. Στη συνέχεια, τα αποτελέσματα της συμμετοχής αποστέλλονται και συγκεντρώνονται από τον Tableau.

Για παράδειγμα, ας υποθέσουμε ότι έχετε τους παρακάτω πίνακες. Εάν οι κοινές στήλες είναι ταυτότητα χρήστη , μια αριστερή ένωση παίρνει όλα τα δεδομένα από τον αριστερό πίνακα, καθώς και όλα τα δεδομένα από τον δεξιό πίνακα, επειδή κάθε σειρά έχει μια αντίστοιχη αντιστοίχιση σειράς στον αριστερό πίνακα.

Συμμετοχή δεδομένων - Ανάμειξη δεδομένων στο Tableau - EdurekaΑνάμειξη δεδομένων

Όταν χρησιμοποιείτε ανάμειξη δεδομένων για να συνδυάσετε δεδομένα, αποστέλλεται ένα ερώτημα στη βάση δεδομένων για κάθε πηγή δεδομένων που χρησιμοποιείται στο φύλλο. Τα αποτελέσματα των ερωτημάτων, συμπεριλαμβανομένων των συγκεντρωτικών δεδομένων, αποστέλλονται και συνδυάζονται από το Tableau. Η προβολή χρησιμοποιεί όλες τις σειρές από την κύρια πηγή δεδομένων, τον αριστερό πίνακα και τις συγκεντρωτικές σειρές από τη δευτερεύουσα πηγή δεδομένων, τον δεξιό πίνακα, βάσει της διάστασης των πεδίων σύνδεσης.

Μπορείτε να αλλάξετε το πεδίο σύνδεσης ή να προσθέσετε περισσότερα πεδία σύνδεσης για να συμπεριλάβετε διαφορετικές ή πρόσθετες σειρές δεδομένων από τη δευτερεύουσα πηγή δεδομένων στο μείγμα, αλλάζοντας τις συγκεντρωτικές τιμές.

Για παράδειγμα, ας υποθέσουμε ότι έχετε τους παρακάτω πίνακες. Εάν τα πεδία σύνδεσης είναι ταυτότητα χρήστη Και στους δύο πίνακες η ανάμειξη των δεδομένων σας παίρνει όλα τα δεδομένα από τον αριστερό πίνακα και συμπληρώνει τον αριστερό πίνακα με τα δεδομένα από τον δεξιό πίνακα. Σε αυτήν την περίπτωση, δεν μπορούν όλες οι τιμές να είναι μέρος του πίνακα που προκύπτει λόγω των εξής:

  • Μια σειρά στον αριστερό πίνακα δεν έχει αντίστοιχη αντιστοίχιση γραμμής στον δεξιό πίνακα, όπως υποδεικνύεται από την τιμή null.
  • Υπάρχουν πολλές αντίστοιχες τιμές στις σειρές στον σωστό πίνακα, όπως υποδεικνύεται από τον αστερίσκο (*).

Ας υποθέσουμε ότι έχετε τους ίδιους πίνακες όπως παραπάνω, αλλά η δευτερεύουσα πηγή δεδομένων περιέχει ένα νέο πεδίο που ονομάζεται Σκοποί . Και πάλι, εάν το πεδίο σύνδεσης είναι ταυτότητα χρήστη , η ανάμειξη των δεδομένων σας παίρνει όλα τα δεδομένα από τον αριστερό πίνακα και τα συμπληρώνει με δεδομένα από τον δεξιό πίνακα. Σε αυτήν την περίπτωση, βλέπετε την ίδια μηδενική τιμή και τους αστερίσκους στο προηγούμενο παράδειγμα εκτός από τα ακόλουθα:

  • Επειδή η Σκοποί Το πεδίο είναι ένα μέτρο, βλέπετε τις τιμές γραμμής για τοΣκοποίπεδίο συγκεντρωτικό πριν τα δεδομένα στον δεξιό πίνακα συνδυαστεί με τα δεδομένα στον αριστερό πίνακα.
  • Όπως με το προηγούμενο παράδειγμα, μια σειρά στον αριστερό πίνακα δεν έχει την αντίστοιχη σειρά για το Σκοποί πεδίο, όπως υποδεικνύεται από τη δεύτερη τιμή null.

Πότε πρέπει να αντικαταστήσετε τη συμμετοχή στο Ανάμειξη

1. Τα δεδομένα χρειάζονται καθαρισμό.

Εάν οι πίνακες σας δεν ταιριάζουν μεταξύ τους σωστά μετά από μια ένωση, ρυθμίστε τις πηγές δεδομένων για κάθε πίνακα, πραγματοποιήστε τις απαραίτητες προσαρμογές (δηλαδή, μετονομασία στηλών, αλλαγή τύπων δεδομένων στήλης, δημιουργία ομάδων, χρήση υπολογισμών κ.λπ.) και στη συνέχεια χρησιμοποιήστε την ανάμειξη δεδομένων για να συνδυάσετε τα δεδομένα.

2. Οι συνδέσεις προκαλούν διπλά δεδομένα.

Τα διπλά δεδομένα μετά από μια ένωση είναι ένα σύμπτωμα δεδομένων σε διαφορετικά επίπεδα λεπτομέρειας. Εάν παρατηρήσετε διπλά δεδομένα, αντί να δημιουργήσετε μια ένωση, χρησιμοποιήστε την ανάμειξη δεδομένων για να συνδυάσετε μια κοινή διάσταση.

3. Έχετε πολλά δεδομένα.

Συνήθως, οι συνδέσεις συνιστώνται για το συνδυασμό δεδομένων από την ίδια βάση δεδομένων. Οι συνδέσεις αντιμετωπίζονται από τη βάση δεδομένων, η οποία επιτρέπει στους συνδέσμους να αξιοποιούν ορισμένες από τις εγγενείς δυνατότητες της βάσης δεδομένων. Ωστόσο, εάν εργάζεστε με μεγάλα σύνολα δεδομένων, οι συνδέσεις μπορούν να προκαλέσουν πίεση στη βάση δεδομένων και να επηρεάσουν σημαντικά την απόδοση. Σε αυτήν την περίπτωση, η ανάμειξη δεδομένων μπορεί να βοηθήσει. Επειδή το Tableau χειρίζεται το συνδυασμό δεδομένων μετά τη συγκέντρωση των δεδομένων, υπάρχουν λιγότερα δεδομένα για συνδυασμό. Όταν υπάρχουν λιγότερα δεδομένα για συνδυασμό, γενικά, η απόδοση βελτιώνεται.

Συνδυασμός των δεδομένων σας στο Tableau

Μπορείτε να χρησιμοποιήσετε την ανάμειξη δεδομένων όταν έχετε δεδομένα σε ξεχωριστές πηγές δεδομένων που θέλετε να αναλύσετε μαζί σε ένα μόνο φύλλο. Το Tableau έχει δύο ενσωματωμένες πηγές δεδομένων Δείγμα-υπερκατάστημα και Δείγμα αλυσίδας καφέ.mdb που θα χρησιμοποιηθεί για την απεικόνιση της ανάμειξης δεδομένων.

Βήμα 1: Συνδεθείτε στα δεδομένα σας και ρυθμίστε τις πηγές δεδομένων

  • Συνδεθείτε σε ένα σύνολο δεδομένων και ρυθμίστε την πηγή δεδομένων στη σελίδα προέλευσης δεδομένων. Ενα inbuilt πηγή δεδομένων Δείγμα αλυσίδας καφέ.mdb ,το οποίο είναι ένα αρχείο βάσης δεδομένων MS Access, θα χρησιμοποιηθεί για την απεικόνιση της ανάμειξης δεδομένων.
  • Παω σε Δεδομένα > Νέα πηγή δεδομένων, συνδεθείτε στο δεύτερο σύνολο δεδομένων.Αυτό το παράδειγμα χρησιμοποιεί το Δείγμα - Superstore πηγή δεδομένων. Τστη συνέχεια ρυθμίστε την πηγή δεδομένων.
  • Κάντε κλικ στην καρτέλα φύλλων για να ξεκινήσετε να δημιουργείτε την προβολή σας.

Βήμα 2: Ορίστε μια κύρια πηγή δεδομένων

  • Σύρετε τουλάχιστον ένα πεδίο από την κύρια πηγή δεδομένων σας στην προβολή για να το ορίσετε ως κύρια πηγή δεδομένων. Στο Δεδομένα στο παράθυρο, κάντε κλικ στην πηγή δεδομένων που θέλετε να ορίσετε ως κύρια πηγή δεδομένων. Σε αυτό το παράδειγμα, Δείγμα αλυσίδας καφέ έχει επιλεγεί.
  • Το παρακάτω στιγμιότυπο οθόνης δείχνει τους διαφορετικούς πίνακες και συνδέσεις που διατίθενται στο αρχείο.

Βήμα 3: Ορίστε μια δευτερεύουσα πηγή δεδομένων

  • Τα πεδία που χρησιμοποιούνται στην προβολή από πηγές δεδομένων που δεν είναι η κύρια πηγή δεδομένων ή οι ενεργές συνδέσεις ορίζουν αυτόματα τις επόμενες πηγές δεδομένων ως δευτερεύουσα πηγή δεδομένων. Σε αυτήν την περίπτωση, Sample Superstore.

Βήμα 4: Συνδυασμός δεδομένων

  • Τώρα μπορείτε να ενσωματώσετε τα δεδομένα και από τις δύο πηγές με βάση μια κοινή διάσταση ( κατάσταση , σε αυτήν την περίπτωση). Σημειώστε ότι μια μικρή εικόνα συνδέσμου εμφανίζεται δίπλα στην ιδιότητα - Κατάσταση. Αυτό δείχνει την κοινή διάσταση μεταξύ των δύο πηγών δεδομένων.
  • Ας υποθέσουμε ότι δημιουργείτε ένα γράφημα ράβδων με Αναλογία κερδών στο ράφι στηλών και κατάσταση στο Row Shelf, το γράφημα δείχνει πώς η αναλογία κέρδους ποικίλλει για κάθε πολιτεία τόσο στο σούπερ μάρκετ όσο και στα καφενεία.

Περιορισμοί ανάμειξης δεδομένων στο Tableau

  1. Υπάρχουν ορισμένοι περιορισμοί ανάμειξης δεδομένων γύρω από μη προσθετικά αδρανή, όπως ΔΙΑΜΕΣΟΣ , και RAWSQLAGG .
  2. Η ανάμειξη δεδομένων θέτει σε κίνδυνο την ταχύτητα του ερωτήματος σε υψηλή ανάλυση.
  3. Όταν προσπαθείτε να ταξινομήσετε με βάση ένα υπολογισμένο πεδίο που χρησιμοποιεί συνδυασμένα δεδομένα, το υπολογιζόμενο πεδίο δεν περιλαμβάνεται στην αναπτυσσόμενη λίστα Πεδίο του πλαισίου διαλόγου Ταξινόμηση.
  4. Οι πηγές δεδομένων Cube μπορούν να χρησιμοποιηθούν μόνο ως η κύρια πηγή δεδομένων για την ανάμιξη δεδομένων στο Tableau. Δεν μπορούν να χρησιμοποιηθούν ως δευτερεύουσες πηγές δεδομένων.

Ελπίζω όλοι, τώρα, να έχετε μια δίκαιη ιδέα Ανάμειξη δεδομένων στο Tableau από αυτό το ιστολόγιο. Θέλετε περισσότερες γνώσεις; Μην ανησυχείτε, αυτό το βίντεο θα σας δώσει μια καλύτερη κατανόηση της έννοιας.

γράφημα ντόνατ vs γράφημα πίτας