Python Seaborn Tutorial: Τι είναι το Seaborn και πώς να το χρησιμοποιήσετε;



Εκμάθηση Python Seaborn κατά μήκος της διαφοράς μεταξύ του θαλάσσιου και του matplotlib. Επίσης, μάθετε για τις διάφορες λειτουργίες και τις προσαρμογές που διατίθενται στο θαλάσσιο κόλπο.

Η Python είναι μια αποθήκη πολλών εξαιρετικά ισχυρών βιβλιοθηκών και πλαισίων. Μεταξύ αυτών, είναι Θαλασσοπόρος, που είναι κυρίαρχο οπτικοποίηση δεδομένων βιβλιοθήκη, δίνοντας έναν ακόμη λόγο για την ολοκλήρωση των προγραμματιστών . Σε αυτό το Python Seaborn Tutorial, θα ακουμπήσετε όλες τις δυνατότητες της οπτικοποίησης δεδομένων χρησιμοποιώντας το Seaborn.

Πριν προχωρήσουμε, ας ρίξουμε μια ματιά σε όλα τα θέματα συζήτησης σε αυτό το άρθρο:





Ας ξεκινήσουμε πρώτα, εξηγώντας τη σημασία του Python Seaborn.

Γιατί να χρησιμοποιήσετε το Python Seaborn;

Όπως αναφέρθηκε προηγουμένως, η βιβλιοθήκη Python Seaborn χρησιμοποιείται για να διευκολύνει την απαιτητική εργασία της οπτικοποίησης δεδομένων και βασίζεται σε . Το Seaborn επιτρέπει τη δημιουργία στατιστικών γραφικών μέσω των ακόλουθων λειτουργιών:



  • Ένα API που βασίζεται σε σύνολα δεδομένων που επιτρέπουν τη σύγκριση μεταξύ πολλαπλών μεταβλητές

  • Υποστηρίζει πλέγματα πολλαπλών επιπέδων που με τη σειρά τους διευκολύνουν την κατασκευή σύνθετων απεικονίσεων

  • Οι απεικονίσεις univariate και bivariate είναι διαθέσιμες για σύγκριση μεταξύ υποσυνόλων δεδομένων



  • Διαθεσιμότητα διαφορετικών παλετών χρωμάτων για να αποκαλυφθούν διάφορα είδη σχεδίων

  • Εκτιμήσεις και οικόπεδα αυτομάτως

Έτσι, εάν αναρωτιέστε γιατί να χρησιμοποιήσετε το Seaborn όταν έχετε ήδη Matplotlib, εδώ είναι η απάντηση σε αυτό.

Python Seaborn εναντίον Matplotlib:

'Εάν ο Matplotlib' προσπαθεί να κάνει τα εύκολα πράγματα εύκολα και δύσκολα πράγματα ', ο θαλασσοπόρος προσπαθεί να κάνει και ένα καλά καθορισμένο σύνολο σκληρών πραγμάτων' - Michael Waskom (Δημιουργός Seaborn).
Στην πραγματικότητα, το Matplotlib είναι καλό, αλλά ο Seaborn είναι καλύτερος. Υπάρχουν βασικά δύο μειονεκτήματα του Matplotlib που επιδιορθώνει ο Seaborn:

  1. Το Matplotlib μπορεί να εξατομικευτεί, αλλά είναι δύσκολο να καταλάβουμε ποιες ρυθμίσεις απαιτούνται για να γίνουν πιο ελκυστικές οι πλοκές. Από την άλλη πλευρά, το Seaborn διαθέτει πολλά προσαρμοσμένα θέματα και διεπαφές υψηλού επιπέδου για την επίλυση αυτού του ζητήματος.

  2. Όταν εργάζεστε με Πάντες , Το Matplotlib δεν λειτουργεί καλά όταν πρόκειται για την αντιμετώπιση των DataFrames, ενώ οι λειτουργίες του Seaborn λειτουργούν πραγματικά στα DataFrames.

Πώς να εγκαταστήσετε το Seaborn;

Για να εγκαταστήσετε τη βιβλιοθήκη Python Seaborn, μπορείτε να χρησιμοποιήσετε τις ακόλουθες εντολές με βάση την πλατφόρμα που χρησιμοποιείτε:

εγκατάσταση pip seaborn

ή

conda εγκαταστήστε θαλάσσιο

Μόλις εγκατασταθεί, απλώς φροντίστε να εγκαταστήσετε τα πακέτα και τις βιβλιοθήκες στις οποίες εξαρτάται το seaborn.

Εγκατάσταση εξαρτήσεων Python Seaborn:

Οι υποχρεωτικές εξαρτήσεις για τον θαλάσσιο κόλπο είναι:

Υπάρχει επίσης μια συνιστώμενη εξάρτηση που είναι:

  • μοντέλα κατάστασης

Για να εγκαταστήσετε αυτές τις βιβλιοθήκες, μπορείτε να χρησιμοποιήσετε τις ίδιες εντολές με αυτές που εμφανίζονται προηγουμένως για το Seaborn με τα αντίστοιχα ονόματά τους. Μόλις εγκατασταθούν, μπορούν να εισαχθούν εύκολα. Το Seaborn σάς επιτρέπει να φορτώνετε οποιοδήποτε σύνολο δεδομένων από χρησιμοποιώντας το load_dataset () λειτουργία. Μπορείτε επίσης να δείτε όλα τα διαθέσιμα σύνολα δεδομένων χρησιμοποιώντας τη συνάρτηση get_dataset_names () ως εξής:

ΠΑΡΑΔΕΙΓΜΑ:

εισαγωγή seaborn ως sns sns.get_dataset_names ()

Αυτό θα επιστρέψει μια λίστα με όλα τα διαθέσιμα σύνολα δεδομένων.
Τώρα που έχετε ρυθμίσει το περιβάλλον σας για να εργαστείτε με τον θαλασσοπόρο, ας προχωρήσουμε περαιτέρω για να δούμε πώς να το χρησιμοποιήσουμε .

Λειτουργίες Plotting Seaborn

Οπτικοποίηση των στατιστικών σχέσεων:

Η διαδικασία κατανόησης των σχέσεων μεταξύ μεταβλητών ενός συνόλου δεδομένων και πώς αυτές οι σχέσεις, με τη σειρά τους, εξαρτώνται από άλλες μεταβλητές είναι γνωστή ως στατιστική ανάλυση. Ας ρίξουμε μια πιο βαθιά ματιά στις λειτουργίες που απαιτούνται για αυτό:

μετεγκατάσταση ():

Αυτή είναι μια συνάρτηση επιπέδου σχήματος που χρησιμοποιεί δύο άλλες συναρτήσεις αξόνων για την οπτικοποίηση των στατιστικών σχέσεων που είναι:

  • διάγραμμα διασποράς()
  • παρτίδα ()

Αυτές οι συναρτήσεις μπορούν να καθοριστούν χρησιμοποιώντας την παράμετρο «kind» του relplot (). Σε περίπτωση που δοθεί αυτή η παράμετρος, παίρνει την προεπιλεγμένη τιμή που είναι το scatterplot (). Πριν ξεκινήσετε να γράφετε τον κωδικό σας, φροντίστε να εισαγάγετε τις απαιτούμενες βιβλιοθήκες ως εξής:

εισαγωγή numpy ως np import pandas ως pd import matplotlib.pyplot as plt import seaborn as sns sns.set (style = 'darkgrid')

Λάβετε υπόψη ότι το χαρακτηριστικό στυλ είναι επίσης προσαρμόσιμο και μπορεί να έχει οποιαδήποτε αξία όπως σκοτεινό πλέγμα, τσιμπούρια κ.λπ. που θα συζητήσω αργότερα στην ενότητα πλοκή-αισθητική. Ας ρίξουμε μια ματιά σε ένα μικρό παράδειγμα:

ΠΑΡΑΔΕΙΓΜΑ:

f = sns.load_dataset («πτήσεις») sns.relplot (x = «επιβάτες», y = «μήνας», δεδομένα = f)

ΠΑΡΑΓΩΓΗ:

Πτήσεις1-Python Seaborn Tutorial-Edureka

Όπως μπορείτε να δείτε, τα σημεία απεικονίζονται σε 2 διαστάσεις. Ωστόσο, μπορείτε να προσθέσετε μια άλλη διάσταση χρησιμοποιώντας το σημασιολογικό «απόχρωση». Ας ρίξουμε μια ματιά σε ένα παράδειγμα του ίδιου:

πώς να χρησιμοποιήσετε το system.exit στο java

ΠΑΡΑΔΕΙΓΜΑ:

f = sns.load_dataset («πτήσεις») sns.relplot (x = «επιβάτες», y = «μήνας», απόχρωση = «έτος», δεδομένα = στ)

Θα δείτε την ακόλουθη έξοδο:

ΠΑΡΑΓΩΓΗ:

Ωστόσο, υπάρχουν πολλές ακόμη προσαρμογές που μπορείτε να δοκιμάσετε, όπως χρώματα, στυλ, μέγεθος κ.λπ. Επιτρέψτε μου να δείξω πώς μπορείτε να αλλάξετε το χρώμα στο ακόλουθο παράδειγμα:

ΠΑΡΑΔΕΙΓΜΑ:

sns.set (style = 'darkgrid') f = sns.load_dataset ('Flights') sns.relplot (x = 'επιβάτες', y = 'μήνας', hue = 'έτος', παλέτα = 'ch: r = - .5, l = .75 ', δεδομένα = f)

ΠΑΡΑΓΩΓΗ:

παρτίδα ():

Αυτή η λειτουργία θα σας επιτρέψει να σχεδιάσετε μια συνεχή γραμμή για τα δεδομένα σας. Μπορείτε να χρησιμοποιήσετε αυτήν τη λειτουργία αλλάζοντας την παράμετρο «είδος» ως εξής:

ΠΑΡΑΔΕΙΓΜΑ:

a = pd.DataFrame ({'Day': [1,2,3,4,5,6,7], 'Grocery': [30,80,45,23,51,46,76], 'Ρούχα' : [13,40,34,23,54,67,98], «Σκεύη»: [12,32,27,56,87,54,34]}, δείκτης = [1,2,3,4,5 , 6,7]) g = sns.relplot (x = 'Day', y = 'Clothes', kind = 'line', data = a) g.fig.autofmt_xdate ()

ΠΑΡΑΓΩΓΗ:

Η προεπιλογή για το lineplot είναι y ως συνάρτηση του x. Ωστόσο, μπορεί να αλλάξει εάν θέλετε να το κάνετε. Υπάρχουν πολλές ακόμη επιλογές που μπορείτε να δοκιμάσετε περαιτέρω.

Ας ρίξουμε μια ματιά στο πώς να σχεδιάσουμε κατηγορηματικά δεδομένα.

Σχεδιασμός με κατηγοριακά δεδομένα:

Αυτή η προσέγγιση έρχεται στην εικόνα όταν η κύρια μεταβλητή μας χωρίζεται περαιτέρω σε διακριτές ομάδες (κατηγορηματική). Αυτό μπορεί να επιτευχθεί χρησιμοποιώντας τη λειτουργία catplot ().

catplot ():

Αυτή είναι μια λειτουργία-επίπεδο-επίπεδο όπως το relplot (). Μπορεί να χαρακτηρίζεται από τρεις οικογένειες λειτουργιών επιπέδου αξόνων, συγκεκριμένα:

  1. Scatterplots - Σε αυτά περιλαμβάνονται το stripplot (), το swarmplot ()

    αφαίρεση δεδομένων c ++
  2. Οικόπεδα διανομής - που είναι boxplot (), violinplot (), boxenplot ()

  3. Estimateplots - συγκεκριμένα pointplot (), barplot (), countplot ()

Ας πάρουμε τώρα μερικά παραδείγματα για να το δείξουμε αυτό:

ΠΑΡΑΔΕΙΓΜΑ:

εισαγωγή seaborn ως sns εισαγωγή matplotlib.pyplot ως plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', δεδομένα = α)

ΠΑΡΑΓΩΓΗ:

Όπως μπορείτε να δείτε, στο παραπάνω παράδειγμα δεν έχω ορίσει την παράμετρο «είδος». Επομένως, επέστρεψε το γράφημα ως το προεπιλεγμένο scatterplot. Μπορείτε να καθορίσετε οποιαδήποτε από τις λειτουργίες επιπέδου αξόνων για να αλλάξετε το γράφημα όπως χρειάζεται. Ας πάρουμε επίσης ένα παράδειγμα αυτού:

ΠΑΡΑΔΕΙΓΜΑ:

εισαγωγή seaborn ως sns εισαγωγή matplotlib.pyplot ως plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', kind = 'βιολί', δεδομένα = α)

ΠΑΡΑΓΩΓΗ:

Η παραπάνω έξοδος δείχνει το βιογραφικό σχέδιο για το σύνολο δεδομένων συμβουλών. Τώρα ας προσπαθήσουμε να βρούμε πώς να απεικονίσουμε την κατανομή ενός συνόλου δεδομένων.

Οπτικοποίηση της διανομής ενός συνόλου δεδομένων:

Αυτό βασικά ασχολείται με την κατανόηση συνόλων δεδομένων με το πλαίσιο να είναι univariate ή bivariate. Πριν ξεκινήσετε με αυτό, απλώς εισαγάγετε τα ακόλουθα:

import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from scipy import stats sns.set (color_codes = True)

Μόλις γίνει αυτό, μπορείτε να συνεχίσετε να σχεδιάζετε univariate και bivariate διανομές.

Σχεδιασμός Univariate διανομών:

Για να τα σχεδιάσετε, μπορείτε να χρησιμοποιήσετε τη λειτουργία distplot () ως εξής:

ΠΑΡΑΔΕΙΓΜΑ:

a = np.random.normal (loc = 5, size = 100, scale = 2) sns.distplot (α)

ΠΑΡΑΓΩΓΗ:

Όπως μπορείτε να δείτε στο παραπάνω παράδειγμα, έχουμε σχεδιάσει ένα γράφημα για τη μεταβλητή α της οποίας οι τιμές δημιουργούνται από τη συνήθη () συνάρτηση χρησιμοποιώντας το distplot.

Σχεδιασμός διμερών διανομών:

Αυτό έρχεται σε εικόνα όταν έχετε δύο τυχαίες ανεξάρτητες μεταβλητές με αποτέλεσμα πιθανό συμβάν. Η καλύτερη λειτουργία για να σχεδιάσετε αυτούς τους τύπους γραφημάτων είναι το jointplot (). Ας σχεδιάσουμε τώρα ένα διμερές γράφημα χρησιμοποιώντας το jointplot ().

ΠΑΡΑΔΕΙΓΜΑ:

x = pd.DataFrame ({'Day': [1,2,3,4,5,6,7], 'Grocery': [30,80,45,23,51,46,76], 'Ρούχα' : [13,40,34,23,54,67,98], «Σκεύη»: [12,32,27,56,87,54,34]}, δείκτης = [1,2,3,4,5 , 6,7]) y = pd.DataFrame ({'Day': [8,9,10,11,12,13,14], 'Grocery': [30,80,45,23,51,46, 76], «Ρούχα»: [13,40,34,23,54,67,98], «Σκεύη»: [12,32,27,56,87,54,34]}, δείκτης = [8,9 , 10,11,12,13,14]) μέσος όρος, cov = [0, 1], [(1, .5), (.5, 1)] data = np.random.multivariate_normal (μέσος όρος, cov, 200 ) με sns.axes_style ('white'): sns.jointplot (x = x, y = y, kind = 'kde', color = 'b')

ΠΑΡΑΓΩΓΗ:

Τώρα που έχετε κατανοήσει τις διάφορες λειτουργίες του Python Seaborn, ας προχωρήσουμε για να δημιουργήσουμε δομημένα πλέγματα πολλαπλών επιπέδων.

Πολλαπλά πλέγματα:

Το Python Seaborn σας επιτρέπει να σχεδιάσετε πολλά πλέγματα δίπλα-δίπλα. Αυτά είναι βασικά γραφήματα ή γραφήματα που σχεδιάζονται χρησιμοποιώντας την ίδια κλίμακα και άξονες για να βοηθήσουν τη σύγκριση μεταξύ τους. Αυτό, με τη σειρά του, βοηθά τον προγραμματιστή να κάνει γρήγορη διάκριση μεταξύ των σχεδιαγραμμάτων και να λάβει μεγάλες ποσότητες πληροφοριών.

Εξετάστε το ακόλουθο παράδειγμα της συνάρτησης facetgrid () για να σχεδιάσετε αυτά τα γραφήματα.

ΠΑΡΑΔΕΙΓΜΑ:

sns.set (style = 'darkgrid') a = sns.load_dataset ('iris') b = sns.FacetGrid (a, col = 'species') b.map (plt.hist, 'sepal_length')

ΠΑΡΑΓΩΓΗ:

Η παραπάνω έξοδος δείχνει σαφώς τη σύγκριση μεταξύ των συμβουλών που δίνονται κατά τη διάρκεια του γεύματος και του δείπνου. Μπορείτε επίσης να σχεδιάσετε χρησιμοποιώντας τη συνάρτηση PairGrid όταν έχετε ένα ζευγάρι μεταβλητών για σύγκριση. Εξετάστε το ακόλουθο παράδειγμα.

ΠΑΡΑΔΕΙΓΜΑ:

sns.set (style = 'ticks') a = sns.load_dataset ('Flights') b = sns.PairGrid (a) b.map (plt.scatter)

ΠΑΡΑΓΩΓΗ:

Όπως μπορείτε να δείτε, η παραπάνω έξοδος συγκρίνεται σαφώς μεταξύ του έτους και του αριθμού των επιβατών με διαφορετικούς τρόπους.

Το Seaborn επιτρέπει επίσης προσαρμογές σχετικά με την αισθητική, οι οποίες συζητούνται περαιτέρω.

Οικόπεδο-Αισθητική:

Αυτό το τμήμα του εκπαιδευτικού προγράμματος Python Seaborn ασχολείται με το να κάνουμε τα οικόπεδά μας πιο ελκυστικά και ευχάριστα.

Python Seaborn Σχήμα-Αισθητική:

Η πρώτη συνάρτηση που θα συζητήσω έχει οριστεί (). Έχω χρησιμοποιήσει την παράμετρο 'style' αυτής της λειτουργίας στο παρελθόν. Αυτή η παράμετρος βασικά ασχολείται με θέματα θαλασσοπόρων. Προς το παρόν, υπάρχουν πέντε από αυτά διαθέσιμα, δηλαδή darkgrid, ticks, whitegrid, white και dark.

Εξετάστε το ακόλουθο παράδειγμα που δείχνει το λευκό θέμα.

ΠΑΡΑΔΕΙΓΜΑ:

εισαγωγή seaborn ως sns εισαγωγή matplotlib.pyplot ως plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', δεδομένα = α)

ΠΑΡΑΓΩΓΗ:

Στην παραπάνω έξοδο, μπορείτε να παρατηρήσετε ότι το θέμα έχει αλλάξει σε λευκό. Μπορείτε να τα εξερευνήσετε περαιτέρω χρησιμοποιώντας τα άλλα θέματα. Εάν παρατηρήσετε στην προηγούμενη έξοδο, υπάρχουν άξονες γύρω από το γράφημα. Ωστόσο, αυτό είναι επίσης προσαρμόσιμο χρησιμοποιώντας τη λειτουργία despine (). Δείτε το παρακάτω παράδειγμα.

ΠΑΡΑΔΕΙΓΜΑ:

javascript πάρει μέγεθος πίνακα
εισαγωγή seaborn ως sns εισαγωγή matplotlib.pyplot ως plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', δεδομένα = α) sns.despine (offset = 10, trim = True)

ΠΑΡΑΓΩΓΗ:



Σημειώστε τη διαφορά μεταξύ των δύο προηγούμενων εξόδων. Ωστόσο, υπάρχουν πολλές ακόμη επιλογές που μπορείτε να εξερευνήσετε μόνοι σας.

Python Seaborn Χρώμα-Παλέτες:

Το χρώμα είναι βασικά το χαρακτηριστικό που προσεγγίζει τα ανθρώπινα μάτια πέρα ​​από οποιοδήποτε άλλο χαρακτηριστικό. Το Seaborn σάς επιτρέπει να παίζετε με χρώματα χρησιμοποιώντας διάφορες λειτουργίες όπως color_palette (), hls_palette (), husl_palette () κ.λπ. Ρίξτε μια ματιά στα χρώματα που υπάρχουν αυτήν τη στιγμή στο θαλασσοπούλι.

ΠΑΡΑΔΕΙΓΜΑ:

εισαγωγή numpy ως np εισαγωγή seaborn ως sns εισαγωγή matplotlib.pyplot ως plt sns.set () presentcolors = sns.color_palette () sns.palplot (presentcolors)

ΠΑΡΑΓΩΓΗ:

Η παραπάνω εικόνα δείχνει τα χρώματα που υπάρχουν στον θαλάσσιο κόλπο. Το έχω κάνει χρησιμοποιώντας τη συνάρτηση palplot (). Για βαθύτερες παραλλαγές, μπορείτε να χρησιμοποιήσετε hls_palette (), husl_palette () κ.λπ.

Αυτό μας φέρνει στο τέλος του Python Seaborn Tutorial. Ελπίζω να έχετε καταλάβει τα πάντα ξεκάθαρα. Βεβαιωθείτε ότι ασκείστε όσο το δυνατόν περισσότερο .

Έχετε μια ερώτηση για εμάς; Παρακαλώ αναφέρετέ το στην ενότητα σχολίων αυτού του ιστολογίου «Python Seaborn Tutorial» και θα επικοινωνήσουμε μαζί σας το συντομότερο δυνατό.

Για να μάθετε σε βάθος την Python μαζί με τις διάφορες εφαρμογές της, μπορείτε να εγγραφείτε ζωντανά με υποστήριξη 24/7 και πρόσβαση σε όλη τη διάρκεια ζωής.