Tutorial SSIS για αρχάριους: Γιατί, τι και πώς;



Το SSIS είναι μια πλατφόρμα για εφαρμογές ολοκλήρωσης δεδομένων και ροής εργασίας. Αυτό το σεμινάριο SSIS καλύπτει το γιατί, τι και πώς του SQL Server Integration Services.

Οι υπηρεσίες ενοποίησης διακομιστών SQL (SSIS) αποτελούν αναπόσπαστο μέρος του λογισμικού Microsoft SQL Server Database. Αυτό καθιστά τη δουλειά της διαχείρισης δεδομένων πολύ πιο εύκολη με τις διάφορες δυνατότητές της. Σε αυτό το σεμινάριο, θα εμβαθύνουμε το SSIS σε εννοιολογικό επίπεδο, με την ακόλουθη σειρά:

Ας αρχίσουμε.





Τι είναι η ενοποίηση δεδομένων;

Η ολοκλήρωση δεδομένων είναι μια διαδικασία στην οποία τα ετερογενή δεδομένα ανακτώνται και συνδυάζονται ως ενσωματωμένη μορφή και δομή. Για παράδειγμα, κάθε εταιρεία αυτές τις μέρες πρέπει να επεξεργάζεται μεγάλα σύνολα δεδομένων από διάφορες πηγές. Αυτά τα δεδομένα πρέπει να υποβληθούν σε επεξεργασία για να δώσουν διορατικές πληροφορίες για τη λήψη επιχειρηματικών αποφάσεων. Έτσι, μια απλή λύση θα ήταν η ολοκλήρωση δεδομένων. Βασικά θα ενσωματώσει όλα τα δεδομένα σας που υπάρχουν στις διάφορες βάσεις δεδομένων και θα τα συνδυάσει στην ίδια πλατφόρμα.

Ακολουθούν μερικοί τρόποι για την επίτευξη ενοποίησης δεδομένων:



Ενσωμάτωση δεδομένων-Tutorial SSIS- Edureka

Τώρα που έχετε κατανοήσει την ενσωμάτωση δεδομένων, ας δούμε γιατί χρησιμοποιείται το SSIS. Το SSIS σημαίνει Υπηρεσίες ενοποίησης διακομιστή SQL .

Γιατί SSIS;



  • Τα δεδομένα μπορούν να φορτωθούν παράλληλα με πολλούς διαφορετικούς προορισμούς
  • Το SSIS εξαλείφει την ανάγκη σκληρών προγραμματιστών
  • Σφιχτή ενσωμάτωση με άλλα προϊόντα της Microsoft
  • Το SSIS είναι φθηνότερο από τα περισσότερα άλλα εργαλεία ETL
  • Το SIS παρέχει GUI για εύκολη μετατροπή δεδομένων
  • Ενσωματώστε το BI σε μια διαδικασία μετασχηματισμού δεδομένων
  • Ισχυρός χειρισμός σφαλμάτων και συμβάντων

Προχωρώντας σε αυτό το σεμινάριο SSIS, ας δούμε τι ακριβώς είναι και πώς λειτουργεί.

Τι είναι το SSIS;

Το SQL Server Integration Services (SSIS) είναι ένα στοιχείο του λογισμικού βάσης δεδομένων Microsoft SQL Server που μπορεί να χρησιμοποιηθεί για την εκτέλεση ενός ευρέος φάσματος εργασιών ολοκλήρωσης δεδομένων και μετατροπής δεδομένων.

  • Ενσωμάτωση δεδομένων: Συνδυάζει τα δεδομένα που βρίσκονται σε διαφορετικές πηγές και παρέχει στους χρήστες μια ενοποιημένη προβολή αυτών των δεδομένων
  • Ροή εργασίας: Μπορεί επίσης να χρησιμοποιηθεί για την αυτοματοποίηση της συντήρησης βάσεων δεδομένων SQL Server και ενημερώσεων σε πολυδιάστατα αναλυτικά δεδομένα

Χαρακτηριστικά του SSIS

Μερικές από τις δυνατότητες για χρήση του SSIS είναι:

  • Οργανωμένοι και μετασχηματισμοί αναζήτησης
  • Σφιχτή ενσωμάτωση με άλλη οικογένεια Microsoft SQL
  • Παρέχει πλούσια περιβάλλοντα στούντιο
  • Παρέχει πολλές λειτουργίες ολοκλήρωσης δεδομένων για καλύτερους μετασχηματισμούς
  • Συνδεσιμότητα δεδομένων υψηλής ταχύτητας

Μπορείτε να διαβάσετε το παρακάτω βίντεο που καλύπτει όλα τα βασικά, συμπεριλαμβανομένων των εννοιών αποθήκευσης δεδομένων που χρησιμοποιούνται για την εξαγωγή δεδομένων, τον μετασχηματισμό και τη φόρτωση (ETL). Είναι ιδανικό τόσο για αρχάριους όσο και για επαγγελματίες που θέλουν να βελτιώσουν τα βασικά τους στοιχεία για το MSBI.

Προχωρώντας στο σεμινάριο SSIS, ας δούμε πώς ακριβώς λειτουργεί.

Πώς λειτουργεί το SSIS;

Το SSIS αποτελείται από τρία κύρια συστατικά, δηλαδή:

μετατροπή δεκαδικού σε δυαδικό κώδικα python
  • Λειτουργικά δεδομένα
  • Διαδικασία ETL
  • Αποθήκη δεδομένων

Αυτές οι εργασίες μετατροπής δεδομένων και δημιουργίας ροής εργασίας εκτελούνται χρησιμοποιώντας το «Πακέτο SSIS», το οποίο θα συζητηθεί αργότερα σε αυτό το ιστολόγιο. Προχωρώντας με το σεμινάριο SSIS, ας κατανοήσουμε πρώτα κάθε ένα από αυτά τα στοιχεία λεπτομερώς:

Λειτουργικά δεδομένα

Μια λειτουργική αποθήκευση δεδομένων (ODS) είναι μια βάση δεδομένων που έχει σχεδιαστεί για να ενσωματώνει δεδομένα από πολλές πηγές για πρόσθετες λειτουργίες στα δεδομένα. Αυτό είναι το μέρος όπου τα περισσότερα από τα δεδομένα που χρησιμοποιούνται στην τρέχουσα λειτουργία στεγάζονται πριν μεταφερθούν στην αποθήκη δεδομένων για μακροπρόθεσμη αποθήκευση ή αρχειοθέτηση.

Διαδικασία ETL

Το ETL είναι μια διαδικασία εξαγωγής, μετατροπής και φόρτωσης των δεδομένων. Το Extract, Transform and Load (ETL) είναι η διαδικασία εξαγωγής των δεδομένων από διάφορες πηγές, μετατροπής αυτών των δεδομένων για να ικανοποιηθεί η απαίτησή σας και στη συνέχεια φόρτωση σε μια αποθήκη δεδομένων προορισμού. Το ETL παρέχει μια λύση ONE STOP για όλα αυτά τα προβλήματα.

  • Εκχύλισμα
  • Μεταμορφώνω
  • Φορτώνω

Εκχύλισμα: Η εξαγωγή είναι η διαδικασία εξαγωγής των δεδομένων από διάφορες ομοιογενείς ή ετερογενείς πηγές δεδομένων με βάση διαφορετικά σημεία επικύρωσης.

Μεταμόρφωση: Στον μετασχηματισμό, αναλύονται ολόκληρα δεδομένα και εφαρμόζονται διάφορες συναρτήσεις σε αυτό για να φορτώσουν τα δεδομένα στη βάση δεδομένων προορισμού σε καθαρή και γενική μορφή.

stl ταξινόμηση c ++

Φορτώνω: Η φόρτωση είναι η διαδικασία φόρτωσης των επεξεργασμένων δεδομένων σε ένα αποθετήριο δεδομένων προορισμού χρησιμοποιώντας ελάχιστους πόρους.


Αποθήκευση δεδομένων

  • Αποθήκη δεδομένων συλλαμβάνει τα δεδομένα από διάφορες πηγές για χρήσιμη ανάλυση και πρόσβαση.
  • Αποθήκευση δεδομένων είναι ένα μεγάλο σύνολο δεδομένων που συσσωρεύονται και χρησιμοποιούνται για τη συγκέντρωση και διαχείριση δεδομένων από διάφορες πηγές με σκοπό την απάντηση επιχειρηματικών ερωτήσεων. Ως εκ τούτου, βοηθά στη λήψη αποφάσεων.

Απαιτήσεις για υπηρεσίες ενοποίησης διακομιστή SQL

Για να εργαστείτε με το SSIS, πρέπει να εγκαταστήσετε τα εξής:

  • Διακομιστής SQL
  • Εργαλεία δεδομένων διακομιστή SQL

Ας ρίξουμε μια ματιά στη διαδικασία εγκατάστασης.

Εγκατάσταση διακομιστή SQL

Μεταβείτε στον ιστότοπο: https://www.microsoft.com/en-au/sql-server/sql-server-downloads για να εγκαταστήσετε τον SQL Server. Μπορείτε να εγκαταστήσετε την τελευταία έκδοση ή την προηγούμενη έκδοση ανάλογα με την επιλογή σας.

Υπάρχουν λοιπόν διαφορετικές εκδόσεις του SQL Server, και συγκεκριμένα:

    • Δωρεάν δοκιμή: Θα λάβετε μια δωρεάν δοκιμή 180 ημερών του SQL Server 2017 στα Windows.
    • Έκδοση προγραμματιστή: Είναι μια δωρεάν έκδοση πλήρους δυνατότητας, με άδεια χρήσης ως βάση δεδομένων ανάπτυξης και δοκιμών σε περιβάλλον μη παραγωγής.
    • Έκδοση Express: Το Express είναι μια δωρεάν έκδοση του SQL Server, ιδανική για ανάπτυξη και παραγωγή για εφαρμογές επιτραπέζιων υπολογιστών, ιστού και μικρών διακομιστών.

Στη συνέχεια, ας δούμε πώς να εγκαταστήσουμε τα εργαλεία δεδομένων.

Εργαλεία δεδομένων διακομιστή SQL

Μεταβείτε στον ιστότοπο: https://docs.microsoft.com/en-us/sql/ssdt/previous-releases-of-sql-server-data-tools-ssdt-and-ssdt-bi?view=sql-server-ver15 και ρίξτε μια ματιά στις διάφορες εκδόσεις που παρέχονται από τη Microsoft. Ανατρέξτε στο παρακάτω στιγμιότυπο οθόνης με την πρόσφατη έκδοση SSDT μαζί με το σύνδεσμο λήψης.

Σε αυτό το σεμινάριο, θα εγκαταστήσω την έκδοση 15.9.1. Ας ξεκινήσουμε.

Βήμα 1: Όταν ανοίγετε το αρχείο .exe, θα σας ζητηθεί να κάνετε επανεκκίνηση του συστήματος πριν από την εγκατάσταση.

Βήμα 2: Μόλις επανεκκινήσετε το σύστημά σας, είστε έτοιμοι να ξεκινήσετε. Απλώς κάντε κλικ στο κουμπί 'Επόμενο' και ακολουθήστε τις οδηγίες στην οθόνη.

Βήμα 3: Θα δείξει τα απαιτούμενα εργαλεία και τις δυνατότητες όπως SQL Server Database, SSAS, SSRS και SSIS. Βεβαιωθείτε ότι έχετε ελέγξει όλα αυτά και κάντε κλικ στο κουμπί 'εγκατάσταση'. Ανατρέξτε στο παρακάτω στιγμιότυπο οθόνης για το ίδιο.

Στη συνέχεια στο SSIS Tutorial, θα συζητήσουμε το πακέτο SSIS και πώς μπορείτε να το δημιουργήσετε χρησιμοποιώντας τα παραπάνω εργαλεία.

Τι είναι το πακέτο SSIS;

Ένα πακέτο είναι ένα θεμελιώδες μπλοκ όπου προχωράτε και κωδικοποιείτε στο SSIS. Τώρα ο 'κωδικός' δεν αναφέρεται σε καμία γλώσσα προγραμματισμού, είναι η ανάπτυξη που κάνετε. Βασικά λοιπόν η ανάπτυξή σας γίνεται μέσα σε ένα πακέτο. Όπως συζητήθηκε παραπάνω, το SSIS είναι απαραίτητο για το ETL και το πακέτο SSIS θα κάνει τη διαδικασία ETL. Επομένως, είναι ένα αντικείμενο που εφαρμόζει τη λειτουργικότητα των υπηρεσιών ολοκλήρωσης εξαγωγή, μετατροπή και φόρτωση δεδομένων . Ένα πακέτο αποτελείται από:

λίστα συμβάντων javascript με παραδείγματα
  • Συνδέσεις
  • Στοιχεία ροής ελέγχου
  • Στοιχεία ροής δεδομένων

Αυτό είναι όλο για αυτό το σεμινάριο SSIS. Ελπίζω να σας άρεσε να το διαβάζετε.

Αυτό μας φέρνει στο τέλος αυτού του ιστολογίου. Ελπίζω να σας άρεσε αυτό το ιστολόγιο εκμάθησης Power BI. Αυτό ήταν το πρώτο blog της σειράς Power BI. Αυτό το σεμινάριο Power BI θα ακολουθήσει το επόμενο ιστολόγιό μου, το οποίο θα επικεντρωθεί στους πίνακες ελέγχου Power BI, το διαβάσετε επίσης.

Εάν θέλετε να μάθετε SSIS και να δημιουργήσετε μια καριέρα στην οπτικοποίηση δεδομένων ή στο BI, τότε ρίξτε μια ματιά στο που έρχεται με ζωντανή εκπαίδευση με καθοδήγηση εκπαιδευτή και πραγματική εμπειρία έργου. Αυτή η εκπαίδευση θα σας βοηθήσει να κατανοήσετε σε βάθος το MSBI και να σας βοηθήσουμε να επιτύχετε την εξουσία πάνω στο θέμα.

Έχετε μια ερώτηση για εμάς; Παρακαλώ αναφέρετέ το στην ενότητα σχολίων του 'SSIS Tutorial' και θα επικοινωνήσουμε μαζί σας.