Προγραμματισμός SAS - Μάθετε πώς να κωδικοποιείτε στο SAS!



Αυτό το ιστολόγιο για τον προγραμματισμό SAS σας παρουσιάζει τις έννοιες προγραμματισμού SAS και σας βοηθά να κατανοήσετε λεπτομερώς τις διάφορες βασικές αρχές του SAS με παραδείγματα.

Σε αυτό το blog, θα σας παρουσιάσω μερικές από τις σημαντικές έννοιες του προγραμματισμού SAS. Πριν ξεκινήσουμε, είναι σημαντικό να εξοικειωθείτε με το SAS. Το προηγούμενο blog μου στις Εκμάθηση SAS θα σας βοηθήσει να κατανοήσετε το SAS, τις εφαρμογές του και θα σας βοηθήσει να εγκαταστήσετε το SAS University Edition, το οποίο θα χρησιμοποιούσαμε εδώ ως περιβάλλον προγραμματισμού. Αναρωτιέστε ποιες είναι οι δεξιότητες, πρέπει να αποκτήσετε φέτος; Επίσης, εάν σκοπεύατε να μπείτε στο Data Analytics, είναι ένας από τους καλύτερους τρόπους για να ξεκινήσετε με το ίδιο.

Ο οδηγός τεχνικής καριέρας Edureka 2019 είναι έξω! Οι πιο καυτοί ρόλοι εργασίας, οι ακριβείς διαδρομές μάθησης, οι προοπτικές της βιομηχανίας και πολλά άλλα στον οδηγό. Κατεβάστε τώρα.





Έτσι, χωρίς κανένα άλλοκαθυστέρηση,ας ξεκινήσουμε με τον προγραμματισμό SAS, έτσι;

Αυτό το ιστολόγιο θα σας βοηθήσει να κατανοήσετε τα ακόλουθα θέματα:



Πριν ξεκινήσουμε την κωδικοποίηση, θα ήθελα να σας ενημερώσω με μερικούς σημαντικούς όρους που είναι σημαντικοί για τον προγραμματισμό SAS.

Βασικές αρχές προγραμματισμού SAS

SAS Windows

Οι μεγάλοι οργανισμοί και τα εκπαιδευτικά ιδρύματα προτιμούν να χρησιμοποιούν SAS Windows. Τα SAS Windows διαθέτουν πολλά βοηθητικά προγράμματα που βοηθούν στη μείωση του χρόνου που απαιτείται για τη σύνταξη κωδικών.

Η παρακάτω εικόνα δείχνει τα διάφορα μέρη των Windows SAS.



SAS-Windows - SAS Programming - Edureka

  • Παράθυρο καταγραφής : Είναι ένα παράθυρο εκτέλεσης. Εδώ, μπορείτε να ελέγξετε την εκτέλεση του προγράμματος σας. Εμφανίζει επίσης σφάλματα, προειδοποιήσεις και σημειώσεις.
  • Παράθυρο κώδικα :Αυτό το παράθυρο είναι επίσης γνωστό ως παράθυρο επεξεργασίας. Σκεφτείτε το ως ένα κενό χαρτί ή ένα σημειωματάριο, όπου μπορείτε να γράψετε τον κωδικό SAS.
  • Παράθυρο εξόδου : Όπως υποδηλώνει το όνομα, αυτό το παράθυρο εμφανίζει την έξοδο του προγράμματος / κώδικα που γράφετε στον επεξεργαστή.
  • Παράθυρο αποτελεσμάτων : Είναι ένα ευρετήριο που απαριθμεί όλα τα αποτελέσματα των προγραμμάτων που εκτελούνται σε μία συνεδρία. Δεδομένου ότι διατηρεί τα αποτελέσματα μιας συγκεκριμένης περιόδου λειτουργίας, εάν κλείσετε το λογισμικό και το επανεκκινήσετε, το παράθυρο αποτελεσμάτων θα είναι κενό.
  • Εξερεύνηση παραθύρου : Κρατά τη λίστα όλων των βιβλιοθηκών στο σύστημα. Μπορείτε επίσης να περιηγηθείτε στα αρχεία που υποστηρίζονται από το σύστημα εδώ.

Μερικοί οργανισμοί χρησιμοποιούν Linux, ωστόσο, χωρίς γραφικό περιβάλλον εργασίας χρήστη, πρέπει να γράφετε κώδικα για κάθε ερώτημα. Ως εκ τούτου, είναι άβολο στη χρήση.

SAS Data Sets

Τα σύνολα δεδομένων SAS καλούνται ως αρχεία δεδομένων. Τα αρχεία δεδομένων αποτελούνται από σειρές και στήλες. Οι γραμμές κρατούν τις παρατηρήσεις και οι στήλες κρατούνΜεταβλητά ονόματα.

Μεταβλητές SAS

Το SAS έχει δύο τύπους μεταβλητών:

  • Αριθμητικές μεταβλητές : Αυτός είναι ο προεπιλεγμένος τύπος μεταβλητής. Αυτές οι μεταβλητές χρησιμοποιούνται σε μαθηματικές εκφράσεις.
  • Μεταβλητές χαρακτήρων :Οι μεταβλητές χαρακτήρων χρησιμοποιούνται για τιμές που δεν χρησιμοποιούνται σε μαθηματικές εκφράσεις.
    Αντιμετωπίζονται ως κείμενο ή συμβολοσειρές. Μια μεταβλητή γίνεται μεταβλητή χαρακτήρων προσθέτοντας ένα«$»ανάφλεξηστο τέλος του ονόματος της μεταβλητής.

SAS Libraries

Η βιβλιοθήκη SAS είναι μια συλλογή αρχείων SAS που είναι αποθηκευμένα στον ίδιο φάκελο ή κατάλογο στον υπολογιστή σας.

  • Προσωρινή βιβλιοθήκη : Σε αυτήν τη βιβλιοθήκη, το σύνολο δεδομένων διαγράφεται όταν τελειώσει η περίοδος λειτουργίας SAS.
  • Μόνιμη βιβλιοθήκη : Τα σύνολα δεδομένων αποθηκεύονται μόνιμα. Ως εκ τούτου, είναι διαθέσιμες σε όλες τις συνεδρίες.

Οι χρήστες μπορούν επίσης να δημιουργήσουν ή να ορίσουν μια νέα βιβλιοθήκη γνωστή ως βιβλιοθήκες καθορισμένες από τον χρήστη χρησιμοποιώντας τη λέξη-κλειδί ΛΙΒΝΑΝΟ . Αυτές είναι επίσης μόνιμες βιβλιοθήκες.

SAS Programming: SAS Code Structure

Ο προγραμματισμός SAS βασίζεται σε δύο δομικά στοιχεία:

  • Βήμα ΔΕΔΟΜΕΝΩΝ : Το βήμα DATA δημιουργεί ένα σύνολο δεδομένων SAS και μετά μεταβιβάζει τα δεδομένα σε ένα βήμα PROC
  • ΒΗΜΑ PROC : Το βήμα PROC επεξεργάζεται τα δεδομένα

Ένα πρόγραμμα SAS πρέπει να ακολουθεί τους παρακάτω αναφερόμενους κανόνες:

  • Σχεδόν κάθε κωδικός θα ξεκινά είτε με DATA είτε με PROC Step
  • Κάθε γραμμή του κωδικού SAS τελειώνει με ένα τελείωμα
  • Ένας κωδικός SAS τελειώνει με RUN ή QUIT λέξη-κλειδί
  • Οι κωδικοί SAS δεν είναι διάκριση πεζών-κεφαλαίων
  • Μπορείτε να γράψετε έναν κώδικα σε διαφορετικές γραμμές ή να γράψετε πολλές δηλώσεις σε μία γραμμή

Τώρα που έχουμε δει μερικές βασικές ορολογίες, ας ξεκινήσουμε με τον προγραμματισμό SAS με αυτόν τον βασικό κώδικα:

DATA Employee_Info input Emp_ID Emp_Name $ Emp_Vertical $ datalines 101 Mak SQL 102 Rama SAS 103 Priya Java 104 Karthik Excel 105 Mandeep SAS Run

Στον παραπάνω κώδικα, δημιουργήσαμε ένα σύνολο δεδομένων που ονομάζεται Employee_Info. Έχει τρεις μεταβλητές, μία αριθμητική μεταβλητή ως Emp_Id και δύο μεταβλητές χαρακτήρων ως Emp_Name και Emp_Verticals. Η εντολή Run εμφανίζει το σύνολο δεδομένων στο παράθυρο εξόδου.

Η παρακάτω εικόνα δείχνει την έξοδο του παραπάνω κωδικού.

Ας υποθέσουμε ότι θέλετε να δείτε το αποτέλεσμα σε προβολή εκτύπωσης, καλά μπορείτε να το κάνετε χρησιμοποιώντας μια διαδικασία PROC PRINT, ο υπόλοιπος κωδικός παραμένει ίδιος.

DATA Employee_Info input Emp_ID Emp_Name $ Emp_Vertical $ datalines 101 Mak SQL 102 Rama SAS 103 Priya Java 104 Karthik Excel 105 Mandeep SAS Run PROC PRINT DATA = Employee_Info Run

Η παρακάτω εικόνα δείχνει την έξοδο του παραπάνω κώδικα.

πώς να χρησιμοποιήσετε το goto c ++

Μόλις δημιουργήσαμε ένα σύνολο δεδομένων και καταλάβαμε πώς λειτουργεί η διαδικασία PRINT. Τώρα, ας πάρουμε το παραπάνω σύνολο δεδομένων και να το χρησιμοποιήσουμε για περαιτέρω προγραμματισμό. Ας υποθέσουμε ότι θέλουμε να προσθέσουμε την Ημερομηνία συμμετοχής του υπαλλήλου στο σύνολο δεδομένων. Έτσι δημιουργούμε μια μεταβλητή που ονομάζεται DOJ, την δίνουμε ως είσοδο και εκτυπώνουμε το αποτέλεσμα.

DATA Employee_Info input Emp_ID Emp_Name $ Emp_Vertical $ DOJ datalines 101 Mak SQL 18/08/2013 102 Rama SAS 25/06/2015 103 Priya Java 21/02/2010 104 Karthik Excel 19/05/2007 105 Mandeep SAS 11/09/2016 Εκτέλεση PROC PRINT DATA = Εκτέλεση Employee_Info

Η παρακάτω εικόνα δείχνει την έξοδο του παραπάνω κώδικα. Είναι ορατό ότι δημιουργήθηκε μια μεταβλητή, αλλά η τιμή του DOJ δεν εκτυπώθηκε. Αντ 'αυτού, βλέπουμε τις τελείες να έχουν αντικαταστήσει τις τιμές ημερομηνίας.


Γιατί συνέβη αυτό; Λοιπόν, η μεταβλητή DOJ είναι χωρίς επίθημα «$», αυτό σημαίνει, από προεπιλογή, το SAS θα το διαβάσει ως αριθμητική μεταβλητή. Όμως, τα δεδομένα που εισαγάγαμε έχουν έναν ειδικό χαρακτήρα «/», επομένως δεν εκτυπώνουν το αποτέλεσμα καθώς δεν είναι καθαρά αριθμητικά δεδομένα. Εάν ελέγξετε το παράθυρο καταγραφής, θα δείτε ένα μήνυμα σφάλματος ως «μη έγκυρα δεδομένα για μεταβλητή DOJ»

Τώρα πώς λύνουμε αυτό το πρόβλημα; Λοιπόν, ένας τρόπος για να το λύσετε είναι χρησιμοποιώντας ένα επίθημα «$» για τη μεταβλητή DOJ. Αυτό θα μετατρέψει τη μεταβλητή DOJ σε χαρακτήρα και θα μπορείτε να εκτυπώσετε τιμές ημερομηνίας. Ας κάνουμε τις αλλαγές στον κώδικα και να δούμε την έξοδο.

DATA Employee_Info input Emp_ID Emp_Name $ Emp_Vertical $ DOJ $ datalines 101 Mak SQL 18/08/2013 102 Rama SAS 25/06/2015 103 Priya Java 21/02/2010 104 Karthik Excel 19/05/2007 105 Mandeep SAS 11/09 / Εκτέλεση 2016 ΔΕΔΟΜΕΝΑ PROC PRINT = Εκτέλεση υπαλλήλου_Info

Η οθόνη εξόδου θα εμφανίσει την ακόλουθη έξοδο.


Μπορείτε να δείτε ότι οι τιμές των δεδομένων εμφανίζονται ως ημερομηνίες μετατρέποντας το DOJ σε χαρακτήρα. Ωστόσο, αυτή είναι μια προσωρινή λύση. Επιτρέψτε μου να το εξηγήσω πώς;

Λοιπόν, φανταστείτε μια τράπεζα να έχει ένα παρόμοιο σύνολο δεδομένων. Το σύνολο δεδομένων έχει στοιχεία κατόχου λογαριασμού όπως ποσό δανείου, δόσεις,καιπροθεσμία για δόση δανείου. Φανταστείτε, ο κάτοχος έχει χάσει την προθεσμία του για να πληρώσει μια δόση και η τράπεζα θέλει να υπολογίσει την καθυστέρηση. Η τράπεζα θα πρέπει να υπολογίσει τη διαφορά μεταξύ της ημερομηνίας προθεσμίας και της τρέχουσας ημερομηνίας.

Ωστόσο, εάν το σύνολο δεδομένων της τράπεζας έχει ημερομηνίες σε μορφή χαρακτήρων, τότε η τράπεζα δεν θα μπορεί να πραγματοποιήσει μαθηματικές λειτουργίες σε αυτήν. Αυτό το ζήτημα μπορεί να επηρεάσει και το σύνολο δεδομένων μας. Λοιπόν, πώς επιλύουμε αυτό το πρόβλημα;

Η επόμενη ιδέα θα σας βοηθήσει να ξεπεράσετε αυτό το ζήτημα.

Πληροφορίες και μορφές στο SAS

Είναι σημαντικό να καταλάβετε καλά αυτό το θέμα εάν θέλετε να είστε καλοί στον προγραμματισμό SAS.Αν θυμάστε, ανέφερα νωρίτερα ότι το SAS έχει δύο τυπικούς τύπους μεταβλητών:

  • Αριθμητικός
  • Χαρακτήρας

Όταν το SAS συναντά μη τυπικές μεταβλητές, το SAS θα εμφανίσει σφάλμα ή δεν θα λάβετε την επιθυμητή έξοδο. Για να ξεπεραστεί αυτό το πρόβλημα, το SAS χρησιμοποιείΠροειδοποίητοςκαι μορφές.

Μάθετε περισσότερα

Οι πληροφορίες συνήθως χρησιμοποιούνται για την ανάγνωση ή την εισαγωγή δεδομένων από εξωτερικά αρχεία ή επίπεδα αρχεία (όπωςαρχεία κειμένου ή διαδοχικά αρχεία). Η πληροφορία δίνει οδηγίες στο SAS για το πώς να διαβάσειδεδομένα σε μεταβλητές SAS. Το SAS έχει τρεις τύπους Πληροφοριών:χαρακτήρας, αριθμητική και ημερομηνία / ώρα. Οι πληροφορίες ονομάζονται σύμφωνα με τα ακόλουθασύνταξη σύνταξης:

  • Πληροφορίες χαρακτήρα: $ INFORMATw.
  • Numeric Informed: INFORMATw.d
  • Ημερομηνία / Ώρα Ενημέρωση: INFORMATw.

Το «$» υποδεικνύει πληροφορίες χαρακτήρα. Το INFORMAT αναφέρεται στις μερικές φορές προαιρετικέςΌνομα πληροφοριών SAS. Το «w» υποδεικνύει το πλάτος (byte ή τον αριθμό στηλών) τουμεταβλητός. Το «d» χρησιμοποιείται για αριθμητικά δεδομένα για τον καθορισμό του αριθμού των ψηφίων στα δεξιά τουτο δεκαδικό ψηφίο. Όλες οι πληροφορίες πρέπει να περιέχουν ένα δεκαδικό σημείο (.) Έτσι ώστε το SAS να μπορεί
διαφοροποιήστε μια πληροφορία από μια μεταβλητή SAS.

Ας επιστρέψουμε στον προηγούμενο κώδικα και να δούμε αν η Ημερομηνία / Ώρα μας βοηθάει. Ας αλλάξουμε λοιπόν τον κώδικα αναλόγως και προσθέστε μια ημερομηνία ενημέρωσης σε αυτήν ως εξής:

DATA Employee_Info input Emp_ID Emp_Name $ Emp_Vertical $ DOJ INFORMAT DOJ ddmmyy10. datalines 101 Mak SQL 18/08/2013 102 Rama SAS 25/06/2015 103 Priya Java 21/02/2010 104 Karthik Excel 19/05/2007 105 Mandeep SAS 11/09/2016 Εκτέλεση PROC PRINT DATA = Employee_Info Run

Η γραμμή αριθμός 3 στον κώδικα δίνει εντολή στο SAS να διαβάσει στη μεταβλητή «ημερομηνία συμμετοχής» (DOJ) χρησιμοποιώντας την ημερομηνία
πληροφορίες MMDDYYw. Για κάθε πεδίο ημερομηνίας καταλαμβάνει 10 κενά, ο προσδιοριστής «w.» Είναισε 10.

Η έξοδος του κώδικα θα μοιάζει ως εξής.

Το αποτέλεσμα δείχνει ότι δεν έχουμε ακόμα το επιθυμητό αποτέλεσμα, αντίθετα η στήλη DOJ περιέχει μερικές αριθμητικές τιμές και όχι τις ημερομηνίες που καθορίσαμε. Τώρα, γιατί είναι αυτό; Λοιπόν, μόλις διαβαστεί μια ημερομηνία με ημερομηνία ενημέρωσης, το SAS αποθηκεύει την ημερομηνία ως αριθμό. Αυτό σημαίνει ότι διαβάζεται ως ο αριθμός ημερών μεταξύ της ημερομηνίας και της 1ης Ιανουαρίου 1960 (Για παράδειγμα: 15/3/1994 αποθηκεύεται ως 12492).

Ο λόγος πίσω από αυτό είναι ότι η SAS έχει τρεις ξεχωριστούς μετρητές που παρακολουθούν τις ημερομηνίες και την ώρα. Αυτοί οι μετρητές ημερομηνιών ξεκίνησαν στο μηδέν την 1η Ιανουαρίου 1960. Επομένως, οι ημερομηνίες πριν από την 1/1/1960 έχουν αρνητικές τιμές και οποιαδήποτε ημερομηνία μετά έχει θετική τιμή. Κάθε μέρα τα μεσάνυχτα, ο μετρητής ημερομηνιών αυξάνεται από έναν.

Σύμφωνα με μια ιστορία, οι ιδρυτές του SAS ήθελαν να χρησιμοποιήσουν την κατά προσέγγιση ημερομηνία γέννησης του συστήματος IBM 370 και επέλεξαν την 1η Ιανουαρίου 1960 ως μια εύκολη στη μνήμη προσέγγιση.

Τώρα που γνωρίζετε τον λόγο για τον οποίο η στήλη DOJ εμφανίζει αυτούς τους αριθμούς, ας προσπαθήσουμε να λύσουμε αυτό το πρόβλημα. Για να ξεπεράσουμε αυτό το πρόβλημα χρησιμοποιούμε το Format.

Μορφή

Οι πληροφορίες είναι οι οδηγίες για την ανάγνωση δεδομένων, ενώ οι μορφές είναι οι οδηγίες που χρησιμοποιούνται για την εμφάνιση ήδεδομένα εξόδου.Ο ορισμός μιας μορφής για μια μεταβλητή είναι πώς λέτε στο SAS να εμφανίζει τις τιμές στη μεταβλητή. Οι μορφές ομαδοποιούνται στις τρεις ίδιες τάξεις με τις πληροφορίες (χαρακτήρας, αριθμητικός και ημερομηνία) και επίσης περιέχουν πάντα μια τελεία.

Η γενική μορφή μιας δήλωσης μορφής είναι:

  • FORMAT μεταβλητό όνομα FORMAT-NAME.

Ας επιστρέψουμε στον κώδικα μας με σύνολο δεδομένων Employee_Info για να δούμε αν μπορούμε να εμφανίσουμε την ημερομηνία σωστά χρησιμοποιώντας την εντολή FORMAT.

DATA Employee_Info input Emp_ID Emp_Name $ Emp_Vertical $ DOJ INFORMAT DOJ ddmmyy10. FORMAT DOJ ddmmyy10. datalines 101 Mak SQL 18/08/2013 102 Rama SAS 25/06/2015 103 Priya Java 21/02/2010 104 Karthik Excel 19/05/2007 105 Mandeep SAS 11/09/2016 Εκτέλεση PROC PRINT DATA = Employee_Info Run

Έχουμε χρησιμοποιήσει την εντολή FORMAT στη γραμμή αριθμού 4 στον παραπάνω κώδικα. Η ακόλουθη οθόνη εξόδου θα μας δώσει την επιθυμητή έξοδο.

Έχουμε επιδείξει επιτυχώς το σύνολο δεδομένων χρησιμοποιώντας την εντολή Μορφή ημερομηνίας. Ελπίζω να έχετε καταλάβει πώς να χρησιμοποιείτε τη μορφή και τις πληροφορίες.Ας προχωρήσουμε στο blog προγραμματισμού SAS και ρίξτε μια ματιά σε μια άλλη σημαντική ιδέα.

SAS Loops

Ενώ κάνουμε προγραμματισμό SAS, ενδέχεται να συναντήσουμε καταστάσεις όπου πρέπει επανειλημμένα να εκτελέσουμε έναμπλοκ κώδικα αρκετές φορές. Είναι άβολο να γράφετε το ίδιο σύνολο δηλώσεων ξανά και ξανά. Εδώ βγαίνουν οι βρόχοι. Στο SAS, η δήλωση Do χρησιμοποιείται για την εφαρμογή βρόχων. Είναι επίσης γνωστό ως Do Loop. Η παρακάτω εικόνα δείχνει τογενική μορφή των δηλώσεων βρόχου Do στο SAS.

Ακολουθούν οι τύποι βρόχων DO στο SAS:

  • Δείκτης : Ο βρόχος συνεχίζεται από την τιμή έναρξης έως την τιμή διακοπής της μεταβλητής ευρετηρίου.
  • Ενώ : Ο βρόχος συνεχίζεται όσο το Ενώ η κατάσταση γίνεται ψευδής.
  • Μέχρι : Ο βρόχος συνεχίζεται μέχρι το Μέχρι η κατάσταση γίνεται αληθινή.

Κάντε βρόχο ευρετηρίου

Χρησιμοποιούμε μια μεταβλητή ευρετηρίου ως τιμή έναρξης και διακοπής για Κάντε βρόχο ευρετηρίου . Οι δηλώσεις SAS εκτελούνται επανειλημμένα έως ότου η μεταβλητή ευρετηρίου φτάσει στην τελική της τιμή.
Σύνταξη:

Do indexvariable = αρχική τιμή έως τελική αξία Δηλώσεις SAS Τέλος

Ας ρίξουμε μια ματιά στο δείγμα κώδικα για να κατανοήσουμε το Do Index Loop. Στον παρακάτω κώδικα, το VAR είναι η μεταβλητή ευρετηρίου.

DATA SampleLoop SUM = 0 Do VAR = 1 έως 10 SUM = SUM + VAR ΤΕΛΟΣ PROC PRINT DATA = SampleLoop Run

Όταν εκτελέσετε τον παραπάνω κώδικα, θα λάβετε την ακόλουθη έξοδο.

Κάνετε ενώ κάνετε βρόχο

ο Κάντε ενώ ο βρόχος χρησιμοποιεί μια κατάσταση WHILE. Αυτός ο βρόχος εκτελεί το μπλοκ του κώδικα όταν η συνθήκη είναι αληθινή και συνεχίζει να την εκτελεί, έως ότου η συνθήκη γίνει εσφαλμένη. Μόλις η συνθήκη γίνει ψευδής, ο βρόχος τερματίζεται.

Σύνταξη:

Do While (condition) Οι δηλώσεις SAS τελειώνουν

Ακολουθώντας δείγμα κώδικα θα σας βοηθήσει να κατανοήσετε το DO WHILE loop.

DATA SampleLoop SUM = 0 VAR = 1 Do While (VAR)<15) SUM = SUM + VAR VAR+1 END PROC PRINT DATA = SampleLoop Run 

Ο παραπάνω κωδικός θα σας δώσει την ακόλουθη έξοδο.

Κάντε μέχρι το βρόχο

Ο βρόχος Do Before χρησιμοποιεί ένα Μέχρι συνθήκη. Αυτός ο βρόχος εκτελεί το μπλοκ του κώδικα όταν η συνθήκη είναι ψευδής και συνεχίζει να την εκτελεί, έως ότου η συνθήκη γίνει αληθινή. Μόλις η συνθήκη γίνει αληθινή, ο βρόχος τερματίζεται.

Σύνταξη:

φροντιστήριο διακομιστή sql για αρχάριους
Λήξη έως (κατάστασης) καταστάσεων SAS

Ας ρίξουμε μια ματιά στο δείγμα προγράμματος.

DATA SampleLoop SUM = 0 VAR = 1 Do έως (VAR> 15) SUM = SUM + VAR VAR + 1 ΤΕΛΟΣ PROC PRINT Εκτέλεση

Ο κωδικός έχει την ακόλουθη έξοδο.

Έτσι ολοκληρώσαμε την έννοια των βρόχων στον προγραμματισμό SAS. Όλα τα θέματα που μελετήσαμε μέχρι τώρα έχουν μιλήσει για τα βασικά του προγραμματισμού SAS γενικά.

Τώρα ας ρίξουμε μια ματιά σε ορισμένες στατιστικές διαδικασίες. Αυτές οι διαδικασίες θα αποτελέσουν τη βάση για προχωρημένους αναλυτικές διαδικασίες.

Εγγραφείτε στο κανάλι σας στο YouTube για να λαμβάνετε νέες ενημερώσεις ..!

Βασικές στατιστικές διαδικασίες χρησιμοποιώντας SAS

ΔΙΑΔΙΚΑΣΙΑ

Αυτή η διαδικασία χρησιμοποιείται για τον υπολογισμό του αριθμητικού μέσου όρου και της τυπικής απόκλισης. Για τους ανθρώπους που είναι νέοι στα στατιστικά στοιχεία μπορεί να είναι δύσκολο να κατανοήσουν αυτούς τους όρους. Πριν ξεκινήσουμε την κωδικοποίηση και χρησιμοποιήσουμε αυτήν τη διαδικασία. Θα προσπαθήσω να εξηγήσω τι σημαίνουν αυτοί οι όροι.

Ας ξεκινήσουμε με τον αριθμητικό μέσο και να δούμε πώς χρησιμοποιείται το PROC MEANS στον προγραμματισμό SAS για τον υπολογισμό του.

Αριθμητικός μέσος όρος

Το άθροισμα της τιμής των αριθμητικών μεταβλητών, διαιρούμενο με τον αριθμό των μεταβλητών, σας δίνει το αριθμητικός μέσος όρος . Είναι επίσης γνωστό ως μέσος και είναι ένα μέτρο της κεντρικής τάσης. Ένα μέτρο της κεντρικής τάσης είναι μια μεμονωμένη τιμή που επιχειρεί να περιγράψει ένα σύνολο δεδομένων προσδιορίζοντας την κεντρική θέση μέσα σε αυτό το σύνολο δεδομένων.

Στον προγραμματισμό SAS, χρησιμοποιείτε PROC MEANS για τον υπολογισμό του αριθμητικού μέσου όρου. Αυτή η διαδικασία σάς επιτρέπει να βρείτε το μέσο όρο όλων των μεταβλητών ή λίγων μεταβλητών ενός συνόλου δεδομένων. Μπορείτε επίσης να δημιουργήσετε ομάδες και να υπολογίσετε τον μέσο όρο των μεταβλητών που είναι συγκεκριμένες για αυτήν την ομάδα.

Σύνταξη:

PROC ΣΗΜΑΝΤΙΚΑ ΔΕΔΟΜΕΝΑ = DATASET Μεταβλητές κλάσης Μεταβλητές Var
  • Μεταβλητές : Οι μεταβλητές στην παραπάνω σύνταξη υποδεικνύουν μεταβλητές από το σύνολο δεδομένων των οποίων ο μέσος όρος πρέπει να υπολογιστεί.

Μέσος όρος συνόλου δεδομένων

Αν εσύπαρέχετε μόνο το όνομα του συνόλου δεδομένων χωρίς μεταβλητές, μπορείτε να υπολογίσετε τη μέση τιμή όλων των μεταβλητών σε ένα σύνολο δεδομένων.

Ας ρίξουμε μια ματιά σε ένα δείγμα κώδικα. Έχω εξετάσει ένα προκαθορισμένο σύνολο δεδομένων SAS που ονομάζεται «αυτοκίνητα». Η ακόλουθη εντολή θα εμφανίσει το σύνολο δεδομένων.

PROC PRINT data = sashelp.CARS Εκτέλεση

Η παρακάτω εικόνα δείχνει την έξοδο του παραπάνω κώδικα.


Τώρα ας χρησιμοποιήσουμε αυτόν τον κωδικό συνόλου δεδομένων και υπολογίζουμε τον μέσο όρο κάθε μεταβλητής στο σύνολο δεδομένων«Αυτοκίνητα».

ΔΙΑΔΙΚΑΣΙΑ ΜΕΝΟΥ PROC = sashelp.CARS Μέσο SUM MAXDEC = 2 Run

Η παρακάτω εικόνα δείχνει το μέσο όρο όλων των μεταβλητών στο σύνολο δεδομένων έως και δύο δεκαδικά.

Μέσος όρος επιλεγμένων μεταβλητών

Παρέχοντας τα ονόματα στην επιλογή Var μπορείτε να λάβετε τον μέσο όρο των καθορισμένων μεταβλητών. Ανατρέξτε στον παρακάτω κώδικα.

PROC MEANS DATA = sashelp. CARS mean SUM MAXDEC = 2 var ιπποδύναμοι

Μέση κατηγορία

τι είναι ένας δυναμικός πίνακας

Μπορείτε να βρείτε τον μέσο όρο των αριθμητικών μεταβλητών οργανώνοντάς τις σε ομάδες χρησιμοποιώνταςκάποια παράμετρος για την ομαδοποίησή τους.Εξετάστε το ενδεχόμενο να ακολουθήσετε δείγμα κώδικα. Ας μάθουμε τον μέσο όρο της ιπποδύναμης για διαφορετικές ομάδες που ταξινομούνται στις κατηγορίες «μάρκα» και «τύπος» διαφορετικών αυτοκινήτων.

PROC MEANS DATA = sashelp. CARS MEANS SUM MAXDEC = 2 class make type var ιπποδύναμη

Η παρακάτω εικόνα δείχνει την έξοδο του παραπάνω κώδικα.

Ας συνεχίσουμε με το ιστολόγιο προγραμματισμού SAS και ρίξτε μια ματιά σε μια άλλη σημαντική στατιστική ιδέα.

Τυπική απόκλιση

Η τυπική απόκλιση (SD) είναι ένα μέτρο του πόσο ποικίλα είναι τα δεδομένα σε ένα δεδομένο σύνολο δεδομένων. Μαθηματικά, σας λέει πόσο κοντά είναι κάθε σημείο δεδομένων στη μέση τιμή ενός συνόλου δεδομένων. Εάν η τιμή της τυπικής απόκλισης είναι κοντά στο 0, υποδηλώνει ότι τα σημεία δεδομένων είναι πολύ κοντά στο μέσο όρο του συνόλου δεδομένων και μια υψηλή τυπική απόκλιση δείχνει ότι τα σημεία δεδομένων κατανέμονται σε ένα ευρύ φάσμα τιμών.

Στο SAS, μπορείτε να υπολογίσετε την τιμή της τυπικής απόκλισης χρησιμοποιώντας δύο διαδικασίες. Αυτοί είναι:

  • ΔΙΑΔΙΚΑΣΙΑ
  • ΕΡΕΥΝΗΤΕΣ

Τυπική απόκλιση με χρήση μέσων PROC

Μπορείτε να μετρήσετε την τυπική απόκλιση χρησιμοποιώντας μέσα proc, πρέπει να επιλέξετε το ΩΡΕΣ επιλογή στο βήμα PROC. Θα εμφανίσει τις τιμές τυπικής απόκλισης για κάθε αριθμητική μεταβλητή στο σύνολο δεδομένων.

Σύνταξη:

PROC ΣΗΜΑΝΤΙΚΑ ΔΕΔΟΜΕΝΑ = σύνολο δεδομένων STD

Εξετάστε αυτόν τον δείγμα κώδικα, ας δημιουργήσουμε ένα άλλο σύνολο δεδομένων CARS1 από το σύνολο δεδομένων CARS στη βιβλιοθήκη SASHELP. Για να το κάνουμε αυτό, επιτρέψτε μας να χρησιμοποιήσουμε τη διαδικασία PROC SQL. Ας ομαδοποιήσουμε τα δεδομένα χρησιμοποιώντας «τύπο» και «μάρκα» αυτοκινήτων και υπολογίζουμε την τυπική απόκλιση για επιλεγμένες μεταβλητές χρησιμοποιώντας την επιλογή STD με το βήμα μέσου PROC.

PROC SQL δημιουργήστε πίνακα CARS1 ως ΕΠΙΛΟΓΗ μάρκας, τύπος, ιπποδύναμη, κύλινδροι, βάρος ΑΠΟ ΤΟ ΠΡΟΣΩΠΙΚΟ. ΑΥΤΟΚΙΝΗΤΑ που κάνουν ('Audi', 'BMW') RUN PROC MEANS DATA = CARS1 STD Run

Ο παραπάνω κώδικας θα δώσει τυπική απόκλιση για επιλεγμένες μεταβλητές. Η ακόλουθη εικόνα εμφανίζει την έξοδο.

ΠΡΟΓΡΑΜΜΑ ΕΡΕΥΝΑΣ

Αυτή η διαδικασία χρησιμοποιείται για τη μέτρηση της τυπικής απόκλισης μαζί με ορισμένα χαρακτηριστικά γνωρίσματα όπως η μέτρηση της τυπικής απόκλισης για κατηγορηματικές μεταβλητές και η διακύμανση.

Σύνταξη:

PROC SURVEYMEANS επιλογές στατιστικές-λέξεις-κλειδιά Ανά μεταβλητές Μεταβλητές κατηγορίας Μεταβλητές μεταβλητών

Ακολουθεί η περιγραφή των παραμέτρων που χρησιμοποιούνται:

  • Με χρησιμοποιείται για να δείξει τις μεταβλητές που χρησιμοποιούνται για τη δημιουργία ομάδων παρατηρήσεων.
  • Τάξη δείχνει τις μεταβλητές που χρησιμοποιούνται για κατηγορηματικές μεταβλητές.
  • Που υποδεικνύει τις μεταβλητές για τις οποίες θα υπολογιστεί το SD.

Ας ρίξουμε μια ματιά σε αυτό το δείγμα κώδικα που περιγράφει τη χρήση της παραμέτρου κλάσης, που δημιουργεί τα στατιστικά στοιχεία για καθεμία από τις τιμές στη μεταβλητή κλάσης.

ΔΕΔΟΜΕΝΑ ΕΡΕΥΝΑΣ PROC = CARS1 STD Τύπος κατηγορίας Var τύπου ιπποδύναμη ods στατιστικά στοιχεία εξόδου = ορθογώνιο Run PROC PRINT DATA = ορθογώνιο Run

Οι παρακάτω εικόνες δείχνουν την έξοδο του παραπάνω κώδικα. Δείχνει κατανομή δεδομένων για μεταβλητή «Ιπποδύναμη» για διάστημα εμπιστοσύνης 95%. (Διάστημα εμπιστοσύνης σημαίνει ένα εύρος τιμών που ορίζονται έτσι ώστε να υπάρχει συγκεκριμένη πιθανότητα ότι η τιμή μιας παραμέτρου βρίσκεται μέσα σε αυτήν.)

Έτσι, αυτό μας φέρνει στο τέλος του blog προγραμματισμού SAS. Για οποιαδήποτε αμφιβολία ή πρόβλημα με το περιεχόμενο του ιστολογίου, αφήστε το στην ενότητα σχολίων, θα τα λύσω το νωρίτερο και θα απαντήσω πίσω.

Εάν θέλετε να μάθετε SAS και να δημιουργήσετε μια καριέρα στον τομέα των αναλυτικών στοιχείων, ρίξτε μια ματιά στο δικό μας που έρχεται με ζωντανή εκπαίδευση με καθοδήγηση εκπαιδευτή και πραγματική εμπειρία έργου. Αυτή η εκπαίδευση θα σας βοηθήσει να κατανοήσετε σε βάθος το SAS και να σας βοηθήσει να κατανοήσετε διάφορες έννοιες της γλώσσας προγραμματισμού SAS.

Έχετε μια ερώτηση για εμάς; Παρακαλώ αναφέρετέ το στην ενότητα σχολίων και θα επικοινωνήσουμε μαζί σας.