R Programming - Οδηγός για αρχάριους για R Programming Language



Αυτό το blog σχετικά με τον προγραμματισμό R σας παρουσιάζει το R και σας βοηθά να κατανοήσετε λεπτομερώς τις διάφορες βασικές έννοιες του προγραμματισμού R με παραδείγματα.

Το R είναι ένα από τα πιο δημοφιλή εργαλεία ανάλυσης. Αλλά εκτός από το ότι χρησιμοποιείται για αναλυτικά στοιχεία, το R είναι επίσης μια γλώσσα προγραμματισμού.Με την ανάπτυξή του στον κλάδο της πληροφορικής, υπάρχει μια ακμάζουσα ζήτηση για ειδικευμένους ή με την κατανόηση του R ως και των δύο, ενός εργαλείου ανάλυσης δεδομένων και μιας γλώσσας προγραμματισμού.Σε αυτό το blog, θα σας βοηθήσω να κατανοήσετε τις διάφορες βασικές αρχές του προγραμματισμού R. Στο δικό μας Π εμφανής Ιστολόγιο ,έχουμε συζητήσει Γιατί χρειαζόμαστε το Analytics, Τι είναι το Business Analytics, γιατί και ποιος χρησιμοποιεί το R.

Σε αυτό το ιστολόγιο, θα κατανοήσουμε τις παρακάτω βασικές έννοιες του προγραμματισμού R με την ακόλουθη σειρά:





  1. Μεταβλητές
  2. Τύποι δεδομένων
  3. Διαχειριστές δεδομένων
  4. Δήλωση υπό όρους
  5. Βρόχοι
  6. Λειτουργίες

Μπορείτε να διαβάσετε το διαδικτυακό σεμινάριο της γλώσσας προγραμματισμού R όπου ο εκπαιδευτής μας έχει εξηγήσει τα θέματα με λεπτομερή τρόπο με παραδείγματα που θα σας βοηθήσουν να κατανοήσετε καλύτερα τον προγραμματισμό R.

Προγραμματισμός R για αρχάριους | Εκμάθηση γλωσσών προγραμματισμού | Έντρεκα



Ας προχωρήσουμε λοιπόν και ας δούμε την πρώτη ιδέα του προγραμματισμού R - Variables.

Προγραμματισμός R: Μεταβλητές

Οι μεταβλητές δεν είναι παρά ένα όνομα σε μια θέση μνήμης που περιέχει μια τιμή. Μια μεταβλητή στο R μπορεί να αποθηκεύσει αριθμητικές τιμές, σύνθετες τιμές, λέξεις, πίνακες και ακόμη και έναν πίνακα. Έκπληξη, σωστά;

Μεταβλητή - Προγραμματισμός R - Edureka

Σύκο: Δημιουργίαμεταβλητών



Η παραπάνω εικόνα μας δείχνει πώς δημιουργούνται οι μεταβλητές και πώς αποθηκεύονται σε διαφορετικά μπλοκ μνήμης. Στο R, δεν χρειάζεται να δηλώσουμε μια μεταβλητή πριν τη χρησιμοποιήσουμε, σε αντίθεση με άλλες γλώσσες προγραμματισμού όπως Java, C, C ++ κ.λπ.

Ας προχωρήσουμε και ας προσπαθήσουμε να καταλάβουμε τι είναι ένας τύπος δεδομένων και τους διάφορους τύπους δεδομένων που υποστηρίζονται στο R.

Προγραμματισμός R: Τύποι δεδομένων

Στο R, μια ίδια η μεταβλητή δεν δηλώνεται για κανένα τύπο δεδομένων, αλλά παίρνει τον τύπο δεδομένων του αντικειμένου R που του έχει ανατεθεί. Έτσι, το R ονομάζεται δυναμικά δακτυλογραφημένη γλώσσα, που σημαίνει ότι μπορούμε να αλλάξουμε ξανά έναν τύπο δεδομένων της ίδιας μεταβλητής όταν το χρησιμοποιούμε σε ένα πρόγραμμα.

Οι τύποι δεδομένων καθορίζουν ποιο τύπο τιμής έχει μια μεταβλητή και τι είδους μαθηματικές, σχεσιακές ή λογικές λειτουργίες μπορούν να εφαρμοστούν σε αυτήν χωρίς να προκαλέσει σφάλμα. Υπάρχουν πολλοί τύποι δεδομένων στο R, ωστόσο παρακάτω είναι οι πιο συχνά χρησιμοποιούμενοι:

Ας συζητήσουμε τώρα κάθε έναν από αυτούς τους τύπους δεδομένων ξεχωριστά, ξεκινώντας από το Vectors.

Διανύσματα

Τα διανύσματα είναι τα πιο βασικά αντικείμενα δεδομένων R και υπάρχουν έξι τύποι ατομικών διανυσμάτων. Παρακάτω είναι οι έξι ατομικοί φορείς:

Λογικός : Χρησιμοποιείται για την αποθήκευση λογικής αξίας όπως ΑΛΗΘΗΣ ή ΨΕΥΔΗΣ .

Αριθμητικός : Χρησιμοποιείται για την αποθήκευση τόσο θετικών όσο και αρνητικών αριθμών συμπεριλαμβανομένου του πραγματικού αριθμού.

Π.χ .: 25, 7.1145, 96547

Ακέραιος αριθμός : Διατηρεί όλες τις ακέραιες τιμές, δηλαδή όλους τους θετικούς και αρνητικούς ακέραιους αριθμούς.

Π.χ .: 45.479, -856.479, 0

Συγκρότημα : Αυτά είναι της μορφής x + yi, όπου x και y είναι αριθμητικά και αντιπροσωπεύει την τετραγωνική ρίζα του -1.

Π.χ .: 4 + 3i

Χαρακτήρας : Χρησιμοποιείται για την αποθήκευση ενός μόνο χαρακτήρα, μιας ομάδας χαρακτήρων (λέξεων) ή μιας ομάδας λέξεων μαζί. Οι χαρακτήρες μπορούν να οριστούν είτε σε εισαγωγικά είτε σε διπλά εισαγωγικά.

Π.χ .: «Edureka», «Το R είναι διασκεδαστικό να μάθεις».

Γενικά, ένα διάνυσμα ορίζεται και αρχικοποιείται με τον ακόλουθο τρόπο:

Vtr = c (2, 5, 11, 24) Ή Vtr<- c(2, 5, 11 , 24)

Ας προχωρήσουμε και να κατανοήσουμε άλλους τύπους δεδομένων στο R.

Λίστα

Οι λίστες είναι αρκετά παρόμοιες με τα διανύσματα, αλλά οι λίστες είναι τα αντικείμενα R που μπορούν να περιέχουν στοιχεία διαφορετικών τύπων όπως & μείον αριθμούς, συμβολοσειρές, διανύσματα και μια άλλη λίστα μέσα σε αυτό.

Π.χ:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Παραγωγή:

[[1]] [1] 'Γεια' 'Γεια' 'Πώς κάνετε '[[2]] [1] 22,5 [[3]] [1] 14965 [[4]] [1] ΑΛΗΘΕΙΑ

Μήτρα

Το Matrix είναι το αντικείμενο R στο οποίο τα στοιχεία είναι διατεταγμένα σε δισδιάστατη ορθογώνια διάταξη.

Η βασική σύνταξη για τη δημιουργία μιας μήτρας στο R είναι & μείον

 μήτρα (δεδομένα, nrow, ncol, byrow, dimnames) 

Που:

  • δεδομένα είναι ο φορέας εισόδου που γίνεται τα στοιχεία δεδομένων της μήτρας.
  • τώρα είναι ο αριθμός των γραμμών που θα δημιουργηθούν.
  • ncol είναι ο αριθμός των στηλών που θα δημιουργηθούν.
  • αντίο είναι μια λογική ένδειξη. Εάν ΑΛΗΘΕΙΑ, τότε τα στοιχεία του διανύσματος εισόδου ταξινομούνται κατά σειρά.
  • dimname είναι τα ονόματα που εκχωρούνται στις σειρές και τις στήλες.

Παράδειγμα:

Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Παραγωγή:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

ΠΙΝΑΚΑΣ

Οι πίνακες στο R είναι αντικείμενα δεδομένων που μπορούν να χρησιμοποιηθούν για την αποθήκευση δεδομένων σε περισσότερες από δύο διαστάσεις. Παίρνει διανύσματα ως είσοδο και χρησιμοποιεί τις τιμές στο όχι παράμετρος για τη δημιουργία πίνακα.

Η βασική σύνταξη για τη δημιουργία ενός πίνακα στο R είναι & μείον

 πίνακας (δεδομένα, αμυδρό, ονόματα dimn) 

Που:

  • δεδομένα είναι το διάνυσμα εισαγωγής που γίνεται τα στοιχεία δεδομένων του πίνακα.
  • όχι είναι η διάσταση του πίνακα, όπου περνάτε τον αριθμό των γραμμών, τη στήλη και τον αριθμό των πινάκων που θα δημιουργηθούν από τις αναφερόμενες διαστάσεις.
  • dimname είναι τα ονόματα που εκχωρούνται στις σειρές και τις στήλες.

Παράδειγμα:

Μυράι<- array( c(1:16), dim=(4,4,2)) Myarray 

Παραγωγή:

, , ένας [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 , 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Πλαίσιο δεδομένων

Ένα πλαίσιο δεδομένων είναι ένας πίνακας ή μια δισδιάστατη δομή τύπου πίνακα στον οποίο κάθε στήλη περιέχει τιμές μιας μεταβλητής και κάθε σειρά περιέχει ένα σύνολο τιμώνΓιακάθε στήλη. Ακολουθούν μερικά από τα χαρακτηριστικά ενός Πλαισίου Δεδομένων που πρέπει να λαμβάνονται υπόψη κάθε φορά που συνεργαζόμαστε μαζί τους:

  • Τα ονόματα των στηλών δεν πρέπει να είναι κενά.
  • Κάθε στήλη πρέπει να περιέχει την ίδια ποσότητα στοιχείων δεδομένων.
  • Τα δεδομένα που αποθηκεύονται σε ένα πλαίσιο δεδομένων μπορεί να είναι αριθμητικού, παράγοντα ή τύπου χαρακτήρα.
  • Τα ονόματα των σειρών πρέπει να είναι μοναδικά.

Παράδειγμα:

emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') dept = c ('Sales', 'Finance', 'Marketing', 'HR ',' R & D ') emp.data<- data.frame(emp_id, emp_name, dept) emp.data 

Παραγωγή:

emp_id emp_name τμήμα 1 100 Πωλήσεις John 2 101 Χένρι χρηματοδότηση 3 102 Adam Marketing 4 103 Ron HR 5 104 Gary Ε & Α

πώς να αρχικοποιήσετε ένα αντικείμενο στο python

Τώρα που έχουμε κατανοήσει τους βασικούς τύπους δεδομένων του R, ήρθε η ώρα να εμβαθύνουμε στο R κατανοώντας τις έννοιες των Data Operators.

Προγραμματισμός R: Χειριστές δεδομένων

Υπάρχουν κυρίως 4 τελεστές δεδομένων στο R, όπως φαίνεται παρακάτω:

Αριθμητικοί χειριστές : Αυτοί οι χειριστές μας βοηθούν να εκτελέσουμε τις βασικές αριθμητικές λειτουργίες όπως προσθήκη, αφαίρεση, πολλαπλασιασμό κ.λπ.

Εξετάστε το ακόλουθο παράδειγμα:

num1 = 15 num2 = 20 num3 = 0 # addum num3 = num1 + num2 num3 #substraction num3 = num1 - num2 num3 #multiplication num3 = num1 * num2 num3 #division num3 = num1 / num2 num3 # numulus num3 # Exponent Num1 = 5 Num2 = 3 Num3 = Num1 ^ Num2 Num3 # Floor Division Num3 = Num1% /% Num2 Num3

Παραγωγή:

[1] 35 [δεκαπέντε [1] 300 [1] 0,75 [1] 15 [1] 125 [έντεκα

Σχεσιακοί χειριστές : Αυτοί οι τελεστές μας βοηθούν να εκτελέσουμε τις σχεσιακές λειτουργίες, όπως να ελέγξουμε εάν μια μεταβλητή είναι μεγαλύτερη από, μικρότερη ή ίση με άλλη μεταβλητή. Το αποτέλεσμα μιας σχεσιακής λειτουργίας είναι πάντα μια λογική τιμή.

Εξετάστε τα ακόλουθα παραδείγματα:

num1 = 15 num2 = 20 # ισούται με num3 = (num1 == num2) num3 # not ίσο με num3 = (num1! = num2) num3 #lesser from num3 = (num1 num2) num3 #less than ίσο με num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Παραγωγή:

[1] ΛΑΘΟΣ [1] ΑΛΗΘΕΙΑ [1] ΑΛΗΘΕΙΑ [1] ΛΑΘΟΣ [1] ΑΛΗΘΕΙΑ [1] ΛΑΘΟΣ

Χειριστές ανάθεσης: Αυτοί οι τελεστές χρησιμοποιούνται για την εκχώρηση τιμών σε μεταβλητές στο R. Η ανάθεση μπορεί να εκτελεστεί χρησιμοποιώντας είτε τον χειριστή ανάθεσης(<-) ή ισούται με τον τελεστή (=). Η τιμή της μεταβλητής μπορεί να αντιστοιχιστεί με δύο τρόπους, αριστερή ανάθεση και δεξιά ανάθεση.

ΛογικόςΧειριστές: Αυτοί οι τελεστές συγκρίνουν τις δύο οντότητες και χρησιμοποιούνται συνήθως με δυαδικές (λογικές) τιμές όπως «και», «ή»και'δεν'.


Προγραμματισμός R: Δηλώσεις υπό όρους

  1. Εάν δήλωση: Η δήλωση If σας βοηθά στην αξιολόγηση μιας μεμονωμένης έκφρασης ως μέρος της ροής. Για να πραγματοποιήσετε αυτήν την αξιολόγηση, απλώς πρέπει να γράψετε τη λέξη-κλειδί If που ακολουθείται από την έκφραση που πρέπει να αξιολογηθεί. Το παρακάτω διάγραμμα ροής θα δώσει μια ιδέα για το πώς η δήλωση If ελέγχει τη ροή ενός κώδικα: Εξετάστε το ακόλουθο παράδειγμα:
num1 = 10 num2 = 20 if (num1)<=num2){ print('Num1 is less or equal to Num2') 

Παραγωγή:

[1] «Το Num1 είναι μικρότερο ή ίσο με το Num2»
  • Διαφορετική δήλωση: Η δήλωση Else if σάς βοηθά στην επέκταση των κλάδων στη ροή που δημιουργείται από τη δήλωση If και σας δίνει την ευκαιρία να αξιολογήσετε πολλαπλές συνθήκες δημιουργώντας νέους κλάδους ροής. Η παρακάτω ροή θα σας δώσει μια ιδέα για το πώς το άλλο αν η δήλωση διακλαδίζει τη ροή του κώδικα:

    Εξετάστε το ακόλουθο παράδειγμα:

    Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 is lesser than Num1')} other if ('Num1 == Num2) {print (' Num1 and Num2 are Equal ')}

    Παραγωγή:

    [1] 'Το Num1 είναι μικρότερο από το Num2'

  • Δήλωση αλλιώς: Η άλλη δήλωση χρησιμοποιείται όταν όλες οι άλλες εκφράσεις ελέγχονται και βρεθούν άκυρες. Αυτή θα είναι η τελευταία δήλωση που εκτελείται ως μέρος του κλάδου If - Else if. Η παρακάτω ροή θα σας δώσει μια καλύτερη ιδέα για το πώς η Else αλλάζει τη ροή του κώδικα:

Εξετάστε το ακόλουθο παράδειγμα:

Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 is lesser than Num1')} other print ('Num1 and Num2 are Equal')}

Παραγωγή:

[1] «Το Num1 και το Num2 είναι ίσο»

Προγραμματισμός R: Loops

Μια δήλωση βρόχου μας επιτρέπει να εκτελέσουμε μια δήλωση ή μια ομάδα δηλώσεων πολλές φορές. Υπάρχουν κυρίως 3 τύποι βρόχων στο R:

  1. επαναλάβετε το Loop : Επαναλαμβάνει μια δήλωση ή μια ομάδα δηλώσεων ενώ μια δεδομένη συνθήκη είναι ΑΛΗΘΕΙΑ. Ο επαναλαμβανόμενος βρόχος είναι το καλύτερο παράδειγμα ενός βρόχου ελεγχόμενης εξόδου όπου ο κώδικας εκτελείται για πρώτη φορά και στη συνέχεια ελέγχεται η συνθήκη για να προσδιοριστεί εάν ο έλεγχος πρέπει να βρίσκεται μέσα στον βρόχο ή να βγεί από αυτόν. Ακολουθεί η ροή ελέγχου σε επαναλαμβανόμενο βρόχο:
    Ας δούμε το παρακάτω παράδειγμα για να καταλάβουμε πώς μπορούμε να χρησιμοποιήσουμε επαναλαμβανόμενο βρόχο για να προσθέσουμε αριθμούς n έως ότου το άθροισμα υπερβεί τα 100:

    x = 2 επανάληψη {x = x ^ 2 εκτύπωση (x) εάν (x> 100) {break}

    Παραγωγή:

    [1] 4 [1] 16 [1] 256
  2. ενώ βρόχος : Εγώβοηθά στην επανάληψη μιας δήλωσης ή μιας ομάδας δηλώσεων ενώ μια δεδομένη συνθήκη είναι ΑΛΗΘΕΙΑ. Ενώ ο βρόχος, σε σύγκριση με τον επαναλαμβανόμενο βρόχο είναι ελαφρώς διαφορετικός, είναι ένα παράδειγμα βρόχου ελεγχόμενης εισόδου, όπου η συνθήκη ελέγχεται για πρώτη φορά και μόνο εάν η συνθήκη διαπιστωθεί ότι είναι αληθής, ο έλεγχος παραδίδεται εντός του βρόχου για την εκτέλεση του κώδικα . Παρακάτω είναι η ροή ελέγχου σε ένα βρόχο λίγο:
    Ας δούμε το παρακάτω παράδειγμα για να προσθέσουμε το άθροισμα των τετραγώνων για τους πρώτους 10 αριθμούς και να κατανοήσουμε πώς λειτουργεί ο βρόχος while:

    num = 1 sumn = 0 ενώ (αριθ<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Παραγωγή:

    [έντεκα [δεκαπέντε [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. για βρόχο : Χρησιμοποιείται για την επανάληψη μιας δήλωσης ή ομάδας για έναν καθορισμένο αριθμό φορών. Σε αντίθεση με το επαναλαμβανόμενο και το loop loop, το for loop χρησιμοποιείται σε καταστάσεις όπου γνωρίζουμε πόσες φορές ο κώδικας χρειάζεται να εκτελεστεί εκ των προτέρων. Είναι παρόμοιο με το loop loop όπου ελέγχεται πρώτα η συνθήκη και μετά εκτελείται μόνο ο γραμμένος κώδικας. Ας δούμε τώρα τη ροή ελέγχου για βρόχο:

Ας δούμε τώρα ένα παράδειγμα όπου θα χρησιμοποιούμε το for loop για να εκτυπώσουμε τους πρώτους 10 αριθμούς:

για (x σε 1:10) {εκτύπωση (x)}

Παραγωγή:

[έντεκα [1] 2 [1] 3 [1] 4 [δεκαπέντε [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

Προγραμματισμός R: Λειτουργίες

Η συνάρτηση είναι ένα μπλοκ οργανωμένου, επαναχρησιμοποιήσιμου κώδικα που χρησιμοποιείται για την εκτέλεση μιας μεμονωμένης, σχετικής ενέργειας. Υπάρχουν κυρίως δύο τύποι συναρτήσεων στο R:

Προκαθορισμένες λειτουργίες : Αυτές είναι ενσωματωμένες σε λειτουργίες που μπορούν να χρησιμοποιηθούν από τον χρήστη για να κάνει τη δουλειά του ευκολίαρ. Π.χ .: meaν( Χ) , δεσύΜ( Χ) , τ.μ.τ ( Χ ), ανατροπέας( Χ ), και τα λοιπά.

Ορισμένο από τον χρήστη Λειτουργίες: Αυτές οι λειτουργίες δημιουργούνται από τον χρήστη για να ικανοποιήσουν μια συγκεκριμένη απαίτηση του χρήστη. Το παρακάτω είναι η σύνταξη για τη δημιουργία μιας συνάρτησης στοΡ:

 func  όνομα_στοιχείου  <– λειτουργία (arg_1, arg_2 & hellip){ // Σώμα λειτουργίας }

Εξετάστε το ακόλουθο παράδειγμα μιας απλής λειτουργίας για τη δημιουργία του αθροίσματος των τετραγώνωντου2 αριθμοί:

άθροισμα_το_δίσκου<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Έξοδος: [1] 25

Ελπίζω να σας άρεσε να διαβάζετε αυτό το blog προγραμματισμού R. Έχουμε καλύψει όλα τα βασικά του R σε αυτό το σεμινάριο, ώστε να μπορείτε να αρχίσετε να ασκείστε τώρα. Μετά από αυτό το ιστολόγιο προγραμματισμού R, θα βρω περισσότερα ιστολόγια στο R για Analytics, οπότε μείνετε συντονισμένοι.

Τώρα που έχετε κατανοήσει τα βασικά του R, ρίξτε μια ματιά στο από την Edureka, μια αξιόπιστη διαδικτυακή εταιρεία εκμάθησης με δίκτυο περισσότερων από 250.000 ικανοποιημένων μαθητών σε όλο τον κόσμο. Το Data Analytics της Edureka με εκπαίδευση R θα σας βοηθήσει να αποκτήσετε εξειδίκευση στον προγραμματισμό R, τη διαχείριση δεδομένων, την διερευνητική ανάλυση δεδομένων, την οπτικοποίηση δεδομένων, την εξόρυξη δεδομένων, την παλινδρόμηση, την ανάλυση συναισθημάτων και τη χρήση του RStudio για πραγματικές μελέτες περιπτώσεων σε λιανικά, κοινωνικά μέσα.

Έχετε μια ερώτηση για εμάς; Παρακαλώ αναφέρετέ το στην ενότητα σχολίων αυτού του ιστολογίου 'R Programming' και θα επικοινωνήσουμε μαζί σας το συντομότερο δυνατό.