Βήματα για τη δημιουργία UDF στο Apache Pig



Το Apache Pig έχει πολλές προκαθορισμένες λειτουργίες. Η ανάρτηση περιέχει σαφή βήματα για τη δημιουργία UDF στο Apache Pig. Εδώ οι κωδικοί είναι γραμμένοι σε Java και απαιτούν Pig Library

Αυτή η ανάρτηση περιέχει το απαραίτητο βήμα που απαιτείται για τη δημιουργία UDF στο Apache Pig. Όλο το UDF πρέπει να επεκτείνει μια λειτουργία φίλτρου και πρέπει να περιέχει μια μέθοδο που ονομάζεται exec, η οποία περιέχει ένα Tuple. Η λογική που εφαρμόζεται εδώ είναι ότι εάν το Tuple είναι μηδέν ή μηδέν, θα σας δώσει μια τιμή Boolean: True ή False. Και το 'IsofAge' προορίζεται για έλεγχο εάν η ηλικία που δόθηκε είναι σωστή ή όχι. Η λογική της συνάρτησης που καθορίζεται από το χρήστη είναι γραμμένη σε κώδικες Java, όπου το αρχείο JAR θα δημιουργηθεί και στη συνέχεια θα εξαχθεί. Το αρχείο JAR καταχωρείται αργότερα. Αυτά τα αρχεία JAR βρίσκονται στα αρχεία της βιβλιοθήκης του Apache Pig κατά τη φόρτωση.

 δημόσια τάξη IsOfAge επεκτείνει το FilterFunc { @Καταπατώ publicBoolean exec (Tuple tuple) throwsIOException {   if (tuple == null || tuple.size () == 0) {   επιστροφή } δοκιμάστε{ Αντικείμενο αντικειμένου = tuple.get (0) αν (αντικείμενο == null) {   επιστροφή } inti = (ακέραιος) αντικείμενο   αν (i == 18 || i == 19 || i == 21 || i == 23 || i == 27) {   επιστροφή } αλλιώς { επιστροφή }} αλίευση (ExecExceptione) { throwewIOException (ε) }}}

Πώς να καλέσετε ένα γουρούνι UDF;

Μόλις δημιουργηθεί ένα UDF, πρέπει να χρησιμοποιηθεί η ακόλουθη εντολή για την καταχώριση του αρχείου JAR.





εγγραφή myudf.jar X = φίλτρο A κατά IsOfAge (ηλικία)

Βήματα για τη δημιουργία UDF στο χοίρο:

Υπάρχουν πολλές προκαθορισμένες λειτουργίες στο Apache Pig. Έχουμε επίσης τη δυνατότητα να δημιουργήσουμε τη δική μας λειτουργία που είναι η λειτουργία καθορισμένη από το χρήστη (UDF) Το Pig UDF είναι γραμμένο σε Java και αυτό απαιτεί το Pig Library να χρησιμοποιεί τις προκαθορισμένες τάξεις. Η βιβλιοθήκη Apache Pig pig-0.8.0-cdh3u0-core.jar μπορείτε να κατεβάσετε από το Διαδίκτυο.

Κάντε κλικ εδώ για βήματα για τη δημιουργία ενός σεναρίου χοίρου με UDF σε λειτουργία HDFS.



Έχετε μια ερώτηση για εμάς; Αναφέρετέ τα στην ενότητα σχολίων και θα επικοινωνήσουμε μαζί σας.

διαφορά μεταξύ επεκτείνεται και εφαρμογών

Σχετικές αναρτήσεις:

Apache Pig Script με UDF σε λειτουργία HDFS



Χειριστές στο Apache Pig: Μέρος 1- Σχεσιακοί χειριστές

Χειριστές στο Apache Pig: Μέρος 2 - Διαγνωστικοί χειριστές

τύποι δεδομένων στο mysql με παραδείγματα