Μετεγκατάσταση των συγκεντρωτικών δεδομένων Spark από το Azure Synapse Analytics στο Fabric
Ενώ το Azure Synapse παρέχει πισίνες Spark, το Fabric προσφέρει πισίνες εκκίνησης και προσαρμοσμένες πισίνες. Η ομάδα εκκίνησης μπορεί να είναι μια καλή επιλογή εάν έχετε μια ενιαία πισίνα χωρίς προσαρμοσμένες ρυθμίσεις παραμέτρων ή βιβλιοθήκες στο Azure Synapse και εάν το μέγεθος του μεσαίου κόμβου ικανοποιεί τις απαιτήσεις σας. Ωστόσο, εάν αναζητάτε μεγαλύτερη ευελιξία με τις ρυθμίσεις παραμέτρων του χώρου συγκέντρωσης Spark, συνιστάται η χρήση προσαρμοσμένων συγκεντρωτικών αποτελεσμάτων. Υπάρχουν δύο επιλογές εδώ:
- Επιλογή 1: Μετακινήστε το Spark pool σας στην προεπιλεγμένη ομάδα ενός χώρου εργασίας.
- Επιλογή 2: Μετακινήστε το Spark pool σας σε ένα προσαρμοσμένο περιβάλλον στο Fabric.
Εάν έχετε περισσότερα από ένα Spark pool και σκοπεύετε να τα μετακινήσετε στον ίδιο χώρο εργασίας Fabric, συνιστάται να χρησιμοποιήσετε την Επιλογή 2, δημιουργώντας πολλαπλά προσαρμοσμένα περιβάλλοντα και χώρους συγκέντρωσης.
Για ζητήματα spark pool, ανατρέξτε στις διαφορές μεταξύ των Azure Synapse Spark και Fabric.
Προαπαιτούμενα στοιχεία
Εάν δεν έχετε ήδη έναν, δημιουργήστε έναν χώρο εργασίας Fabric στον μισθωτή σας.
Επιλογή 1: Από το Spark pool έως τον προεπιλεγμένο χώρο συγκέντρωσης του χώρου εργασίας
Μπορείτε να δημιουργήσετε ένα προσαρμοσμένο Spark pool από τον χώρο εργασίας σας Fabric και να το χρησιμοποιήσετε ως τον προεπιλεγμένο χώρο εργασίας στον χώρο εργασίας. Ο προεπιλεγμένος χώρος συγκέντρωσης χρησιμοποιείται από όλα τα σημειωματάρια και τους ορισμούς εργασίας Spark στον ίδιο χώρο εργασίας.
Για να μετακινηθείτε από ένα υπάρχον Spark pool από το Azure Synapse σε έναν προεπιλεγμένο χώρο εργασίας:
- Πρόσβαση στον χώρο εργασίας Azure Synapse: Είσοδος στο Azure. Μεταβείτε στον χώρο εργασίας σας Azure Synapse, μεταβείτε στην ενότητα Χώροι συγκέντρωσης ανάλυσης και επιλέξτε Χώροι συγκέντρωσης Apache Spark.
- Εντοπίστε τον χώρο συγκέντρωσης Spark: Από τις ομάδες Apache Spark, εντοπίστε τον χώρο συγκέντρωσης Spark που θέλετε να μετακινήσετε στο Fabric και ελέγξτε τις ιδιότητες της πισίνας.
- Λήψη ιδιοτήτων: Αποκτήστε τις ιδιότητες του Spark pool, όπως την έκδοση Apache Spark, την οικογένεια μεγέθους κόμβου, το μέγεθος κόμβου ή την αυτόματη κλιμάκωση. Ανατρέξτε στα ζητήματα του Spark pool για να δείτε τυχόν διαφορές.
-
Δημιουργήστε ένα προσαρμοσμένο Spark pool στο Fabric:
- Μεταβείτε στον χώρο εργασίας σας Fabric και επιλέξτε Ρυθμίσεις χώρου εργασίας.
- Μεταβείτε στη Μηχανική δεδομένων/Επιστήμη και επιλέξτε Ρυθμίσεις Spark.
- Από την καρτέλα Χώρος συγκέντρωσης και στην ενότητα Προεπιλεγμένος χώρος εργασίας χώρου εργασίας, αναπτύξτε το αναπτυσσόμενο μενού και επιλέξτε Δημιουργία νέου χώρου συγκέντρωσης.
- Δημιουργήστε τον προσαρμοσμένο χώρο συγκέντρωσης με τις αντίστοιχες τιμές-στόχο. Συμπληρώστε το όνομα, την οικογένεια κόμβων, το μέγεθος κόμβου, την αυτόματη κλιμάκωση και τις δυναμικές επιλογές εκχώρησης εκτελέσεων.
-
Επιλέξτε μια έκδοση χρόνου εκτέλεσης:
- Μεταβείτε στην καρτέλα Περιβάλλον και επιλέξτε την απαιτούμενη έκδοση χρόνου εκτέλεσης. Δείτε τους διαθέσιμους χρόνους εκτέλεσης εδώ.
- Απενεργοποιήστε την επιλογή Ορισμός προεπιλεγμένου περιβάλλοντος .
Σημείωμα
Σε αυτήν την επιλογή, δεν υποστηρίζονται βιβλιοθήκες ή ρυθμίσεις παραμέτρων επιπέδου ομάδας. Ωστόσο, μπορείτε να προσαρμόσετε τη ρύθμιση παραμέτρων υπολογισμού για μεμονωμένα στοιχεία όπως σημειωματάρια και ορισμούς εργασίας Spark και να προσθέσετε ενσωματωμένες βιβλιοθήκες. Εάν θέλετε να προσθέσετε προσαρμοσμένες βιβλιοθήκες και ρυθμίσεις παραμέτρων σε ένα περιβάλλον, εξετάστε ένα προσαρμοσμένο περιβάλλον.
Επιλογή 2: Από spark pool σε προσαρμοσμένο περιβάλλον
Με τα προσαρμοσμένα περιβάλλοντα, μπορείτε να ρυθμίσετε προσαρμοσμένες ιδιότητες και βιβλιοθήκες Spark. Για να δημιουργήσετε ένα προσαρμοσμένο περιβάλλον:
- Πρόσβαση στον χώρο εργασίας Azure Synapse: Είσοδος στο Azure. Μεταβείτε στον χώρο εργασίας σας Azure Synapse, μεταβείτε στην ενότητα Χώροι συγκέντρωσης ανάλυσης και επιλέξτε Χώροι συγκέντρωσης Apache Spark.
- Εντοπίστε τον χώρο συγκέντρωσης Spark: Από τις ομάδες Apache Spark, εντοπίστε τον χώρο συγκέντρωσης Spark που θέλετε να μετακινήσετε στο Fabric και ελέγξτε τις ιδιότητες της πισίνας.
- Λήψη ιδιοτήτων: Αποκτήστε τις ιδιότητες του Spark pool, όπως την έκδοση Apache Spark, την οικογένεια μεγέθους κόμβου, το μέγεθος κόμβου ή την αυτόματη κλιμάκωση. Ανατρέξτε στα ζητήματα του Spark pool για να δείτε τυχόν διαφορές.
-
Δημιουργήστε ένα προσαρμοσμένο Spark pool:
- Μεταβείτε στον χώρο εργασίας σας Fabric και επιλέξτε Ρυθμίσεις χώρου εργασίας.
- Μεταβείτε στη Μηχανική δεδομένων/Επιστήμη και επιλέξτε Ρυθμίσεις Spark.
- Από την καρτέλα Χώρος συγκέντρωσης και στην ενότητα Προεπιλεγμένος χώρος εργασίας χώρου εργασίας, αναπτύξτε το αναπτυσσόμενο μενού και επιλέξτε Δημιουργία νέου χώρου συγκέντρωσης.
- Δημιουργήστε τον προσαρμοσμένο χώρο συγκέντρωσης με τις αντίστοιχες τιμές-στόχο. Συμπληρώστε το όνομα, την οικογένεια κόμβων, το μέγεθος κόμβου, την αυτόματη κλιμάκωση και τις δυναμικές επιλογές εκχώρησης εκτελέσεων.
- Δημιουργήστε ένα στοιχείο περιβάλλοντος εάν δεν έχετε ένα.
-
Ρύθμιση παραμέτρων του Spark compute:
- Εντός του περιβάλλοντος, μεταβείτε στην ενότητα Spark Compute Compute>.
- Επιλέξτε τον χώρο συγκέντρωσης που μόλις δημιουργήσατε για το νέο περιβάλλον.
- Μπορείτε να ρυθμίσετε τις παραμέτρους πυρήνων προγράμματος οδήγησης και εκτελέσεων και μνήμης.
- Επιλέξτε μια έκδοση χρόνου εκτέλεσης για το περιβάλλον. Δείτε τους διαθέσιμους χρόνους εκτέλεσης εδώ.
- Κάντε κλικ στην επιλογή Αποθήκευση και δημοσίευση αλλαγών.
Μάθετε περισσότερα σχετικά με τη δημιουργία και χρήση ενός περιβάλλοντος.