Bagikan melalui


Gambaran umum Copilot untuk Ilmu Data dan Rekayasa Data (pratinjau)

Penting

Fitur ini ada dalam pratinjau .

Copilot untuk Ilmu Data dan Teknik Data adalah asisten AI yang membantu menganalisis dan memvisualisasikan data. Ini bekerja dengan tabel dan file Lakehouse, Himpunan Data Power BI, dan dataframe pandas/spark/fabric, memberikan jawaban dan cuplikan kode langsung di notebook. Cara paling efektif menggunakan Copilot adalah menambahkan data Anda sebagai kerangka data. Anda dapat mengajukan pertanyaan di panel obrolan, dan AI menyediakan respons atau kode untuk disalin ke buku catatan Anda. Ini memahami skema dan metadata data Anda, dan jika data dimuat ke dalam dataframe, ia juga memiliki pemahaman tentang data di dalam dataframe tersebut. Anda dapat meminta Copilot untuk memberikan wawasan tentang data, membuat kode untuk visualisasi, atau menyediakan kode untuk transformasi data, dan mengenali nama file untuk referensi yang mudah. Copilot menyederhanakan analisis data dengan menghilangkan pengkodian yang kompleks.

Nota

Pengantar Copilot untuk Ilmu Data dan Rekayasa Data untuk Fabric Data Science

Dengan Copilot untuk Ilmu Data dan Teknik Data, Anda dapat mengobrol dengan asisten AI yang dapat membantu Anda menangani tugas analisis dan visualisasi data Anda. Anda dapat mengajukan pertanyaan Copilot tentang tabel lakehouse, Himpunan Data Power BI, atau kerangka data Pandas/Spark di dalam buku catatan. Copilot memberikan jawaban dalam bahasa alami atau cuplikan kode. Copilot juga dapat menghasilkan kode khusus data untuk Anda, tergantung pada tugas. Misalnya, Copilot untuk Ilmu Data dan Teknik Data dapat menghasilkan kode untuk:

  • Pembuatan bagan
  • Memfilter data
  • Menerapkan transformasi
  • Model pembelajaran mesin

Pertama pilih ikon Copilot di pita buku catatan. Panel obrolan Copilot terbuka, dan sel baru muncul di bagian atas buku catatan Anda. Sel ini harus berjalan setiap kali sesi Spark dimuat dalam buku catatan Fabric. Jika tidak, pengalaman Copilot tidak akan beroperasi dengan benar. Kami sedang dalam proses mengevaluasi mekanisme lain untuk menangani inisialisasi yang diperlukan ini dalam rilis mendatang.

Cuplikan layar memperlihatkan tombol Copilot di pita.

Jalankan sel di bagian atas buku catatan, dengan kode ini:

#Run this cell to install the required packages for Copilot
%load_ext dscopilot_installer
%activate_dscopilot

Setelah sel berhasil dijalankan, Anda dapat menggunakan Copilot. Anda harus menjalankan ulang sel di bagian atas buku catatan setiap kali sesi Anda di buku catatan ditutup.

Cuplikan layar memperlihatkan eksekusi sel yang berhasil.

Untuk memaksimalkan efektivitas Copilot, muat tabel atau himpunan data sebagai kerangka data di buku catatan Anda. Dengan cara ini, AI dapat mengakses data dan memahami struktur dan kontennya. Kemudian, mulailah mengobrol dengan AI. Pilih ikon obrolan di toolbar buku catatan, dan ketik pertanyaan atau permintaan Anda di panel obrolan. Misalnya, Anda dapat bertanya:

  • "Berapa usia rata-rata pelanggan dalam himpunan data ini?"
  • "Perlihatkan bagan batang penjualan menurut wilayah"

Dan banyak lagi. Copilot merespons dengan jawaban atau kode, yang bisa Anda salin dan tempelkan buku catatan Anda. Copilot untuk Ilmu Data dan Teknik Data adalah cara interaktif yang nyaman untuk menjelajahi dan menganalisis data Anda.

Saat Anda menggunakan Copilot, Anda juga dapat memanggil perintah ajaib di dalam sel buku catatan untuk mendapatkan output langsung di buku catatan. Misalnya, untuk jawaban bahasa alami terhadap respons, Anda dapat mengajukan pertanyaan menggunakan perintah "%%chat", seperti:

%%chat
What are some machine learning models that may fit this dataset?

Cuplikan layar memperlihatkan pembuatan kode.

atau

%%code
Can you generate code for a logistic regression that fits this data?

Cuplikan layar memperlihatkan pembuatan kode regresi logistik.

Copilot untuk Ilmu Data dan Teknik Data juga memiliki skema dan pengetahuan tentang metadata tabel di lakehouse (sistem penyimpanan data). Copilot dapat memberikan informasi yang relevan dalam konteks data Anda di lakehouse yang terlampir. Misalnya, Anda dapat bertanya:

  • "Berapa banyak meja di lakehouse?"
  • "Apa saja kolom dari tabel customers?"

Copilot menjawab dengan informasi yang relevan jika Anda menambahkan lakehouse ke buku catatan. Copilot juga memiliki pengetahuan mengenai nama file yang ditambahkan ke lakehouse yang terhubung ke buku catatan. Anda dapat merujuk ke file-file tersebut berdasarkan nama di obrolan Anda. Misalnya, jika Anda memiliki file bernama sales.csv di lakehouse, Anda dapat meminta "Buat dataframe dari sales.csv". Copilot menghasilkan kode dan menampilkannya di panel obrolan. Dengan Copilot untuk notebook, Anda dapat dengan mudah mengakses dan mengkueri data Anda dari sumber yang berbeda. Anda tidak memerlukan sintaks perintah yang tepat untuk melakukannya.

Kiat

  • "Bersihkan" percakapan Anda di panel obrolan Copilot dengan sapu yang terletak di bagian atas panel obrolan. Copilot menyimpan informasi tentang input atau output apa pun selama sesi, namun ini membantu jika Anda menemukan konten saat ini mengganggu.
  • Gunakan perpustakaan chat magic untuk mengonfigurasi pengaturan mengenai Copilot, termasuk pengaturan privasi. Mode berbagi default dirancang untuk memaksimalkan berbagi konteks yang dapat diakses oleh Copilot, sehingga pembatasan informasi yang diberikan kepada kopilot dapat secara langsung dan signifikan mempengaruhi relevansi responnya.
  • Saat Copilot pertama kali diluncurkan, ia menawarkan serangkaian perintah bermanfaat yang dapat membantu Anda memulai. Mereka dapat membantu memulai percakapan Anda dengan Copilot. Untuk merujuk ke perintah nanti, Anda dapat menggunakan tombol berkilau di bagian bawah panel obrolan.
  • Anda dapat "menggeser" bilah samping obrolan copilot untuk memperluas panel obrolan, agar dapat melihat kode lebih jelas atau agar output lebih mudah dibaca di layar Anda.

Keterbatasan

Copilot fitur dalam pengalaman data science saat ini terbatas pada notebook. Fitur-fitur ini termasuk panel obrolan Copilot, perintah ajaib IPython yang dapat digunakan dalam sel kode, dan saran kode otomatis saat Anda mengetik di sel kode. Copilot juga dapat membaca model semantik Power BI menggunakan integrasi tautan semantik.

Copilot memiliki dua penggunaan utama yang dimaksudkan:

  • Satu, Anda dapat meminta Copilot untuk memeriksa dan menganalisis data di notebook Anda (misalnya, dengan terlebih dahulu memuat DataFrame lalu menanyakan Copilot tentang data di dalam DataFrame).
  • Dua, Anda dapat meminta Copilot untuk menghasilkan berbagai saran tentang proses analisis data Anda, seperti model prediktif apa yang mungkin relevan, kode untuk melakukan berbagai jenis analisis data, dan dokumentasi untuk buku catatan yang telah selesai.

Perlu diingat bahwa pembuatan kode dengan pustaka yang bergerak cepat atau baru-baru ini dirilis mungkin mencakup ketidakakuratan atau fabriksi.