Aracılığıyla paylaş


Microsoft Fabric'te Data Wrangler ile veri hazırlığı nasıl hızlandırılabilir?

Data Wrangler aracı, keşif veri analizi için çevreleyici bir arabirim sağlayan not defteri tabanlı bir kaynaktır. Kılavuz benzeri bir veri görüntüsünü dinamik özet istatistikleri, yerleşik görselleştirmeler ve yaygın veri temizleme işlemleri kitaplığıyla birleştirir. Her işlemi birkaç adımla uygulayabilirsiniz. Veri görüntüsünü gerçek zamanlı olarak güncelleştirebilir ve pandas veya PySpark'ta yeniden kullanılabilir bir işlev olarak not defterine geri kaydedebileceğiniz kod oluşturabilirsiniz. Bu makale pandas DataFrames'in keşfine ve dönüşümüne odaklanmaktadır. Spark DataFrame'lerde Data Wrangler kullanma hakkında daha fazla bilgi için bu kaynağı ziyaret edin.

Önkoşullar

Sınırlamalar

  • Özel kod işlemleri şu anda yalnızca pandas DataFrames için desteklenmektedir.
  • Data Wrangler ekranı büyük monitörlerde en iyi şekilde çalışır, ancak daha küçük ekranları barındırmak için arabirimin farklı bölümlerini simge durumuna küçültebilir veya gizleyebilirsiniz.

Veri Wrangler'ı başlatma

Tüm pandaları veya Spark DataFrame'i keşfetmek ve dönüştürmek için Data Wrangler'ı doğrudan bir Microsoft Fabric not defterinden başlatabilirsiniz. Data Wrangler'ı Spark DataFrames ile kullanma hakkında daha fazla bilgi için bu yardımcı makaleyi ziyaret edin. Bu kod parçacığı, pandas DataFrame'de örnek verilerin nasıl okunduğu gösterilir:

import pandas as pd

# Read a CSV into a Pandas DataFrame
df = pd.read_csv("https://raw.githubusercontent.com/plotly/datasets/master/titanic.csv")
display(df)

Not defteri şeridindeki "Giriş" sekmesinde, düzenleme için kullanılabilen etkin DataFrame'lere göz atmak için Veri Wrangler açılan istemini kullanın. Data Wrangler'da açmak istediğiniz kişiyi seçin.

İpucu

Not defteri çekirdeği meşgulken veri Wrangler açılamaz. Bu ekran görüntüsünde gösterildiği gibi, yürütülen bir hücreNin Data Wrangler'ın başlatılabilmesi için önce yürütülmesini tamamlaması gerekir:

Veri Wrangler açılan istemiyle doku not defterini gösteren ekran görüntüsü.

Özel örnekler seçme

Data Wrangler ile herhangi bir etkin DataFrame'in özel örneğini açmak için, bu ekran görüntüsünde gösterildiği gibi açılan listeden "Özel örnek seç"i seçin:

Özel örnek seçeneğinin özetlenmiş olduğu Veri Wrangler açılan istemini gösteren ekran görüntüsü.

Bu, istenen örneğin boyutunu (satır sayısı) ve örnekleme yöntemini (ilk kayıtlar, son kayıtlar veya rastgele bir küme) belirtme seçeneklerini içeren bir açılır pencere başlatır. DataFrame'in ilk 5.000 satırı, bu ekran görüntüsünde gösterildiği gibi varsayılan örnek boyutu görevi görür:

Data Wrangler özel örnek istemini gösteren ekran görüntüsü.

Özet istatistikleri görüntüleme

Data Wrangler yüklendiğinde, "Özet" panelinde seçilen DataFrame'e açıklayıcı bir genel bakış görüntüler. Bu genel bakış DataFrame boyutları, eksik değerleri ve daha fazlası hakkında bilgi içerir. Data Wrangler kılavuzundaki herhangi bir sütunun seçilmesi, "Özet" panelinden bu sütunla ilgili açıklayıcı istatistikleri güncelleştirmesini ve görüntülemesini ister. Her sütunla ilgili hızlı içgörüler, üst bilgisinde de kullanılabilir.

İpucu

Sütuna özgü istatistikler ve görseller (hem "Özet" panelinde hem de sütun üst bilgilerinde) sütun veri türüne bağlıdır. Örneğin, bu ekran görüntüsünde gösterildiği gibi, sütun başlığında yalnızca sütun sayısal tür olarak yayınlanmışsa sayısal sütunun binned histogramı görüntülenir:

Veri Wrangler görüntüleme kılavuzunu ve Özet panelini gösteren ekran görüntüsü.

Veri temizleme işlemlerine göz atma

Veri temizleme adımlarının aranabilir bir listesi "İşlemler" panelinde bulunabilir. "İşlemler" panelinden bir veri temizleme adımının seçilmesi, adımı tamamlamak için gerekli parametrelerle birlikte bir hedef sütun veya sütun sağlamanız istenir. Örneğin, bir sütunu sayısal olarak ölçeklendirme istemi, bu ekran görüntüsünde gösterildiği gibi yeni bir değer aralığı gerektirir:

Veri Wrangler İşlemleri panelini gösteren ekran görüntüsü.

İpucu

Bu ekran görüntüsünde gösterildiği gibi, her sütun üst bilgisinin menüsünden daha küçük bir işlem seçimi uygulayabilirsiniz:

Sütun üst bilgisi menüsünden uygulanabilen Veri Wrangler işlemini gösteren ekran görüntüsü.

İşlemleri önizleme ve uygulama

Veri Wrangler görüntüleme kılavuzu, seçili işlemin sonuçlarını otomatik olarak önizlemede görüntüler ve ilgili kod kılavuzun altındaki panelde otomatik olarak görüntülenir. Önizlenen kodu işlemek için her iki yerde de "Uygula"yı seçin. Önizlenen kodu silmek ve yeni bir işlem denemek için bu ekran görüntüsünde gösterildiği gibi "At"ı seçin:

Devam eden Veri Wrangler işlemini gösteren ekran görüntüsü.

Bir işlem uygulandıktan sonra, Data Wrangler görüntüleme kılavuzu ve özet istatistikleri sonuçları yansıtacak şekilde güncelleştirilir. Kod, bu ekran görüntüsünde gösterildiği gibi "Temizleme adımları" panelinde bulunan çalışan işlem listesinde görünür:

Uygulanan Veri Wrangler işlemini gösteren ekran görüntüsü.

İpucu

En son uygulanan adımı istediğiniz zaman geri alabilirsiniz. "Temizleme adımları" panelinde, imlecinizi bu ekran görüntüsünde gösterildiği gibi en son uygulanan adımın üzerine getirdiğinizde bir çöp kutusu simgesi görüntülenir:

Geri alınabilen Veri Wrangler işlemini gösteren ekran görüntüsü.

Bu tablo, Data Wrangler'ın şu anda desteklediği işlemleri özetler:

İşlem Açıklama
Sırala Sütunu artan veya azalan düzende sıralama
Filtre Satırları bir veya daha fazla koşula göre filtreleme
Tek erişimli kodlama Var olan bir sütundaki her benzersiz değer için, satır başına bu değerlerin varlığını veya yokluğunu gösteren yeni sütunlar oluşturun
Sınırlayıcı ile tek etkin kodlama Sınırlayıcı kullanarak kategorik verileri bölme ve tek erişimli kodlama
Sütun türünü değiştirme Sütunun veri türünü değiştirme
Sütunu bırak Bir veya daha fazla sütunu silme
Sütun seç Tutulacak bir veya daha fazla sütun seçin ve kalan sütunları silin
Sütunu yeniden adlandır Sütunu yeniden adlandırma
Eksik değerleri bırakma Eksik değerleri olan satırları kaldırma
Yinelenen satırları bırakma Yinelenen değerler içeren tüm satırları bir veya daha fazla sütuna bırakın
Eksik değerleri doldurma Hücreleri eksik değerlerle yeni bir değerle değiştirme
Bulma ve değiştirme Hücreleri tam olarak eşleşen bir desenle değiştirme
Sütuna ve toplamaya göre gruplandırma Sütun değerlerine göre gruplandırma ve sonuçları toplama
Beyaz alanı şeritle Metnin başından ve sonundan boşluk kaldırma
Metni bölme Bir sütunu kullanıcı tanımlı sınırlayıcıya göre birkaç sütuna bölme
Metni küçük harfe dönüştürme Metni küçük harfe dönüştürme
Metni büyük harfe dönüştürme Metni BÜYÜK HARFe dönüştürme
En düşük/en yüksek değerleri ölçeklendirme Sayısal sütunu en küçük ve en büyük değer arasında ölçeklendirme
Hızlı Doldurma Mevcut bir sütundan türetilen örnekleri temel alarak otomatik olarak yeni bir sütun oluşturma

Ekranınızı değiştirme

İstediğiniz zaman, Veri Wrangler görüntü kılavuzunun üzerinde bulunan araç çubuğundaki "Görünümler" sekmesiyle arabirimi özelleştirebilirsiniz. Bu, bu ekran görüntüsünde gösterildiği gibi tercihlerinize ve ekran boyutuna göre farklı bölmeleri gizleyebilir veya gösterebilir:

Görüntü görünümünü özelleştirmek için Veri Wrangler menüsünü gösteren ekran görüntüsü.

Kodu kaydetme ve dışarı aktarma

Data Wrangler görüntü kılavuzunun üzerindeki araç çubuğu, oluşturulan kodu kaydetmek için seçenekler sağlar. Kodu panoya kopyalayabilir veya işlev olarak not defterine aktarabilirsiniz. Kodu dışarı aktarmak Data Wrangler'ı kapatır ve yeni işlevi not defterindeki bir kod hücresine ekler. Temizlenen DataFrame'i csv dosyası olarak da indirebilirsiniz.

İpucu

Data Wrangler, yalnızca yeni hücreyi el ile çalıştırdığınızda uygulanan kod oluşturur ve bu ekran görüntüsünde gösterildiği gibi özgün DataFrame'inizin üzerine yazmaz:

Data Wrangler'da kodu dışarı aktarma seçeneklerini gösteren ekran görüntüsü.

Bu ekran görüntüsünde gösterildiği gibi dışarı aktarılan kodu çalıştırabilirsiniz:

Data Wrangler tarafından oluşturulan kodu not defterine geri gösteren ekran görüntüsü.

  • Spark DataFrames üzerinde Data Wrangler'ı denemek için bu yardımcı makaleyi ziyaret edin
  • Data Wrangler in Fabric'in canlı aksiyon tanıtımı için Guy in a Cube'daki arkadaşlarımızdan bu videoya göz atın
  • Visual Studio Code'da Data Wrangler'ı denemek için VS Code'da Data Wrangler'a gidin
  • İhtiyacınız olan bir özelliği kaçırdık mı? Bizimle paylaşın. Doku Fikirleri forumu'nda önerin