Microsoft Fabric terminolojisi
Doku Veri Ambarı, Doku Veri Mühendisliği, Doku Veri Bilimi, Real-Time Intelligence, Data Factory ve Power BI'a özgü terimler de dahil olmak üzere Microsoft Fabric'te kullanılan terimlerin tanımlarını öğrenin.
Genel terimler
Kapasite: Kapasite, belirli bir zamanda kullanılmak üzere kullanılabilen ayrılmış bir kaynak kümesidir. Kapasite, bir kaynağın etkinlik gerçekleştirme veya çıkış oluşturma becerisini tanımlar. Farklı öğeler belirli bir zamanda farklı kapasite tüketir. Fabric, SKU ve Denemeler aracılığıyla kapasite sunar. Daha fazla bilgi için bkz. Kapasite nedir?
Deneyimi: Belirli bir işlevselliği hedefleyen bir özellik koleksiyonu. Doku deneyimleri arasında Doku Veri Ambarı, Doku Veri Mühendisliği, Doku Veri Bilimi, Real-Time Intelligence, Data Factory ve Power BI bulunur.
Öğesi: Öğe, bir deneyim içindeki bir özellik kümesidir. Kullanıcılar bunları oluşturabilir, düzenleyebilir ve silebilir. Her öğe türü farklı özellikler sağlar. Örneğin, Veri Mühendisliği deneyimi lakehouse, not defteri ve Spark iş tanımı öğelerini içerir.
Kiracı: Kiracı, bir kuruluş için tek bir Doku örneğidir ve bir Microsoft Entra Kimliği ile ilişkilendirilir.
Çalışma Alanı: Çalışma alanı, işbirliği için tasarlanmış tek bir ortamda farklı işlevleri bir araya getiren bir öğe koleksiyonudur. Yürütülen iş için kapasite kullanan ve içindeki öğelere kimlerin erişebileceğine yönelik denetimler sağlayan bir kapsayıcı işlevi görür. Örneğin, bir çalışma alanında kullanıcılar raporlar, not defterleri, anlam modelleri vb. oluşturur. Daha fazla bilgi için Çalışma Alanları makalesine bakın.
Doku Veri Mühendisliği
Lakehouse: A lakehouse, Apache Spark altyapısı ve SQL altyapısı tarafından büyük veri işleme için kullanılan bir veri gölü üzerinden veritabanını temsil eden bir dosya, klasör ve tablo koleksiyonudur. Lakehouse, açık kaynak Delta biçimli tabloları kullanırken ACID işlemleri için gelişmiş özellikler içerir. Lakehouse öğesi, Microsoft OneLakeiçindeki benzersiz bir çalışma alanı klasöründe barındırılır. Klasörler ve alt klasörler halinde düzenlenmiş çeşitli biçimlerde (yapılandırılmış ve yapılandırılmamış) dosyalar içerir. Daha fazla bilgi için bkz. Göl evi nedir?
Not Defteri: A Fabric not defteri, zengin işlevlere sahip çok dilli etkileşimli bir programlama aracıdır. Kod ve markdown yazma, Spark işini çalıştırma ve izleme, sonucu görüntüleme ve görselleştirme ve ekiple işbirliği gibi özellikler. Veri mühendislerinin ve veri bilimcinin verileri keşfetmesine ve işlemesine ve hem kod hem de düşük kod deneyimiyle makine öğrenmesi denemeleri oluşturmasına yardımcı olur. Koordinasyon için kolayca bir işlem hattı etkinliğine dönüştürülebilir.
spark uygulaması : Apache Spark uygulaması, Kullanıcı tarafından Spark'ın API dillerinden (Scala, Python, Spark SQL veya Java) veya Microsoft tarafından eklenen dillerden (C# veya F# ile.NET) kullanılarak yazılmış bir programdır. Bir uygulama çalıştırıldığında, verileri daha hızlı işlemek için paralel olarak çalışan bir veya daha fazla Spark işine ayrılır. Daha fazla bilgi için bkz. Spark uygulama izleme.
Apache Spark işi . Bir Spark işi, Spark uygulaması içindeki diğer işlerle paralel olarak çalıştırılan bir uygulama parçasıdır. bir iş birden çok görevden oluşur. Daha fazla bilgi için bkz. Spark işi izleme.
Apache Spark iş tanımını : Spark iş tanımı, kullanıcı tarafından bir Spark uygulamasının nasıl çalıştırılması gerektiğini gösteren bir dizi parametredir. Spark kümesine toplu iş veya akış işleri göndermenizi sağlar. Daha fazla bilgi için bkz. Apache Spark iş tanımı nedir?
V düzeni: Hızlı okuma olanağı sağlayan ve maliyet verimliliği ile daha iyi performans sağlayan parquet dosya biçimine yazma iyileştirmesi. Tüm Fabric motorları varsayılan olarak v-sıralı parquet dosyaları yazar.
Veri Fabrikası
Bağlayıcısı: Data Factory, farklı türlerdeki veri depolarına bağlanmanızı sağlayan zengin bir bağlayıcı kümesi sunar. Bağlandıktan sonra verileri dönüştürebilirsiniz. Daha fazla bilgi için bkz. bağlayıcıları.
Veri işlem hattı: Data Factory'de veri taşıma ve dönüştürmeyi düzenlemeye yönelik bir veri işlem hattı kullanılır. Bu işlem hatları, Fabric'deki dağıtım işlem hatlarından farklıdır. Daha fazla bilgi için, Data Factory genel bakış bölümünde İşlem Hatları bölümüne bakın.
Veri Akışı 2. Nesil: Veri Akışları, yüzlerce veri kaynağından veri almak ve verilerinizi dönüştürmek için düşük kodlu bir arabirim sağlar. Dokudaki veri akışları, Veri Akışı 2. Nesil olarak adlandırılır. Veri akışı 1. Nesil Power BI'da mevcuttur. Veri Akışı 2. Nesil, Azure Data Factory veya Power BI'daki Veri akışlarına kıyasla ek özellikler sunar. 1. Nesil'den 2. Nesil'e yükseltemezsiniz. Daha fazla bilgi için Data Factory genel bakış bölümünde Dataflows bölümüne bakın.
Tetikleyicisi: Data Factory'de zamanlamalar veya veri kullanılabilirliği gibi belirli koşullara göre işlem hatlarını başlatan bir otomasyon özelliği.
Katman Veri Bilimi
Data Wrangler: Data Wrangler, kullanıcılara keşif veri analizi gerçekleştirmek için çevreleyici bir deneyim sunan not defteri tabanlı bir araçtır. Bu özellik, kılavuz benzeri bir veri görüntüsünü dinamik özet istatistikleri ve bir dizi ortak veri temizleme işlemiyle birleştirir ve bunların tümü birkaç seçili simgeyle kullanılabilir. Her işlem, yeniden kullanılabilir bir betik olarak not defterine geri kaydedilebilen kod oluşturur.
Denemesi: Makine öğrenmesi denemesi, tüm ilgili makine öğrenmesi çalıştırmaları için birincil kuruluş ve denetim birimidir. Daha fazla bilgi için bkz. Microsoft Fabric'de makine öğrenmesi deneyleri.
Modeli: Makine öğrenmesi modeli, belirli desen türlerini tanımak için eğitilmiş bir dosyadır. Bir model eğitirsiniz ve bu veri kümesi üzerinde düşünmesi ve öğrenmesi için ona bir algoritma sağlarsınız. Daha fazla bilgi için bkz. Machine learning modeli.
Çalıştırma: Çalıştırma, model kodunun tek bir yürütülmesine karşılık gelir. MLflowizleme, denemeleri ve çalıştırmaları temel alır.
Doku Veri Ambarı
SQL analiz uç noktasını : Her Lakehouse'un, bir kullanıcının TDS üzerinden TSQL ile delta tablo verilerini sorgulamasına olanak tanıyan bir SQL analiz uç noktası vardır. Daha fazla bilgi için bkz. SQL analiz uç noktası.
doku veri ambarı : Doku Veri Ambarı geleneksel bir veri ambarı olarak çalışır ve kurumsal veri ambarından bekleyebileceğiniz tam işlem T-SQL özelliklerini destekler. Daha fazla bilgi için bakınız: Fabric Veri Ambarı.
Real-Time Zekası
Etkinleştirici: Etkinleştiricisi, verileriniz üzerinde uyarılar, tetikleyiciler ve eylemler oluşturmanıza olanak tanıyan kod içermeyen, düşük kodlu bir araçtır. Etkinleştirici, veri akışlarınızda uyarı oluşturmak için kullanılır. Daha fazla bilgi için bkz. Etkinleştirici.
Eventhouse: Eventhouses, özellikle gerçek zamanlı analiz ve keşif gerektiren senaryolarda büyük hacimli verileri işlemek ve analiz etmek için bir çözüm sağlar. Gerçek zamanlı veri akışlarını verimli bir şekilde işlemek için tasarlanmıştır ve bu sayede kuruluşlar verileri neredeyse gerçek zamanlı olarak alır, işler ve analiz eder. Tek bir çalışma alanı birden çok Eventhouse barındırabilir, bir olay evi birden çok KQL veritabanını barındırabilir ve her veritabanı birden çok tablo barındırabilir. Daha fazla bilgi için bkz. Eventhouse'a genel bakış.
Olay Akışı: Microsoft Fabric olay akışları özelliği, gerçek zamanlı olayları yakalamak, dönüştürmek ve kod içermeyen bir deneyime sahip hedeflere yönlendirmek için Doku platformunda merkezi bir yer sağlar. Olay akışı çeşitli akış veri kaynaklarından, alım hedeflerinden ve dönüştürme gerektiğinde bir olay işlemciden oluşur. Daha fazla bilgi için bkz. Microsoft Fabric olay akışları.
KQL Veritabanı: KQL Veritabanı verileri KQL sorgularını yürütebileceğiniz bir biçimde tutar. KQL veritabanları bir Eventhouse altındaki öğelerdir. Daha fazla bilgi için bkz. KQL veritabanı.
KQL Queryset: KQL Queryset, Veri Gezgini veritabanınızdaki veriler üzerinde sorgu çalıştırmak, sonuçları görüntülemek ve sorgu sonuçlarını işlemek için kullanılan öğedir. Sorgu kümesi veritabanlarını ve tabloları, sorguları ve sonuçları içerir. KQL Queryset, sorguları gelecekte kullanmak üzere kaydetmenize veya sorguları dışarı aktarmanıza ve başkalarıyla paylaşmanıza olanak tanır. Daha fazla bilgi için bkz. KQL Queryset Sorgu verileri
Real-Time hub
- Real-Time hub: Real-Time hub, kuruluşunuzun tamamında hareket halindeki tüm veriler için tek bir yerdir. Her bir Microsoft Fabric kiracı hesabı, otomatik olarak bir hub ile sağlanır. Daha fazla bilgi için bkz. Real-Time hub'a genel bakış.
OneLake
- Kısayol: Kısayol, OneLake'de diğer dosya depolama konumlarına işaret eden gömülü referanstır. Bunlar, doğrudan kopyalamak zorunda kalmadan mevcut verilere bağlanmak için bir yol sağlar. Daha fazla bilgi için bkz. OneLake kısayolları.