Öğretici: Doku Veri Ambarı için dbt ayarlama
Şunlar için geçerlidir:✅ Microsoft Fabric'te Ambar
Bu öğretici, dbt'yi ayarlama ve ilk projenizi Doku Ambarı'na dağıtma konusunda size yol gösterir.
Giriş
dbt (Veri Derleme Aracı) açık kaynak çerçevesi, veri dönüştürme ve analiz mühendisliğini basitleştirir. Analiz katmanındaki SQL tabanlı dönüşümlere odaklanarak SQL'i kod olarak ele alır. dbt sürüm denetimini, modülerleştirmeyi, testi ve belgeleri destekler.
Microsoft Fabric için dbt bağdaştırıcısı, daha sonra doku Veri Ambarı'na dağıtılabilir dbt projeleri oluşturmak için kullanılabilir.
Örneğin, yalnızca bağdaştırıcıyı değiştirerek dbt projesinin hedef platformunu da değiştirebilirsiniz; Azure Synapse ayrılmış SQL havuzu için oluşturulmuş bir proje birkaç saniye içinde Doku Veri Ambarı'na yükseltilebilir.
Microsoft Fabric için dbt bağdaştırıcısının önkoşulları
dbt önkoşullarını yüklemek ve ayarlamak için bu listeyi izleyin:
SQL Server için Microsoft ODBC Sürücüsü.
kullanarak PyPI (Python Paket Dizini) deposundan
pip install dbt-fabric
en son sürümü.pip install dbt-fabric
Not
olarak değiştirerek
pip install dbt-fabric
pip install dbt-synapse
ve aşağıdaki yönergeleri kullanarak Synapse ayrılmış SQL havuzu için dbt bağdaştırıcısını yükleyebilirsiniz.komutunu kullanarak
pip list
dbt-fabric ve bağımlılıklarının yüklendiğinden emin olun:pip list
Paketlerin ve geçerli sürümlerin uzun bir listesi bu komuttan döndürülmelidir.
Henüz yoksa bir Ambar oluşturun. Bu alıştırma için deneme kapasitesini kullanabilirsiniz: Microsoft Fabric ücretsiz deneme sürümüne kaydolun, bir çalışma alanı oluşturun ve ardından bir ambar oluşturun.
dbt-fabric bağdaştırıcısını kullanmaya başlama
Bu öğreticide Visual Studio Code kullanılır, ancak tercih ettiğiniz aracı kullanabilirsiniz.
jaffle_shop demo dbt projesini makinenize kopyalayın.
- Visual Studio Code'un yerleşik kaynak denetimiyle depoyu kopyalayabilirsiniz.
- Örneğin, komutunu kullanabilirsiniz
git clone
:
git clone https://github.com/dbt-labs/jaffle_shop.git
jaffle_shop
Visual Studio Code'da proje klasörünü açın.Zaten bir Ambar oluşturduysanız, kaydolmayı atlayabilirsiniz.
Bir
profiles.yml
dosyası oluşturun. aşağıdaki yapılandırmayı öğesineprofiles.yml
ekleyin. Bu dosya, dbt-fabric bağdaştırıcısını kullanarak Microsoft Fabric'teki ambarınıza bağlantıyı yapılandırıyor.config: partial_parse: true jaffle_shop: target: fabric-dev outputs: fabric-dev: authentication: CLI database: <put the database name here> driver: ODBC Driver 18 for SQL Server host: <enter your SQL analytics endpoint here> schema: dbo threads: 4 type: fabric
Not
type
fabric
synapse
İsterseniz veritabanı bağdaştırıcısını Azure Synapse Analytics'e değiştirmek için öğesini olarak değiştirin. Veritabanı bağdaştırıcısı değiştirilerek mevcut dbt projelerinin veri platformları güncelleştirilebilir. Daha fazla bilgi için desteklenen veri platformlarının dbt listesine bakın.Visual Studio Code terminalinde Azure'da kimliğinizi doğrulayın.
- Azure CLI kimlik doğrulaması kullanıyorsanız Visual Studio Code terminalinde komutunu çalıştırın
az login
. - Microsoft Fabric'teki Hizmet Sorumlusu veya diğer Microsoft Entra Kimliği (eski adıYla Azure Active Directory) kimlik doğrulaması için dbt (Veri Derleme Aracı) kurulumu ve dbt Kaynak Yapılandırmaları'na bakın. Daha fazla bilgi için bkz . Microsoft Fabric'te SQL kimlik doğrulamasına alternatif olarak Microsoft Entra kimlik doğrulaması.
- Azure CLI kimlik doğrulaması kullanıyorsanız Visual Studio Code terminalinde komutunu çalıştırın
Artık bağlantıyı test etmeye hazırsınız. Ambarınıza bağlantıyı test etmek için Visual Studio Code terminalinde komutunu çalıştırın
dbt debug
.dbt debug
Tüm denetimler geçirilir, yani dbt projesinden
jaffle_shop
dbt-fabric bağdaştırıcısını kullanarak ambarınızı bağlayabilirsiniz.Şimdi bağdaştırıcının çalışıp çalışmadığını test etme zamanı geldi. İlk olarak ambara örnek veri eklemek için komutunu çalıştırın
dbt seed
.Bazı testlerde verileri doğrulamak için komutunu çalıştırın
dbt run
.dbt run
demo dbt projesinde tanımlanan modelleri çalıştırmak için komutunu çalıştırın
dbt test
.dbt test
Şimdi Doku Veri Ambarı'na bir dbt projesi dağıttınız.
Farklı ambarlar arasında hareket etme
Dbt projesini farklı ambarlar arasında taşımak kolaydır. Desteklenen herhangi bir ambardaki dbt projesi bu üç adımlı işlemle hızla geçirilebilir:
Yeni bağdaştırıcıyı yükleyin. Daha fazla bilgi ve tam yükleme yönergeleri için bkz . dbt bağdaştırıcıları.
dosyasındaki
type
özelliğini güncelleştirinprofiles.yml
.Projeyi derleyin.
Doku Data Factory'de dbt
Popüler bir iş akışı yönetim sistemi olan Apache Airflow ile tümleştirildiğinde dbt, veri dönüşümlerini düzenlemeye yönelik güçlü bir araç haline gelir. Airflow'un zamanlama ve görev yönetimi özellikleri, veri ekiplerinin dbt çalıştırmalarını otomatikleştirmesine olanak tanır. Düzenli veri güncelleştirmeleri sağlar ve analiz ve raporlama için tutarlı bir yüksek kaliteli veri akışı sağlar. Airflow'un iş akışı yönetimiyle dbt'nin dönüşüm uzmanlığını kullanan bu birleşik yaklaşım verimli ve sağlam veri işlem hatları sunar ve sonuç olarak daha hızlı ve daha içgörülü veri odaklı kararlar alınmasına yol açar.
Apache Airflow , karmaşık veri iş akışlarını program aracılığıyla oluşturmak, zamanlamak ve izlemek için kullanılan açık kaynak bir platformdur. Veri işlem hatlarını temsil etmek için yönlendirilmiş döngüsel grafikler (DAG)'ler halinde birleştirilebilen işleçler olarak adlandırılan bir görev kümesi tanımlamanıza olanak tanır.
Dbt'yi ambarınızla kullanıma hazır hale getirmek için bkz . Microsoft Fabric'te Data Factory ile dbt kullanarak verileri dönüştürme.
Dikkat edilmesi gereken noktalar
dbt-fabric bağdaştırıcısı kullanılırken dikkate alınması gereken önemli şeyler:
Microsoft Fabric veri ambarı ile ilgili geçerli sınırlamaları gözden geçirin.
Doku, kullanıcı sorumluları, kullanıcı kimlikleri ve hizmet sorumluları için Microsoft Entra Id (eski adıYla Azure Active Directory) kimlik doğrulamasını destekler. Ambar üzerinde etkileşimli olarak çalışmak için önerilen kimlik doğrulama modu CLI'dir (komut satırı arabirimleri) ve otomasyon için hizmet sorumlularını kullanır.
Doku Veri Ambarı'nda desteklenmeyen T-SQL (Transact-SQL) komutlarını gözden geçirin.
Bazı T-SQL komutları dbt-fabric bağdaştırıcısı tarafından (CTAS), ve , gibi
Create Table as Select
DROP
CREATE
ALTER TABLE ADD/ALTER/DROP COLUMN
komutlar kullanılarakMERGE
desteklenir.TRUNCATE
sp_rename
Desteklenen ve desteklenmeyen veri türleri hakkında bilgi edinmek için Desteklenmeyen veri türlerini gözden geçirin.
Sorunlar · microsoft/dbt-fabric · adresini ziyaret ederek GitHub'da dbt-fabric bağdaştırıcısında sorunları günlüğe kaydedebilirsiniz GitHub.