Dış sistemleri kullanarak Databricks verilerine erişme
Bu makalede, Azure Databricks tarafından yönetilen ve yönetilen verilerin diğer sistemlerin kullanımına sunulmasına yönelik işlevlere ve önerilere genel bir bakış sağlanmaktadır.
Bu desenler, kuruluşunuzun güvenilir araçları veya sistemleri Azure Databricks verileriyle tümleştirmesi gereken senaryolara odaklanır. Kuruluşunuzun dışında veri paylaşma konusunda rehberlik arıyorsanız bkz. Verileri ve yapay zeka varlıklarını diğer kuruluşlardaki kullanıcılarla güvenli bir şekilde paylaşma.
Azure Databricks hangi dış erişimi destekler?
Azure Databricks, tüm veri varlıklarınızı yönetmek için Unity Kataloğu'nu kullanmanızı önerir.
Aşağıdaki tabloda Unity Kataloğu nesneleri için destek biçimlerine ve erişim desenlerine genel bir bakış sağlanmaktadır.
Unity Kataloğu nesnesi | Desteklenen biçimler | Erişim desenleri |
---|---|---|
Yönetilen tablolar | Delta Gölü, Buzdağı | Kimlik bilgisi otomatı, Iceberg REST kataloğu, Delta Sharing |
Dış tablolar | Delta Gölü | Kimlik bilgileri satışı, Iceberg REST kataloğu, Delta Paylaşımı, bulut URI'leri |
Dış tablolar | CSV, JSON, Avro, Parquet, ORC, metin | Bulut URI'leri |
Harici birimler | Tüm veri türleri | Bulut URI'leri |
Not
Iceberg desteği, Azure Databricks tarafından Delta Lake kullanılarak yazılmış ancak Iceberg okumaları (UniForm) etkinleştirilmiş tabloları açıklar.
Bu Unity Kataloğu nesneleri hakkında daha fazla ayrıntı için aşağıdakilere bakın:
Birlik Kataloğu kimlik bilgisi dağıtımı
Unity Kataloğu kimlik bilgisi bağlaması, kullanıcıların Dış istemcileri Azure Databricks tarafından yönetilen verilerdeki ayrıcalıkları devralacak şekilde yapılandırmalarına olanak tanır. Bkz.dış sistem erişimi için Unity Kataloğu kimlik bilgileri
Iceberg istemcileri ile tabloları okuma
Azure Databricks, Iceberg istemcilerine Unity Kataloğu'na kayıtlı tablolar için salt okunur destek sağlar. Desteklenen istemciler Apache Spark, Apache Flink, Trino ve Snowflake'tir. Bkz. Iceberg istemcilerinden Databricks tablolarını okuma.
Etki alanları arasında salt okunur tabloları paylaşma
Etki alanları ve desteklenen sistemler arasında yönetilen veya dış Delta tablolarına salt okunur erişim vermek için Delta Paylaşımı'nı kullanabilirsiniz. Delta Sharing tablolarının sıfır kopya okumasını destekleyen yazılım sistemleri SAP, Amperity ve Oracle'dır. bkz. Verileri ve yapay zeka varlıklarını diğer kuruluşlardaki kullanıcılarla güvenli bir şekilde paylaşma.
Not
Delta Sharing'i, müşterilere veya iş ortaklarına salt okunur erişim vermek için de kullanabilirsiniz. Delta Sharing, Databricks Marketplacekullanılarak paylaşılan verileri de destekler.
Dış Delta tablolarını okuma ve yazma
Delta Lake tarafından desteklenen Unity Kataloğu dış tablolarına bulut nesne depolama URI'lerini ve kimlik bilgilerini kullanarak dış Delta Lake okuyucu ve yazıcı istemcilerinden erişebilirsiniz.
Unity Kataloğu, dış sistemlerden doğrudan bulut nesne depolaması için gerçekleştirilen okuma ve yazma işlemlerine tabi değildir. Bu nedenle, veri idaresi ilkelerinin Azure Databricks dışından karşılandığından emin olmak için bulut hesabınızda ek ilkeler ve kimlik bilgileri yapılandırmanız gerekir.
Not
Azure Databricks belgelerinde Databricks Runtime sürümlerine ve platform özelliklerine dayalı sınırlamalar ve uyumluluk konuları listelenmektedir. İstemcinizin hangi okuyucu ve yazıcı protokollerini ve tablo özelliklerini desteklediğini onaylamanız gerekir. Bkz. delta.io.
Delta Lake dışındaki tablo verilerine dış tablolarla erişin
Unity Kataloğu dış tabloları Parquet, ORC, CSV ve JSON gibi Delta Lake dışında birçok biçimi destekler. Dış tablolar, dizinlerdeki tüm veri dosyalarını, tablo oluşturma sırasında sağlanan bir bulut URI'si tarafından belirtilen bir bulut nesnesi depolama konumunda depolar. Diğer sistemler bu veri dosyalarına doğrudan bulut nesne depolama alanından erişer.
Unity Kataloğu, dış sistemlerden doğrudan bulut nesne depolaması için gerçekleştirilen okuma ve yazma işlemlerine tabi değildir. Bu nedenle, veri idaresi ilkelerinin Azure Databricks dışından karşılandığından emin olmak için bulut hesabınızda ek ilkeler ve kimlik bilgileri yapılandırmanız gerekir.
Delta Lake dışındaki biçimler için işlem garantisi sağlanmadığı için birden çok sistemden dış tabloların okunması ve bu tablolara yazması tutarlılık sorunlarına ve veri bozulmasına neden olabilir.
Unity Kataloğu, Delta Lake dışındaki biçimlerle desteklenen dış tablolara yazılan yeni bölümleri alamayabilir. Databricks, Unity Kataloğu'nun dış sistemler tarafından yazılan tüm veri dosyalarını kaydettiğini güvence altına almak için düzenli olarak MSCK REPAIR TABLE table_name
çalıştırmanızı önerir.
Dış birimlerle tablo dışı verilere erişme
Databricks, Azure Databricks'e ek olarak dış sistemler tarafından okunan veya yazılan tablosal olmayan veri dosyalarını depolamak için dış birimlerin kullanılmasını önerir. Bkz. Unity Kataloğu birimleri nelerdir?.
Unity Kataloğu, dış sistemlerden doğrudan bulut nesne depolaması için gerçekleştirilen okuma ve yazma işlemlerine tabi değildir. Bu nedenle, veri idaresi ilkelerinin Azure Databricks dışından karşılandığından emin olmak için bulut hesabınızda ek ilkeler ve kimlik bilgileri yapılandırmanız gerekir.
Birimler, dosyaları birimlerden almak ve birimlere yerleştirmek için API'ler, SDK'lar ve diğer araçlar sağlar. bkz. birimlerdeki dosyaları yönetme.
Not
Delta Sharing, birimleri diğer Azure Databricks hesaplarıyla paylaşmanıza olanak tanır, ancak dış sistemlerle tümleştirilmez.