Aracılığıyla paylaş


Azure Synapse Analytics terminolojisi

Bu makale, Azure Synapse Analytics'in temel kavramlarında size yol gösterir.

Synapse çalışma alanı

Synapse çalışma alanı, Azure'da bulut tabanlı kurumsal analiz gerçekleştirmeye yönelik güvenli bir işbirliği sınırıdır. Çalışma alanı belirli bir bölgeye dağıtılır ve geçici verileri depolamak için ilişkili bir Azure Data Lake Storage 2. Nesil hesabı ve dosya sistemine sahiptir. Çalışma alanı bir kaynak grubunun altındadır.

Çalışma alanı, SQL ve Apache spark ile analiz gerçekleştirmenizi sağlar. SQL ve Spark analizi için kullanılabilir kaynaklar SQL ve Spark havuzlarında düzenlenir.

Bağlı hizmetler

Çalışma alanı, çalışma alanının dış kaynaklara bağlanması için gereken bilgileri tanımlayan bağlantı dizesi herhangi bir sayıda bağlı hizmet içerebilir.

Synapse SQL

Synapse SQL , Synapse çalışma alanında Transact-SQL (T-SQL) tabanlı analiz gerçekleştirmenizi sağlar. Synapse SQL iki tüketim modeline sahiptir: ayrılmış ve sunucusuz. Ayrılmış model için ayrılmış SQL havuzlarını kullanın. Bir çalışma alanında bu havuzların herhangi bir sayısı bulunabilir. Sunucusuz modeli kullanmak için sunucusuz SQL havuzlarını kullanın. Her çalışma alanında bu havuzlardan biri bulunur.

Synapse Studio'da SQL betiklerini çalıştırarak SQL havuzlarıyla çalışabilirsiniz.

Not

Azure Synapse'teki ayrılmış SQL havuzu, ayrılmış SQL havuzundan (eski adıYLA SQL DW) farklıdır. Azure Synapse çalışma alanlarındaki ayrılmış SQL havuzunun tüm özellikleri ayrılmış SQL havuzuna (eski adı SQL DW) uygulanmaz ve tam tersi de geçerlidir. Var olan bir ayrılmış SQL havuzu (eski adı SQL DW) için çalışma alanı özelliklerini etkinleştirmek için bkz . Ayrılmış SQL havuzu (eski adı SQL DW) için çalışma alanı özelliklerini etkinleştirme.

Synapse için Apache Spark

Spark analizini kullanmak için Synapse çalışma alanınızda sunucusuz Apache Spark havuzları oluşturun ve kullanın. Spark havuzu kullanmaya başladığınızda, çalışma alanları bu oturumla ilişkili kaynakları işlemek için bir Spark oturumu oluşturur.

Synapse içinde Spark'ı kullanmanın iki yolu vardır:

  • Scala, PySpark, C# ve SparkSQL kullanarak veri bilimi ve mühendisliği için Spark Not Defterleri
  • Jar dosyalarını kullanarak toplu Spark işlerini çalıştırmak için Spark iş tanımları

SynapseML

SynapseML (eski adıyla MMLSpark), yüksek düzeyde ölçeklenebilir makine öğrenmesi (ML) işlem hatlarının oluşturulmasını basitleştiren açık kaynak bir kitaplıktır. Apache Spark çerçevesini birkaç yeni yönde genişletmek için kullanılan bir araç ekosistemidir. SynapseML, mevcut çeşitli makine öğrenmesi çerçevelerini ve yeni Microsoft algoritmalarını Python, R, Scala, .NET ve Java'da kullanılabilen tek ve ölçeklenebilir bir API'de birleştirir. Daha fazla bilgi edinmek için bkz. SynapseML nedir?

Pipelines

İşlem hatları, Azure Synapse'in hizmetler arasında veri taşımanıza ve etkinlikleri düzenlemenize olanak sağlayan veri tümleştirmesi yöntemidir.

  • İşlem hatları , bir görevi birlikte gerçekleştiren etkinliklerin mantıksal bir gruplandırmasıdır.
  • Etkinlikler , işlem hattı içinde verileri kopyalama veya Not Defteri veya SQL betiği çalıştırma gibi veriler üzerinde gerçekleştirilecek eylemleri tanımlar.
  • Veri akışları , Synapse Spark'ı arka planda kullanan veri dönüştürmesi için kod içermeyen bir deneyim sağlayan belirli bir etkinlik biçimidir.
  • Tetikleyici bir işlem hattı yürütür. El ile veya otomatik olarak çalıştırılabilir (zamanlama, atlayan pencere veya olay tabanlı).
  • Tümleştirme veri kümesi , bir etkinlikte giriş ve çıkış olarak kullanılacak verileri işaret eden veya bunlara başvuran adlandırılmış bir veri görünümüdür. Bağlı bir hizmete aittir.

Veri Gezgini (Önizleme)

Azure Synapse Veri Gezgini, müşterilere günlük ve telemetri verilerinden içgörüler elde etmek için etkileşimli bir sorgu deneyimi sunar.

  • Veri Gezgini havuzları, iyileştirilmiş sorgu performansı için yerel SSD depolama (sık erişimli önbellek) ve kalıcılık için birden çok depolama blobu (soğuk önbellek) içeren iki veya daha fazla işlem düğümü içeren ayrılmış kümelerdir.
  • Veri Gezgini veritabanları Veri Gezgini havuzlarda barındırılır ve tablo koleksiyonlarından ve diğer veritabanı nesnelerinden oluşan mantıksal varlıklardır. Havuz başına birden fazla veritabanınız olabilir.
  • Tablolar , geleneksel ilişkisel veri modeli kullanılarak düzenlenmiş veriler içeren veritabanı nesneleridir. Veriler, Veri Gezgini'nin sıralı sütun listesini tanımlayan iyi tanımlanmış tablo şemasına uygun kayıtlarda depolanır ve her sütun bir ada ve skaler veri türüne sahip olur. Skaler veri türleri yapılandırılabilir (int, gerçek, tarih saat veya zaman aralığı), yarı yapılandırılmış (dinamik) veya serbest metin (dize). Dinamik tür, tek bir skaler değer, dizi veya bu tür değerlerin sözlüğünü tutabildiği için JSON'a benzer.
  • Dış tablolar, Veri Gezgini veritabanının dışındaki bir depolama alanına veya SQL veri kaynağına başvuran tablolardır. Tablolara benzer şekilde, dış tablonun iyi tanımlanmış bir şeması vardır (sütun adı ve veri türü çiftlerinin sıralı listesi). Verilerin Veri Gezgini havuzlarına alındığı Veri Gezgini tablolarının aksine dış tablolar, depolanan ve yönetilen dış havuzlar üzerinde çalışır. Dış tablolar hiçbir veriyi kalıcı hale getirir ve verileri sorgulamak veya dış veri deposuna aktarmak için kullanılır.