Azure Data Factory veya Synapse Analytics kullanarak Azure AI Search dizinine veri kopyalama
UYGULANANLAR: Azure Data Factory
Azure Synapse Analytics
İpucu
Kuruluşlar için hepsi bir arada analiz çözümü olan Microsoft Fabric'te Data Factory'yi deneyin. Microsoft Fabric , veri taşımadan veri bilimine, gerçek zamanlı analize, iş zekasına ve raporlamaya kadar her şeyi kapsar. Yeni bir deneme sürümünü ücretsiz olarak başlatmayı öğrenin!
Bu makalede verileri Azure AI Search dizinine kopyalamak için Azure Data Factory veya Synapse Analytics işlem hattında Kopyalama Etkinliğinin nasıl kullanılacağı özetlenmiştir. Kopyalama etkinliğine genel bir genel bakış sunan kopyalama etkinliğine genel bakış makalesini oluşturur.
Desteklenen özellikler
Bu Azure AI Search bağlayıcısı aşağıdaki özellikler için desteklenir:
Desteklenen özellikler | IR | Yönetilen özel uç nokta |
---|---|---|
Kopyalama etkinliği (-/sink) | (1) (2) | ✓ |
(1) Azure tümleştirme çalışma zamanı (2) Şirket içinde barındırılan tümleştirme çalışma zamanı
Desteklenen herhangi bir kaynak veri deposundaki verileri arama dizinine kopyalayabilirsiniz. Kopyalama etkinliği tarafından kaynak/havuz olarak desteklenen veri depolarının listesi için Desteklenen veri depoları tablosuna bakın.
Başlarken
İşlem hattıyla Kopyalama etkinliği gerçekleştirmek için aşağıdaki araçlardan veya SDK'lardan birini kullanabilirsiniz:
- Veri Kopyalama aracı
- Azure portal
- .NET SDK'sı
- Python SDK'sı
- Azure PowerShell
- The REST API
- Azure Resource Manager şablonu
Kullanıcı arabirimini kullanarak Azure Search'e bağlı hizmet oluşturma
Azure portalı kullanıcı arabiriminde Azure Search'e bağlı bir hizmet oluşturmak için aşağıdaki adımları kullanın.
Azure Data Factory veya Synapse çalışma alanınızda Yönet sekmesine göz atın ve Bağlı Hizmetler'i seçin, ardından Yeni'ye tıklayın:
Ara'yı arayın ve Azure Search bağlayıcısını seçin.
Hizmet ayrıntılarını yapılandırın, bağlantıyı test edin ve yeni bağlı hizmeti oluşturun.
Bağlayıcı yapılandırma ayrıntıları
Aşağıdaki bölümlerde, Azure AI Search bağlayıcısına özgü Data Factory varlıklarını tanımlamak için kullanılan özelliklerle ilgili ayrıntılar sağlanır.
Bağlı hizmet özellikleri
Azure AI Search bağlı hizmeti için aşağıdaki özellikler desteklenir:
Özellik | Açıklama | Gerekli |
---|---|---|
Tür | Tür özelliği şu şekilde ayarlanmalıdır: AzureSearch | Yes |
url | Arama hizmetinin URL'si. | Yes |
anahtar | Arama hizmeti için yönetici anahtarı. Güvenli bir şekilde depolamak için bu alanı SecureString olarak işaretleyin veya Azure Key Vault'ta depolanan bir gizli diziye başvurun. | Yes |
connectVia | Veri deposuna bağlanmak için kullanılacak Integration Runtime. Azure Integration Runtime veya Şirket İçinde Barındırılan Tümleştirme Çalışma Zamanı'nı (veri deponuz özel ağda bulunuyorsa) kullanabilirsiniz. Belirtilmezse, varsayılan Azure Integration Runtime'ı kullanır. | Hayır |
Önemli
Bir bulut veri deposundaki verileri arama dizinine kopyalarken, Azure AI Search bağlı hizmetinde connectVia'da açık bölge içeren bir Azure Integration Runtime'a başvurmanız gerekir. Bölgeyi arama hizmetinizin bulunduğu bölge olarak ayarlayın. Azure Integration Runtime'dan daha fazla bilgi edinin.
Örnek:
{
"name": "AzureSearchLinkedService",
"properties": {
"type": "AzureSearch",
"typeProperties": {
"url": "https://<service>.search.windows.net",
"key": {
"type": "SecureString",
"value": "<AdminKey>"
}
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
Veri kümesi özellikleri
Veri kümelerini tanımlamak için kullanılabilen bölümlerin ve özelliklerin tam listesi için veri kümeleri makalesine bakın. Bu bölümde, Azure AI Search veri kümesi tarafından desteklenen özelliklerin listesi sağlanır.
Azure AI Search'e veri kopyalamak için aşağıdaki özellikler desteklenir:
Özellik | Açıklama | Gerekli |
---|---|---|
Tür | Veri kümesinin tür özelliği şu şekilde ayarlanmalıdır: AzureSearchIndex | Yes |
indexName | Arama dizininin adı. Hizmet dizini oluşturmaz. Dizin, Azure AI Search'te mevcut olmalıdır. | Yes |
Örnek:
{
"name": "AzureSearchIndexDataset",
"properties": {
"type": "AzureSearchIndex",
"typeProperties" : {
"indexName": "products"
},
"schema": [],
"linkedServiceName": {
"referenceName": "<Azure AI Search linked service name>",
"type": "LinkedServiceReference"
}
}
}
Kopyalama etkinliğinin özellikleri
Etkinlikleri tanımlamak için kullanılabilen bölümlerin ve özelliklerin tam listesi için İşlem hatları makalesine bakın. Bu bölümde, Azure AI Arama kaynağı tarafından desteklenen özelliklerin listesi sağlanır.
Havuz olarak Azure AI Search
Azure AI Search'e veri kopyalamak için kopyalama etkinliğindeki kaynak türünü AzureSearchIndexSink olarak ayarlayın. Kopyalama etkinliği havuzu bölümünde aşağıdaki özellikler desteklenir:
Özellik | Açıklama | Gerekli |
---|---|---|
Tür | Kopyalama etkinliği kaynağının type özelliği şu şekilde ayarlanmalıdır: AzureSearchIndexSink | Yes |
writeBehavior | Dizinde bir belge zaten mevcut olduğunda birleştirilip birleştirilmeyeceğini veya değiştirilmeyeceğini belirtir.
Bkz. WriteBehavior özelliği. İzin verilen değerler şunlardır: Birleştir (varsayılan) ve Karşıya Yükle. |
Hayır |
writeBatchSize | Arabellek boyutu writeBatchSize değerine ulaştığında verileri arama dizinine yükler.
Ayrıntılar için Bkz. WriteBatchSize özelliği. İzin verilen değerler şunlardır: 1 - 1.000 tamsayı; varsayılan değer 1000'dir. |
Hayır |
maxConcurrentConnections | Etkinlik çalıştırması sırasında veri deposuna kurulan eş zamanlı bağlantıların üst sınırı. Yalnızca eşzamanlı bağlantıları sınırlamak istediğinizde bir değer belirtin. | Hayır |
WriteBehavior özelliği
Veri yazarken AzureSearchSink upserts. Başka bir deyişle, belge yazarken, belge anahtarı arama dizininde zaten varsa, Azure AI Search çakışma özel durumu oluşturmak yerine var olan belgeyi güncelleştirir.
AzureSearchSink aşağıdaki iki upsert davranışı sağlar (AzureSearch SDK'sını kullanarak):
- Birleştir: Yeni belgedeki tüm sütunları mevcut sütunla birleştirin. Yeni belgedeki null değere sahip sütunlar için, var olandaki değer korunur.
- Karşıya yükleme: Yeni belge var olan belgenin yerini alır. Yeni belgede belirtilmeyen sütunlar için, var olan belgede null olmayan bir değer olsa da olmasa da değer null olarak ayarlanır.
Varsayılan davranış Birleştir'dir.
WriteBatchSize Özelliği
Azure AI Arama hizmeti, belgeleri toplu olarak yazmayı destekler. Toplu işlem 1 ile 1.000 Eylem içerebilir. Eylem, karşıya yükleme/birleştirme işlemini gerçekleştirmek için bir belgeyi işler.
Örnek:
"activities":[
{
"name": "CopyToAzureSearch",
"type": "Copy",
"inputs": [
{
"referenceName": "<input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<Azure AI Search output dataset name>",
"type": "DatasetReference"
}
],
"typeProperties": {
"source": {
"type": "<source type>"
},
"sink": {
"type": "AzureSearchIndexSink",
"writeBehavior": "Merge"
}
}
}
]
Veri türü desteği
Aşağıdaki tabloda Azure AI Search veri türünün desteklenip desteklenmediği belirtiliyor.
Azure AI Search veri türü | Azure AI Arama Havuzu'nda desteklenir |
---|---|
String | Y |
Int32 | Y |
Int64 | Y |
Çift | Y |
Boolean | Y |
DataTimeOffset | Y |
Dize Dizisi | N |
GeographyPoint | N |
Şu anda diğer veri türleri (örneğin, ComplexType) desteklenmez. Azure AI Search tarafından desteklenen veri türlerinin tam listesi için bkz . Desteklenen veri türleri (Azure AI Search).
İlgili içerik
Kopyalama etkinliği tarafından kaynak ve havuz olarak desteklenen veri depolarının listesi için bkz . desteklenen veri depoları.