Adatok másolása a Google BigQuery V2-ből az Azure Data Factory vagy a Synapse Analytics használatával
A következőkre vonatkozik: Azure Data Factory
Azure Synapse Analytics
Tipp.
Próbálja ki a Data Factoryt a Microsoft Fabricben, amely egy teljes körű elemzési megoldás a nagyvállalatok számára. A Microsoft Fabric az adattovábbítástól az adatelemzésig, a valós idejű elemzésig, az üzleti intelligenciáig és a jelentéskészítésig mindent lefed. Ismerje meg, hogyan indíthat új próbaverziót ingyenesen!
Ez a cikk bemutatja, hogyan használható a Másolási tevékenység az Azure Data Factoryben és a Synapse Analytics-folyamatokban adatok másolására a Google BigQueryből. A másolási tevékenység áttekintési cikkére épül, amely általános áttekintést nyújt a másolási tevékenységről.
Fontos
A Google BigQuery V2-összekötő továbbfejlesztett natív Google BigQuery-támogatást biztosít. Ha a Megoldásban a Google BigQuery V1-összekötőt használja, frissítse a Google BigQuery-összekötőt, mivel a V1 a támogatás végén van. A V2 és az 1. V közötti különbségről ebben a szakaszban olvashat.
Támogatott képességek
Ez a Google BigQuery-összekötő a következő képességeket támogatja:
Támogatott képességek | IR |
---|---|
Copy tevékenység (forrás/-) | (1) (2) |
Keresési tevékenység | (1) (2) |
(1) Azure-integrációs modul (2) Saját üzemeltetésű integrációs modul
A másolási tevékenység által forrásként vagy fogadóként támogatott adattárak listáját a Támogatott adattárak táblában találja.
A szolgáltatás egy beépített illesztőprogramot biztosít a kapcsolat engedélyezéséhez. Ezért nem kell manuálisan telepítenie egy illesztőprogramot az összekötő használatához.
Feljegyzés
Ez a Google BigQuery-összekötő a BigQuery API-kra épül. Vegye figyelembe, hogy a BigQuery korlátozza a bejövő kérelmek maximális sebességét, és projektenkénti alapon kényszeríti ki a megfelelő kvótákat, tekintse meg a Kvóták > Korlátok – API-kérelmeket. Győződjön meg arról, hogy nem indít túl sok egyidejű kérést a fiókhoz.
Első lépések
A Copy tevékenység folyamattal való végrehajtásához használja az alábbi eszközök vagy SDK-k egyikét:
- Az Adatok másolása eszköz
- Az Azure Portal
- A .NET SDK
- A Python SDK
- Azure PowerShell
- A REST API
- Az Azure Resource Manager-sablon
Társított szolgáltatás létrehozása a Google BigQueryhez felhasználói felülettel
Az alábbi lépésekkel létrehozhat egy társított szolgáltatást a Google BigQueryhez az Azure Portal felhasználói felületén.
Keresse meg az Azure Data Factory vagy a Synapse-munkaterület Kezelés lapját, és válassza a Társított szolgáltatások lehetőséget, majd kattintson az Új gombra:
Keresse meg a Google BigQueryt, és válassza ki az összekötőt.
Konfigurálja a szolgáltatás részleteit, tesztelje a kapcsolatot, és hozza létre az új társított szolgáltatást.
Az összekötő konfigurációjának részletei
Az alábbi szakaszok a Google BigQuery-összekötőre jellemző entitások meghatározásához használt tulajdonságok részleteit ismertetik.
Társított szolgáltatás tulajdonságai
A Google BigQuery társított szolgáltatása az alábbi tulajdonságokat támogatja.
Tulajdonság | Leírás | Kötelező |
---|---|---|
típus | A típustulajdonságot GoogleBigQueryV2 értékre kell állítani. | Igen |
projectId | Az alapértelmezett BigQuery-projekt projektazonosítója, amely alapján lekérdezhetők. | Igen |
authenticationType | A hitelesítéshez használt OAuth 2.0 hitelesítési mechanizmus. Az engedélyezett értékek a UserAuthentication és a ServiceAuthentication. A táblázat alatti szakaszokban további tulajdonságokat és JSON-mintákat talál ezekhez a hitelesítési típusokhoz. |
Igen |
Felhasználói hitelesítés használata
Állítsa a "authenticationType" tulajdonságot UserAuthentication értékre, és adja meg a következő tulajdonságokat az előző szakaszban ismertetett általános tulajdonságokkal együtt:
Tulajdonság | Leírás | Kötelező |
---|---|---|
clientId | A frissítési jogkivonat létrehozásához használt alkalmazás azonosítója. | Igen |
clientSecret | A frissítési jogkivonat létrehozásához használt alkalmazás titkos kódja. Jelölje meg ezt a mezőt SecureStringként, hogy biztonságosan tárolja, vagy hivatkozzon az Azure Key Vaultban tárolt titkos kódra. | Igen |
refreshToken | A Google-tól beszerzett frissítési jogkivonat a BigQueryhez való hozzáférés engedélyezésére szolgál. Ebből a közösségi blogból megtudhatja, hogyan szerezhet be egyet az OAuth 2.0 hozzáférési jogkivonatok beszerzéséből. Jelölje meg ezt a mezőt SecureStringként, hogy biztonságosan tárolja, vagy hivatkozzon az Azure Key Vaultban tárolt titkos kódra. | Igen |
Példa:
{
"name": "GoogleBigQueryLinkedService",
"properties": {
"type": "GoogleBigQueryV2",
"typeProperties": {
"projectId" : "<project ID>",
"authenticationType" : "UserAuthentication",
"clientId": "<client ID>",
"clientSecret": {
"type": "SecureString",
"value":"<client secret>"
},
"refreshToken": {
"type": "SecureString",
"value": "<refresh token>"
}
}
}
}
Szolgáltatáshitelesítés használata
Állítsa a "authenticationType" tulajdonságot ServiceAuthentication értékre, és adja meg a következő tulajdonságokat az előző szakaszban ismertetett általános tulajdonságokkal együtt.
Tulajdonság | Leírás | Kötelező |
---|---|---|
keyFileContent | A szolgáltatásfiók hitelesítéséhez használt JSON formátumú kulcsfájl. Jelölje meg ezt a mezőt SecureStringként, hogy biztonságosan tárolja, vagy hivatkozzon az Azure Key Vaultban tárolt titkos kódra. | Igen |
Példa:
{
"name": "GoogleBigQueryLinkedService",
"properties": {
"type": "GoogleBigQueryV2",
"typeProperties": {
"projectId": "<project ID>",
"authenticationType": "ServiceAuthentication",
"keyFileContent": {
"type": "SecureString",
"value": "<key file JSON string>"
}
}
}
}
Adathalmaz tulajdonságai
Az adathalmazok meghatározásához elérhető szakaszok és tulajdonságok teljes listáját az Adathalmazok című cikkben találja. Ez a szakasz a Google BigQuery adatkészlet által támogatott tulajdonságok listáját tartalmazza.
Ha adatokat szeretne másolni a Google BigQueryből, állítsa az adathalmaz típustulajdonságát a GoogleBigQueryV2Object értékre. A következő tulajdonságok támogatottak:
Tulajdonság | Leírás | Kötelező |
---|---|---|
típus | Az adathalmaz típustulajdonságának a következőnek kell lennie: GoogleBigQueryV2Object | Igen |
adathalmaz | A Google BigQuery-adatkészlet neve. | Nem (ha "lekérdezés" van megadva a tevékenységforrásban) |
table | A tábla neve. | Nem (ha "lekérdezés" van megadva a tevékenységforrásban) |
Példa
{
"name": "GoogleBigQueryDataset",
"properties": {
"type": "GoogleBigQueryV2Object",
"linkedServiceName": {
"referenceName": "<Google BigQuery linked service name>",
"type": "LinkedServiceReference"
},
"schema": [],
"typeProperties": {
"dataset": "<dataset name>",
"table": "<table name>"
}
}
}
Másolási tevékenység tulajdonságai
A tevékenységek meghatározásához elérhető szakaszok és tulajdonságok teljes listáját a Folyamatok című cikkben találja. Ez a szakasz a Google BigQuery forrástípus által támogatott tulajdonságok listáját tartalmazza.
GoogleBigQuerySource forrástípusként
Ha adatokat szeretne másolni a Google BigQueryből, állítsa be a másolási tevékenység forrástípusát a GoogleBigQueryV2Source-ra. A másolási tevékenység forrás szakaszában az alábbi tulajdonságok támogatottak.
Példa:
"activities":[
{
"name": "CopyFromGoogleBigQuery",
"type": "Copy",
"inputs": [
{
"referenceName": "<Google BigQuery input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<output dataset name>",
"type": "DatasetReference"
}
],
"typeProperties": {
"source": {
"type": "GoogleBigQueryV2Source",
"query": "SELECT * FROM MyTable"
},
"sink": {
"type": "<sink type>"
}
}
}
]
Keresési tevékenység tulajdonságai
A tulajdonságok részleteinek megismeréséhez tekintse meg a keresési tevékenységet.
A Google BigQuery-összekötő frissítése
A Google BigQuery-összekötő frissítéséhez hozzon létre egy új Google BigQuery társított szolgáltatást, és konfigurálja a társított szolgáltatás tulajdonságaira hivatkozva.
Különbségek a Google BigQuery V2 és a V1 között
A Google BigQuery V2-összekötő új funkciókat kínál, és kompatibilis a Google BigQuery V1-összekötő legtöbb funkciójával. Az alábbi táblázat a Google BigQuery V2 és a V1 közötti funkcióbeli különbségeket mutatja be.
Google BigQuery V2 | Google BigQuery V1 |
---|---|
A szolgáltatáshitelesítést az Azure integrációs modulja és a saját üzemeltetésű integrációs modul támogatja. A TrustedCertPath, a useSystemTrustStore, az e-mail és a keyFilePath tulajdonságok nem támogatottak, mivel csak a saját üzemeltetésű integrációs modulban érhetők el. |
A szolgáltatáshitelesítést csak a saját üzemeltetésű integrációs modul támogatja. A trustedCertPath támogatása, aSystemTrustStore, az e-mail és a keyFilePath tulajdonságainak használata. |
A Google BigQuery-adattípusoktól a szolgáltatás által belsőleg használt köztes adattípusokig az alábbi leképezéseket használjuk. Numerikus –> Decimális Időbélyeg –> DateTimeOffset Datetime –> DatetimeOffset |
A Google BigQuery-adattípusoktól a szolgáltatás által belsőleg használt köztes adattípusokig az alábbi leképezéseket használjuk. Numerikus – Sztring> Időbélyeg –> DateTime Datetime –> DateTime |
A requestGoogleDriveScope nem támogatott. Emellett a Google BigQuery szolgáltatásban is alkalmaznia kell az engedélyt a Google Drive API-hatókörök és a Lekérdezési meghajtó adatainak kiválasztásával. | Támogatási kérelemGoogleDriveScope. |
az additionalProjects nem támogatott. Másik lehetőségként lekérdezhet egy nyilvános adathalmazt a Google Cloud-konzollal. | További projektek támogatása. |
Kapcsolódó tartalom
A másolási tevékenység által forrásként és fogadóként támogatott adattárak listáját lásd : Támogatott adattárak.