Adatok megosztása a Delta Sharing nyílt megosztási protokoll használatával (szolgáltatók számára)
Ez a cikk áttekintést nyújt arról, hogy a szolgáltatók hogyan használhatják a Delta Sharing nyílt megosztási protokollt a Unity Catalog-kompatibilis Azure Databricks-munkaterület adatainak bármely felhasználóval való megosztására bármilyen számítási platformon, bárhol.
Feljegyzés
Ha Ön adatátvevő (olyan felhasználó vagy felhasználócsoport, akivel adatokat osztanak meg), tekintse meg helyette az Önnel megosztott adatokat a Delta Sharing (címzettek) használatával.
Ki használja a Delta Sharing nyílt megosztási protokollt?
Az adatok megosztásának három módja van a Delta Sharing használatával:
A jelen cikkben tárgyalt Databricks nyílt megosztási protokoll lehetővé teszi, hogy a Unity Katalógus-kompatibilis Databricks-munkaterületen kezelt adatokat bármely számítási platform felhasználóival megossza.
Ez a megközelítés az Azure Databricksbe beépített Delta Sharing-kiszolgálót használja, amely akkor hasznos, ha a Unity Catalog használatával kezeli az adatokat, és meg szeretné osztani azokat olyan felhasználókkal, akik nem használják a Databricks szolgáltatást, vagy nem rendelkeznek hozzáféréssel a Unity Catalog-kompatibilis Databricks-munkaterületekhez. A Unity Catalog szolgáltatói oldallal való integrációja leegyszerűsíti a szolgáltatók beállítását és szabályozását.
A nyílt forráskódú Delta Sharing-kiszolgáló ügyfél által felügyelt implementációja lehetővé teszi, hogy bármely platformról bármilyen platformon megossza, akár a Databricks, akár nem.
A Databricks-to-Databricks megosztóprotokoll lehetővé teszi, hogy adatokat oszthasson meg a Unity catalog-kompatibilis munkaterületről olyan felhasználókkal, akik szintén hozzáférnek a Unity Catalog-kompatibilis Databricks-munkaterülethez.
A Delta Sharing bemutatása és a három megközelítéssel kapcsolatos további információk: Mi a Delta Sharing?
Változásmegosztási nyílt megosztási munkafolyamat
Ez a szakasz magas szintű áttekintést nyújt a nyílt megosztási munkafolyamatról, az egyes lépések részletes dokumentációjára mutató hivatkozásokkal.
A Delta Sharing nyílt megosztási modellben:
Az adatszolgáltató létrehoz egy címzettet, amely egy elnevezett objektum, amely egy felhasználót vagy felhasználói csoportot jelöl, akivel az adatszolgáltató adatokat kíván megosztani.
Amikor az adatszolgáltató létrehozza a címzettet, az Azure Databricks létrehoz egy jogkivonatot, egy hitelesítőadat-fájlt, amely tartalmazza a jogkivonatot, valamint egy aktiválási hivatkozást, amelyet az adatszolgáltató küldhet a címzettnek a hitelesítőadat-fájl eléréséhez.
További részletekért lásd : 1. lépés: A címzett létrehozása.
Az adatszolgáltató létrehoz egy megosztást, amely egy elnevezett objektum, amely a szolgáltató fiókjában a Unity Catalog metaadattárában regisztrált táblák gyűjteményét tartalmazza.
További információ: Megosztások létrehozása és kezelése a Delta-megosztáshoz.
Az adatszolgáltató hozzáférést biztosít a címzettnek a megosztáshoz.
További részletekért lásd: Delta Sharing-adatmegosztásokhoz való hozzáférés kezelése (szolgáltatók számára).
Az adatszolgáltató biztonságos csatornán keresztül küldi el az aktiválási hivatkozást a címzettnek, valamint az aktiválási hivatkozás használatával letölti azt a hitelesítőadat-fájlt, amellyel a címzett biztonságos kapcsolatot létesít az adatszolgáltatóval a megosztott adatok fogadásához.
További részletekért lásd : 2. lépés: Az aktiválási hivatkozás lekérése.
Az adatátvevő az aktiválási hivatkozást követve letölti a hitelesítőadat-fájlt, majd a hitelesítőadat-fájlt használja a megosztott adatok eléréséhez.
A megosztott adatok csak olvashatók. A felhasználók a platformjukon vagy a választott eszközökkel férhetnek hozzá az adatokhoz.
További részletekért lásd: Megosztott adatok olvasása a Delta Sharing nyílt megosztásával (címzettek számára).
szolgáltatóspecifikus konfigurációk
Sok szolgáltató saját Delta Sharing-hálózattal rendelkezik a megosztáshoz. Konkrét megosztási utasításokért lásd például:
A szolgáltató beállítási és biztonsági szempontjai a nyílt megosztáshoz
A jó jogkivonat-kezelés kulcsfontosságú az adatok biztonságos megosztásához a nyílt megosztómodell használatakor:
- Az Azure Databricks azon adatszolgáltatóinak, akik megosztások biztosításakor nyílt megosztást kívánnak használni, konfigurálniuk kell az alapértelmezett címzett jogkivonat élettartamát, amikor engedélyezik a Delta Sharing szolgáltatást a Unity Catalog-metaadattárban. A Databricks azt javasolja, hogy konfigurálja a jogkivonatokat a lejárathoz. Lásd a Delta-megosztás engedélyezése metaadattáron témakört.
- Ha módosítania kell az alapértelmezett jogkivonat élettartamát, olvassa el a címzett jogkivonat élettartamának módosítása című témakört.
- Bátorítsa a címzetteket, hogy biztonságosan kezeljék a letöltött hitelesítőadat-fájljukat.
- További információ a jogkivonatok kezeléséről és a nyílt megosztás biztonságáról: Címzett-jogkivonatok kezelése (nyílt megosztás).
Az adatszolgáltatók további biztonságot nyújthatnak, ha IP-hozzáférési listákat rendelnek hozzá a címzettek adott hálózati helyekre való hozzáférésének korlátozásához. Lásd: A deltamegosztás címzetthozzáférésének korlátozása IP-hozzáférési listák használatával (nyílt megosztás).