Připojení k Microsoft OneLake
Microsoft OneLake poskytuje otevřený přístup ke všem položkám Fabricu prostřednictvím existujících Azure Data Lake Storage (ADLS) Gen2 API a SDK. K datům v OneLake můžete přistupovat prostřednictvím libovolného rozhraní API, sady SDK nebo nástroje kompatibilního s ADLS Gen2, a to jenom pomocí identifikátoru URI OneLake. Data můžete nahrát do datového jezera prostřednictvím Průzkumníka služby Azure Storage nebo číst delta tabulku pomocí zástupce v Azure Databricks.
Vzhledem k tomu, že OneLake je software jako služba (SaaS), některé operace, jako je správa oprávnění nebo aktualizace položek, se musí provádět prostřednictvím prostředí Infrastruktury a není možné je provádět prostřednictvím rozhraní API ADLS Gen2. Úplný seznam změn těchto rozhraní API najdete v tématu Parita rozhraní ONELake API.
Syntaxe identifikátoru URI
Vzhledem k tomu, že OneLake existuje v celém tenantovi Microsoft Fabric, můžete v tenantovi odkazovat na cokoli podle jeho pracovního prostoru, položky a cesty:
https://onelake.dfs.fabric.microsoft.com/<workspace>/<item>.<itemtype>/<path>/<fileName>
Poznámka:
Protože můžete opakovaně používat názvy položek napříč více typy položek, je nutné zadat typ položky v rozšíření. Například .lakehouse
pro jezerní dům a .datawarehouse
sklad.
OneLake také podporuje odkazování na pracovní prostory a položky s globálně jedinečnými identifikátory (GUID). OneLake přiřazuje identifikátory GUID a identifikátory GUID se nemění, ani když se změní název pracovního prostoru nebo položky. Přidružený identifikátor GUID pro váš pracovní prostor nebo položku najdete v adrese URL na portálu Fabric. Pro pracovní prostor i položku musíte použít identifikátory GUID a nepotřebujete typ položky.
https://onelake.dfs.fabric.microsoft.com/<workspaceGUID>/<itemGUID>/<path>/<fileName>
Při zavádění nástroje pro použití přes OneLake místo ADLS Gen2 použijte následující mapování:
- Název účtu je vždy
onelake
. - Název kontejneru je název vašeho pracovního prostoru.
- Cesta k datům začíná u položky. Například:
/mylakehouse.lakehouse/Files/
.
OneLake také podporuje ovladač systému souborů Azure Blob (ABFS) pro zajištění větší kompatibility s ADLS Gen2 a Azure Blob Storage. Ovladač ABFS používá vlastní identifikátor schématu abfs
a odlišný formát identifikátoru URI k adresování souborů a adresářů v účtech ADLS Gen2. Pokud chcete tento formát identifikátoru URI použít nad OneLake, zaměňte pracovní prostor za systém souborů a zahrňte položku a typ položky.
abfs[s]://<workspace>@onelake.dfs.fabric.microsoft.com/<item>.<itemtype>/<path>/<fileName>
Identifikátor URI ovladače abfs neumožňuje v názvu pracovního prostoru speciální znaky, například mezery. V těchto případech můžete odkazovat na pracovní prostory a položky s globálně jedinečnými identifikátory (GUID), jak je popsáno výše v této části.
Autorizace
Pomocí předání autorizační hlavičky můžete autentizovat rozhraní OneLake API pomocí ID Microsoft Entra. Pokud nástroj podporuje přihlášení k účtu Azure, abyste povolili předávání tokenů, můžete vybrat libovolné předplatné. OneLake vyžaduje pouze token uživatele a nezajímá vaše předplatné Azure.
Při přímém volání OneLake přes rozhraní API DFS můžete ověřit nosný token pro váš účet Microsoft Entra. Další informace o vyžádání a správě nosných tokenů pro vaši organizaci najdete v knihovně Microsoft Authentication Library.
Pro rychlé ad hoc testování OneLake pomocí přímých volání rozhraní API tady je jednoduchý příklad použití PowerShellu pro přihlášení k účtu Azure, načtení tokenu s vymezeným úložištěm a jeho zkopírování do schránky pro snadné použití jinde. Další informace o načítání přístupových tokenů pomocí PowerShellu najdete v tématu Get-AzAccessToken.
Poznámka:
OneLake podporuje pouze tokeny v cílové skupině Storage
. V následujícím příkladu nastavíme cílovou skupinu prostřednictvím parametru ResourceTypeName
.
Connect-AzAccount
$testToken = Get-AzAccessToken -AsSecureString -ResourceTypeName Storage
# Retrieved token is of string type which you can validate with the "$testToken.Token.GetTypeCode()" command.
$testToken.Token | Set-Clipboard
Umístění dat
Pokud použijete globální koncový bod ('https://onelake.dfs.fabric.microsoft.com) k dotazování dat v jiné oblasti, než je oblast vašeho pracovního prostoru, je možné, že během procesu řešení koncového bodu můžou data opustit vaši oblast. Pokud máte obavy o rezidenci dat, pomocí správného regionálního koncového bodu pro váš pracovní prostor zajistíte, že vaše data zůstanou v aktuální oblasti a nepřekračují žádné hranice oblastí. Správný regionální koncový bod můžete zjistit tak, že zkontrolujete oblast kapacity, ke které je pracovní prostor připojený.
Všechny regionální koncové body OneLake mají stejný formát: https://<region>-onelake.dfs.fabric.microsoft.com
. Například pracovní prostor připojený ke kapacitě v oblasti USA – západ by byl přístupný prostřednictvím regionálního koncového bodu https://westus-onelake.dfs.fabric.microsoft.com
.
Běžné problémy
Pokud nástroj nebo balíček kompatibilní s ADLS Gen2 nefunguje přes OneLake, nejběžnějším problémem je ověření adresy URL. Protože OneLake používá jiný koncový bod (dfs.fabric.microsoft.com
) než ADLS Gen2 (dfs.core.windows.net
), některé nástroje nerozpozná koncový bod OneLake a blokují ho. Některé nástroje umožňují používat vlastní koncové body (například PowerShell). V opačném případě často stačí jednoduše přidat koncový bod OneLake jako podporovaný. Pokud najdete problém s ověřením adresy URL nebo máte jakékoli jiné problémy s připojením k OneLake, dejte nám vědět.
Prostředky
OneLake je přístupný skrze stejná rozhraní API i sady SDK jako ADLS Gen2. Další informace o používání rozhraní API ADLS Gen2 najdete na následujících stránkách:
- Referenční rozhraní API ADLS Gen2
- Sady SDK souborového systému ADLS Gen2
Ukázky
Vytvořit soubor
Požádat |
UMÍSTIT https://onelake.dfs.fabric.microsoft.com/{workspace}/{item}.{itemtype}/Files/sample?resource=file |
---|---|
Záhlaví | Authorization: Bearer <userAADToken> |
Response |
ResponseCode:201 Created Záhlaví: x-ms-version : 2021-06-08 x-ms-request-id : 272526c7-0995-4cc4-b04a-8ea3477bc67b x-ms-content-crc64 : OAJ6r0dQWP0= x-ms-request-server-encrypted : true ETag : 0x8DA58EE365 Tělo: |
Související obsah
- Parita a integrace OneLake
- Připojení k OneLake pomocí Pythonu
- Integrace OneLake se službou Azure Synapse Analytics