Sdílet prostřednictvím


Připojení k Microsoft OneLake

Microsoft OneLake poskytuje otevřený přístup ke všem položkám Fabricu prostřednictvím existujících Azure Data Lake Storage (ADLS) Gen2 API a SDK. K datům v OneLake můžete přistupovat prostřednictvím libovolného rozhraní API, sady SDK nebo nástroje kompatibilního s ADLS Gen2, a to jenom pomocí identifikátoru URI OneLake. Data můžete nahrát do datového jezera prostřednictvím Průzkumníka služby Azure Storage nebo číst delta tabulku pomocí zástupce v Azure Databricks.

Vzhledem k tomu, že OneLake je software jako služba (SaaS), některé operace, jako je správa oprávnění nebo aktualizace položek, se musí provádět prostřednictvím prostředí Infrastruktury a není možné je provádět prostřednictvím rozhraní API ADLS Gen2. Úplný seznam změn těchto rozhraní API najdete v tématu Parita rozhraní ONELake API.

Syntaxe identifikátoru URI

Vzhledem k tomu, že OneLake existuje v celém tenantovi Microsoft Fabric, můžete v tenantovi odkazovat na cokoli podle jeho pracovního prostoru, položky a cesty:

https://onelake.dfs.fabric.microsoft.com/<workspace>/<item>.<itemtype>/<path>/<fileName>

Poznámka:

Protože můžete opakovaně používat názvy položek napříč více typy položek, je nutné zadat typ položky v rozšíření. Například .lakehouse pro jezerní dům a .datawarehouse sklad.

OneLake také podporuje odkazování na pracovní prostory a položky s globálně jedinečnými identifikátory (GUID). OneLake přiřazuje identifikátory GUID a identifikátory GUID se nemění, ani když se změní název pracovního prostoru nebo položky. Přidružený identifikátor GUID pro váš pracovní prostor nebo položku najdete v adrese URL na portálu Fabric. Pro pracovní prostor i položku musíte použít identifikátory GUID a nepotřebujete typ položky.

https://onelake.dfs.fabric.microsoft.com/<workspaceGUID>/<itemGUID>/<path>/<fileName>

Při zavádění nástroje pro použití přes OneLake místo ADLS Gen2 použijte následující mapování:

  • Název účtu je vždy onelake.
  • Název kontejneru je název vašeho pracovního prostoru.
  • Cesta k datům začíná u položky. Například: /mylakehouse.lakehouse/Files/.

OneLake také podporuje ovladač systému souborů Azure Blob (ABFS) pro zajištění větší kompatibility s ADLS Gen2 a Azure Blob Storage. Ovladač ABFS používá vlastní identifikátor schématu abfs a odlišný formát identifikátoru URI k adresování souborů a adresářů v účtech ADLS Gen2. Pokud chcete tento formát identifikátoru URI použít nad OneLake, zaměňte pracovní prostor za systém souborů a zahrňte položku a typ položky.

abfs[s]://<workspace>@onelake.dfs.fabric.microsoft.com/<item>.<itemtype>/<path>/<fileName>

Identifikátor URI ovladače abfs neumožňuje v názvu pracovního prostoru speciální znaky, například mezery. V těchto případech můžete odkazovat na pracovní prostory a položky s globálně jedinečnými identifikátory (GUID), jak je popsáno výše v této části.

Autorizace

Pomocí předání autorizační hlavičky můžete autentizovat rozhraní OneLake API pomocí ID Microsoft Entra. Pokud nástroj podporuje přihlášení k účtu Azure, abyste povolili předávání tokenů, můžete vybrat libovolné předplatné. OneLake vyžaduje pouze token uživatele a nezajímá vaše předplatné Azure.

Při přímém volání OneLake přes rozhraní API DFS můžete ověřit nosný token pro váš účet Microsoft Entra. Další informace o vyžádání a správě nosných tokenů pro vaši organizaci najdete v knihovně Microsoft Authentication Library.

Pro rychlé ad hoc testování OneLake pomocí přímých volání rozhraní API tady je jednoduchý příklad použití PowerShellu pro přihlášení k účtu Azure, načtení tokenu s vymezeným úložištěm a jeho zkopírování do schránky pro snadné použití jinde. Další informace o načítání přístupových tokenů pomocí PowerShellu najdete v tématu Get-AzAccessToken.

Poznámka:

OneLake podporuje pouze tokeny v cílové skupině Storage . V následujícím příkladu nastavíme cílovou skupinu prostřednictvím parametru ResourceTypeName .

Connect-AzAccount
$testToken = Get-AzAccessToken -AsSecureString -ResourceTypeName Storage
# Retrieved token is of string type which you can validate with the "$testToken.Token.GetTypeCode()" command.
$testToken.Token | Set-Clipboard

Umístění dat

Pokud použijete globální koncový bod ('https://onelake.dfs.fabric.microsoft.com) k dotazování dat v jiné oblasti, než je oblast vašeho pracovního prostoru, je možné, že během procesu řešení koncového bodu můžou data opustit vaši oblast. Pokud máte obavy o rezidenci dat, pomocí správného regionálního koncového bodu pro váš pracovní prostor zajistíte, že vaše data zůstanou v aktuální oblasti a nepřekračují žádné hranice oblastí. Správný regionální koncový bod můžete zjistit tak, že zkontrolujete oblast kapacity, ke které je pracovní prostor připojený.

Všechny regionální koncové body OneLake mají stejný formát: https://<region>-onelake.dfs.fabric.microsoft.com. Například pracovní prostor připojený ke kapacitě v oblasti USA – západ by byl přístupný prostřednictvím regionálního koncového bodu https://westus-onelake.dfs.fabric.microsoft.com.

Běžné problémy

Pokud nástroj nebo balíček kompatibilní s ADLS Gen2 nefunguje přes OneLake, nejběžnějším problémem je ověření adresy URL. Protože OneLake používá jiný koncový bod (dfs.fabric.microsoft.com) než ADLS Gen2 (dfs.core.windows.net), některé nástroje nerozpozná koncový bod OneLake a blokují ho. Některé nástroje umožňují používat vlastní koncové body (například PowerShell). V opačném případě často stačí jednoduše přidat koncový bod OneLake jako podporovaný. Pokud najdete problém s ověřením adresy URL nebo máte jakékoli jiné problémy s připojením k OneLake, dejte nám vědět.

Prostředky

OneLake je přístupný skrze stejná rozhraní API i sady SDK jako ADLS Gen2. Další informace o používání rozhraní API ADLS Gen2 najdete na následujících stránkách:

Ukázky

Vytvořit soubor

Požádat UMÍSTIT https://onelake.dfs.fabric.microsoft.com/{workspace}/{item}.{itemtype}/Files/sample?resource=file
Záhlaví Authorization: Bearer <userAADToken>
Response ResponseCode:201 Created
Záhlaví:
x-ms-version : 2021-06-08
x-ms-request-id : 272526c7-0995-4cc4-b04a-8ea3477bc67b
x-ms-content-crc64 : OAJ6r0dQWP0=
x-ms-request-server-encrypted : true
ETag : 0x8DA58EE365
Tělo: