Sdílet prostřednictvím


Co je tabulka?

Tabulka se nachází ve schématu a obsahuje řádky dat. Všechny tabulky vytvořené v Azure Databricks ve výchozím nastavení používají Delta Lake. Tabulky zálohované Delta Lake se také označují jako tabulky Delta.

Tabulka Delta ukládá data jako adresář souborů v cloudovém úložišti objektů a registruje metadata tabulek do metastoru v rámci katalogu a schématu. Všechny spravované tabulky v katalogu Unity a streamované tabulky jsou tabulky Delta. Externí tabulky Katalogu Unity můžou být tabulky Delta, ale nemusí být povinné.

Tabulky můžete vytvářet v Databricks, které nepoužívají Delta Lake. Tyto tabulky neposkytují transakční záruky ani optimalizovaný výkon tabulek Delta.

Tabulky ukládají řádky dat. Tabulka se nachází ve schématu a obsahuje řádky dat. Následující příklad ukazuje tabulku prod.people_ops_employees, která obsahuje data o pěti zaměstnanech. Metadata jsou zaregistrovaná v katalogu Unity a data se ukládají v cloudovém úložišti.

Příklad tabulky obsahující data zaměstnanců

Základní oprávnění tabulky

Aby uživatelé mohli vytvořit tabulku, musí mít CREATE TABLE a USE SCHEMA oprávnění ke schématu a musí mít oprávnění USE CATALOG pro nadřazený katalog. K dotazování tabulky musí mít uživatelé oprávnění SELECT k tabulce, oprávnění USE SCHEMA nadřazeného schématu a oprávnění USE CATALOG pro nadřazený katalog.

Další informace o oprávněních katalogu Unity najdete v tématu Správa oprávnění v katalogu Unity.

Tabulky v katalogu Unity

V katalogu Unity se tabulky nacházejí na třetí úrovni oboru názvů tří úrovní (catalog.schema.table), jak je znázorněno v následující tabulce. Externí tabulky Katalogu Unity můžou být tabulky Delta, ale nemusí být povinné.

diagram objektového modelu katalogu Unity zaměřený na tabulku

Tabulky Delta

Podporovaná Delta Lake, tabulka Delta ukládá data jako adresář souborů v cloudovém úložišti objektů a registruje metadata tabulky do metastoru v rámci katalogu a schématu. Vzhledem k tomu, že tabulky Delta jsou výchozí v Databricks, většina odkazů na tabulky popisuje chování tabulek Delta, pokud není uvedeno jinak. Všechny spravované tabulky v katalogu Unity a streamované tabulky jsou tabulky Delta. Viz Co je Delta Lake?.

Databricks doporučuje vždy pracovat s tabulkami Delta pomocí plně kvalifikovaných názvů tabulek místo cest k souborům.

Spravované tabulky

Spravované tabulky spravují základní datové soubory společně s registrací ve metastoru. Databricks doporučuje používat spravované tabulky při každém vytvoření nové tabulky. Spravované tabulky Unity Catalog jsou výchozí při vytváření tabulek v Azure Databricks. Vždy používají Delta Lake. Viz Práce se spravovanými tabulkami.

Externí tabulky

Externí tabulky, někdy označované jako nespravované tabulky, odkazují na data uložená mimo Databricks v externím systému úložiště, jako je cloudové úložiště objektů. Oddělují správu základních datových souborů od registrace v metastore. Unity Catalog >podporuje externí tabulky v několika formátech, včetně Delta Lake. Externí tabulky Katalogu Unity můžou ukládat datové soubory pomocí běžných formátů čitelných externími systémy. Viz Práce s externími tabulkami.

Streamované tabulky

Tabulky streamování jsou tabulky Delta, které se primárně používají ke zpracování přírůstkových dat. Většina aktualizací streamovaných tabulek probíhá prostřednictvím operací aktualizace.

Streamované tabulky můžete zaregistrovat v katalogu Unity pomocí Databricks SQL nebo je definovat jako součást kanálu DLT. Viz Jak streamované tabulky fungují, Načítat data pomocí streamovaných tabulek v Databricks SQLa Co je DLT?.

Cizí tabulky

Cizí tabulky představují data uložená v externích systémech připojených k Azure Databricks prostřednictvím federace Lakehouse. Cizí tabulky jsou v Azure Databricks jen pro čtení. Podívejte se na Co je Federace Lakehouse?

Tabulky funkcí

Libovolná tabulka Delta spravovaná katalogem Unity, která má primární klíč, je tabulka funkcí. Tabulky funkcí můžete volitelně nakonfigurovat pomocí online úložiště funkcí pro případy použití s nízkou latencí. Viz Práce s tabulkami vlastností v úložišti vlastností pracovního prostoru (starší varianta).

Tabulky Hive (starší verze)

Tabulky Hive popisují dva odlišné koncepty v Azure Databricks, z nichž obě jsou starší vzory a nedoporučuje se.

Tabulky zaregistrované pomocí starší verze metastoru Hive ukládají data ve výchozím nastavení ve starším kořenovém adresáři DBFS. Databricks doporučuje migrovat všechny tabulky ze starší verze HMS do katalogu Unity. Viz Databázové objekty v legacy metastore Hive.

Apache Spark podporuje registraci a dotazování tabulek Hive, ale tyto kodeky nejsou optimalizované pro Azure Databricks. Databricks doporučuje registrovat tabulky Hive jenom pro podporu dotazů na data zapsaná externími systémy. Viz tabulka Hive (starší verze).

Živé tabulky (zastaralé)

Termín živých tabulek odkazuje na dřívější implementaci funkcí, které jsou nyní implementovány jako materializovaná zobrazení. Veškerý starší kód, který odkazuje na živé tabulky, by se měl aktualizovat tak, aby používal syntaxi pro materializovaná zobrazení. Podívejte se na Co je DLT? a Použití materializovaných zobrazení v Databricks SQL.