Adatformátum beállításai

Cikk
01/21/2025

Az Azure Databricks beépített kulcsszókötésekkel rendelkezik az Apache Spark által natív módon támogatott összes adatformátumhoz. Az Azure Databricks a Delta Lake protokollt használja az adatok és táblák olvasásához és írásához, míg az Apache Spark a Parquetet használja.

Ezek a cikkek áttekintést nyújtanak az Azure Databricks adatainak lekérdezése során elérhető számos lehetőségről és konfigurációról.

Az alábbi adatformátumok beépített kulcsszókonfigurációkkal rendelkeznek az Apache Spark DataFramesben és az SQL-ben:

Az Azure Databricks egy egyéni kulcsszót is biztosít az MLflow-kísérletek betöltéséhez.

Adatformátumok speciális szempontok alapján

Egyes adatformátumok további konfigurációt vagy speciális szempontokat igényelnek a használathoz:

A Databricks a képekjavasolja.
Az Azure Databricks számos fájlformátumban képes közvetlenül olvasni a tömörített fájlokat. Szükség esetén kibonthatja a tömörített fájlokat az Azure Databricksben.

További információ az Apache Spark-adatforrásokról: Általános betöltési/mentési függvények és Általános forrásfájl-beállítások.

Megosztás a következőn keresztül:

Adatformátum beállításai

Adatformátumok speciális szempontok alapján

Visszajelzés

További források