Adatformátum beállításai
Az Azure Databricks beépített kulcsszókötésekkel rendelkezik az Apache Spark által natív módon támogatott összes adatformátumhoz. Az Azure Databricks a Delta Lake protokollt használja az adatok és táblák olvasásához és írásához, míg az Apache Spark a Parquetet használja.
Ezek a cikkek áttekintést nyújtanak az Azure Databricks adatainak lekérdezése során elérhető számos lehetőségről és konfigurációról.
Az alábbi adatformátumok beépített kulcsszókonfigurációkkal rendelkeznek az Apache Spark DataFramesben és az SQL-ben:
Az Azure Databricks egy egyéni kulcsszót is biztosít az MLflow-kísérletek betöltéséhez.
Adatformátumok speciális szempontok alapján
Egyes adatformátumok további konfigurációt vagy speciális szempontokat igényelnek a használathoz:
- A Databricks a képekjavasolja.
- Az Azure Databricks számos fájlformátumban képes közvetlenül olvasni a tömörített fájlokat. Szükség esetén kibonthatja a tömörített fájlokat az Azure Databricksben.
További információ az Apache Spark-adatforrásokról: Általános betöltési/mentési függvények és Általános forrásfájl-beállítások.