Notitieblokindeling beheren
In dit artikel wordt de standaardnotatie voor notitieblokken in Azure Databricks beschreven, hoe u de indeling van uw notitieblok wijzigt en hoe u doorvoeringen beheert als uw notebook zich in een door bron beheerde map bevindt.
Notebooks in Databricks worden standaard aangemaakt in het formaat .ipynb
(IPython of Jupyter). U kunt er ook voor kiezen om in plaats daarvan de bronindeling te gebruiken.
U kunt nog steeds notitieblokken importeren en exporteren in verschillende indelingen. Zie exporteren en importeren van Databricks-notebooks.
Notebook-indelingen
Databricks ondersteunt het maken en bewerken van notebooks in twee indelingen: IPYNB (standaard) en bron.
U kunt bronbestanden, inclusief notebooks, beheren met behulp van Git-mappen. Alleen bepaalde Databricks-assettypen worden ondersteund in Git-mappen. De notebookindeling heeft gevolgen voor de uitvoer die wordt doorgevoerd in de externe opslagplaats, zoals beschreven in de onderstaande tabel.
Notitieblok bronformaat | Bijzonderheden |
---|---|
bron | Een basisindeling die alleen broncode vastlegt, met een achtervoegsel dat de codetaal aangeeft, zoals .py , .scala , .r en .sql . |
IPYNB (Jupyter) | Een uitgebreide indeling die broncode, notebookomgeving, visualisatiedefinities, notebookwidgets en optionele uitvoer vastlegt. Een IPYNB-notebook kan code bevatten in elke taal die wordt ondersteund door Databricks-notebooks (ondanks het py deel van .ipynb ). Met het IPYNB (Jupyter) formaat kan de gebruiker optioneel uitvoer vastleggen. IPYNB ondersteunt ook een betere weergave-ervaring voor Databricks-notebooks in externe Git-opslagplaatsen. |
Als u Databricks-notebooks wilt onderscheiden van gewone Python-, Scala- en SQL-bestanden, voegt Azure Databricks de opmerking 'Databricks notebook source
' toe aan de bovenkant van Python-, Scala- en SQL-notebooks. Deze opmerking zorgt ervoor dat Azure Databricks het bestand correct parseert als een notebook in plaats van een scriptbestand.
Notitie
Wat zijn 'uitvoer'?
Uitvoer zijn de resultaten van het uitvoeren van een notebook op het Databricks-platform, inclusief tabelweergaven en visualisaties.
Standaardinstelling voor notitieblokindeling wijzigen
IPYNB-bestanden zijn het standaardformaat bij het maken van een nieuw notebook in Azure Databricks.
Als u de standaardinstelling wilt wijzigen naar de Azure Databricks-bronindeling, meldt u zich aan bij uw Azure Databricks-werkruimte, klikt u in de rechterbovenhoek van de pagina op uw profiel en vervolgens op Instellingen en gaat u naar Ontwikkelaar. Wijzig standaardformaat van het notitieblok onder de Editor-instellingen kop .
Notitieblokindeling converteren
U kunt een bestaand notebook converteren naar een andere indeling via de gebruikersinterface van Azure Databricks.
Een bestaand notitieblok converteren naar een andere indeling:
Open het notitieblok in uw werkruimte.
Selecteer Bestand in het werkruimtemenu, selecteer daarna Notebook format, en kies vervolgens de gewenste indeling. U kunt kiezen tussen Jupyter (.ipynb) (Aanbevolen) of Bronbestand (.scala, .py, .sql, .r). De huidige indeling van het notitieblok wordt grijs weergegeven en bevat een vinkje ernaast.
Lees Databricks-notebooks exporteren en importerenvoor meer informatie over de soorten notebooks die worden ondersteund in Azure Databricks.
Uitvoerdoorvoeringen voor IPYNB-notebook beheren
Voor IPYNB-notebooks in door bron beheerde mappen kunt u beheren hoe notebookuitvoer wordt doorgevoerd in de externe opslagplaats.
Doorvoeren van .ipynb
notebook toestaan
Uitvoer kan alleen worden doorgevoerd als een werkruimtebeheerder deze functie heeft ingeschakeld. De beheerinstelling voor Git-mappen staat standaard niet toe dat .ipynb
notebook-uitvoer wordt gecommit. Als u beheerdersbevoegdheden voor de werkruimte hebt, kunt u deze instelling wijzigen:
Ga naar beheerinstellingen>Werkruimte-instellingen in de Azure Databricks-beheerconsole.
Kies onder Git-mappenToestaan dat Git-mappen IPYNB-uitvoer exporteren en selecteer vervolgens Toestaan: IPYNB-uitvoer kan worden ingeschakeld op.
Belangrijk
Wanneer uitvoer wordt opgenomen, worden de visualisatie- en dashboardconfiguraties opgenomen in de.ipynb
notebooks die u maakt.
IPYNB-uitvoerartefactdoorvoeringen beheren
Wanneer u een .ipynb
bestand doorvoert, maakt Databricks een configuratiebestand waarmee u kunt bepalen hoe u uitvoer doorvoert: .databricks/commit_outputs
.
Als u een
.ipynb
notebookbestand hebt maar geen configuratiebestand in uw externe opslagplaats, gaat u naar het dialoogvenster Git-status.Selecteer in het meldingsdialoog Creƫer commit_outputs bestand.
U kunt ook configuratiebestanden genereren vanuit het menu Bestand. Het menu Bestand bevat een besturingselement om het configuratiebestand automatisch bij te werken, waar u de opname of uitsluiting van uitvoer voor een specifiek IPYNB-notebook kunt opgeven.
Selecteer in het menu Bestand de optie Notebooks-uitvoer doorvoeren.
Bevestig uw keuze in het dialoogvenster om notebookuitvoer door te voeren.
Dialoogvenster notitieblokuitvoer bevestigen.