Sorties et résultats des notebooks
Une fois que vous avez attaché un notebook à un cluster et exécuté une ou plusieurs cellules, votre notebook aura un état et affichera des résultats. Cette section explique comment gérer l’état et les résultats d’un notebook.
Effacer l’état et les sorties des notebooks
Pour effacer l’état et les sorties du notebook, sélectionnez l’une des options Effacer en bas du menu Exécuter.
Option de menu | Description |
---|---|
Effacer toutes les sorties de cellule | Efface les sorties de cellule. Cela est utile si vous partagez le notebook et que vous souhaitez éviter d’inclure des résultats. |
État clair | Efface l’état du notebook, y compris les définitions de fonction et de variable, les données et les bibliothèques importées. |
Effacer l’état et les sorties | Efface les sorties de cellule et l’état du notebook. |
Effacer l’état et exécuter tout | Efface l’état du notebook et démarre une nouvelle exécution. |
Table des résultats
Lorsqu’une cellule est exécutée, les résultats sont affichés dans un tableau de résultats. Avec le tableau des résultats, vous pouvez effectuer les opérations suivantes :
- Copiez une colonne ou un autre sous-ensemble des résultats tabulaires dans le presse-papiers.
- Effectuez une recherche de texte sur la table de résultats.
- Trier et filtrer des données.
- Naviguez entre les cellules de la table en utilisant les touches de direction du clavier.
- Sélectionnez une partie du nom de colonne ou de la valeur de cellule en double-cliquant et en faisant glisser pour sélectionner le texte souhaité.
Pour afficher les limites de la table de résultats, consultez Limites du tableau de résultats du notebook.
Sélectionner les données
Pour sélectionner des données dans la table de résultats, effectuez l’une des opérations suivantes.
- Copiez les données ou un sous-ensemble dans le presse-papiers.
- Cliquez sur une colonne ou un en-tête de ligne.
- Cliquez dans la cellule supérieure gauche du tableau pour sélectionner l’intégralité du tableau.
- Faites glisser votre curseur sur n’importe quel ensemble de cellules pour les sélectionner.
Pour ouvrir un panneau latéral qui affiche des informations sur la sélection, cliquez sur l’icône dans le coin supérieur droit, à côté du champ de Rechercher.
Copier les données dans le Presse-papiers
Pour copier le tableau de résultats au format CSV dans le Presse-papiers, cliquez sur la flèche vers le bas en regard de l’onglet titre du tableau, puis cliquez sur Copier les résultats dans le Presse-papiers.
Vous pouvez également cliquer sur la zone située en haut à gauche du tableau pour sélectionner la table complète, puis cliquer avec le bouton droit et sélectionner Copier dans le menu déroulant.
Il existe plusieurs façons de copier les données sélectionnées :
- Appuyez sur
Cmd + C
sur MacOS ouCtrl + C
sur Windows pour copier les résultats dans le Presse-papiers au format CSV. - Cliquez avec le bouton droit et sélectionnez Copier pour copier les résultats dans le Presse-papiers au format CSV.
- Cliquez avec le bouton droit et sélectionnez Copier en tant que pour copier les données sélectionnées au format CSV, TSV ou Markdown.
Trier les résultats
Pour trier la table de résultats en fonction des valeurs d’une colonne, placez le curseur sur le nom de la colonne. Une icône contenant le nom de la colonne apparaît à droite de la cellule. Cliquez sur la flèche pour trier la colonne.
Pour trier sur plusieurs colonnes, maintenez enfoncée la touche Maj pendant que vous cliquez sur la flèche de tri pour les colonnes.
Le tri suit l’ordre de tri naturel par défaut. Pour appliquer un ordre de tri lexicographique, utilisez ORDER BY
dans SQL ou les fonctions de SORT
respectives disponibles dans votre environnement.
Filtrer les résultats
Il existe plusieurs façons de créer un filtre :
Cliquez sur l'icône de filtre
dans le coin supérieur à droite des résultats de la cellule. Dans la boîte de dialogue qui s’affiche, sélectionnez la colonne sur laquelle filtrer, et la règle et la valeur de filtrage à appliquer. Par exemple :
Pour ajouter un autre filtre, cliquez sur
.
Pour activer ou désactiver temporairement un filtre, faites basculer le bouton Activé/Désactivé dans la boîte de dialogue. Pour supprimer un filtre, cliquez sur le X en regard du nom du filtre
.
Pour filtrer par une valeur spécifique, cliquez avec le bouton droit sur une cellule ayant cette valeur, puis sélectionnez Filtrer par cette valeur dans le menu déroulant.
Pour filtrer sur une colonne spécifique, utilisez le menu kebab dans le nom de la colonne :
Par défaut, les filtres sont appliqués uniquement aux résultats affichés dans la table des résultats. Si les données retournées sont tronquées (par exemple, lorsqu’une requête retourne plus de 10 000 lignes ou que le jeu de données est supérieur à 2 Mo), le filtre est appliqué uniquement aux lignes retournées. Une note en haut à droite de la table indique que le filtre a été appliqué aux données tronquées.
Vous pouvez choisir de filtrer le jeu de données complet à la place. Cliquez sur Données tronquées, puis choisissez Jeu de données complet. En fonction de la taille du jeu de données, il peut prendre beaucoup de temps pour que le filtre s’applique.
Mettre en forme les colonnes
Les en-têtes de colonnes indiquent le type de données de la colonne. Par exemple, indique le type de données d’entier. Pointez au-dessus de l’indicateur pour afficher le type de données.
Vous pouvez mettre en forme des colonnes dans les tables de résultats en tant que types tels que Devise, Pourcentage, URL et bien plus, avec un contrôle sur les décimales pour des tables plus claires.
Mettez en forme les colonnes à partir du menu kebab dans le nom de colonne.
Télécharger les résultats
Par défaut, le téléchargement des résultats est activé. Pour activer/désactiver ce paramètre, consultez Gérer la possibilité de télécharger des résultats à partir de notebooks.
Vous pouvez télécharger un résultat de cellule qui contient une sortie tabulaire sur votre ordinateur local. Cliquez sur la flèche pointant vers le bas après le titre de l’onglet. Les options de menu dépendent du nombre de lignes dans le résultat et de la version de Databricks Runtime. Les résultats téléchargés sont enregistrés sur votre ordinateur local sous la forme d’un fichier CSV dont le nom correspond au nom de votre notebook.
Pour les notebooks connectés aux entrepôts SQL, vous pouvez également télécharger les résultats sous forme de fichier Excel.
Explorer les résultats des cellules SQL
Dans un notebook Databricks, les résultats d’une cellule de langage SQL sont automatiquement disponibles en tant que DataFrame affecté à la variable _sqldf
. Vous pouvez utiliser la _sqldf
variable pour faire référence à la sortie SQL précédente dans les cellules Python et SQL suivantes. Pour plus d’informations, consultez Explorer les résultats des cellules SQL.
Afficher plusieurs sorties par cellule
Les notebooks et les cellules Python dans les notebooks %python
non-Python prennent en charge plusieurs sorties par cellule. Par exemple, la sortie du code suivant inclut à la fois le tracé et le tableau :
import pandas as pd
from sklearn.datasets import load_iris
data = load_iris()
iris = pd.DataFrame(data=data.data, columns=data.feature_names)
ax = iris.plot()
print("plot")
display(ax)
print("data")
display(iris)
Redimensionner les sorties
Redimensionnez les sorties de cellule en faisant glisser le coin inférieur droit de la table ou de la visualisation.
Commiter les sorties de notebook dans des dossiers Git Databricks
Pour en savoir plus sur la validation des sorties de notebook .ipynb, consultez Autoriser la validation de la sortie du notebook .ipynb.
- Le notebook doit être un fichier .ipynb
- Les paramètres d’administration de l’espace de travail doivent autoriser la validation des sorties de notebook.