Kombinieren von CSV-Dateien
In Power Query können Sie mehrere Dateien aus einer bestimmten Datenquelle kombinieren. In diesem Artikel wird beschrieben, wie die Benutzeroberfläche funktioniert, wenn die dateien, die Sie kombinieren möchten, CSV-Dateien sind. Weitere Informationen: Übersicht über das Kombinieren von Dateien
Tipp
Sie können diesem Beispiel folgen, indem Sie die in diesem Artikel verwendeten Beispieldateien über diesen Downloadlink herunterladen. Sie können diese Dateien in der Datenquelle Ihrer Wahl platzieren, z. B. einen lokalen Ordner, einen SharePoint-Ordner, Azure Blob Storage, Azure Data Lake Storage oder eine andere Datenquelle, die die Dateisystemansicht bereitstellt.
Der Einfachheit halber verwendet das Beispiel in diesem Artikel den Ordnerkonnektor. Weitere Informationen: Ordner
Informationen zu den verwendeten Beispieldateien
Um Dateien zu kombinieren, müssen sie alle über die gleiche Struktur und die gleiche Erweiterung verfügen. Alle in diesem Beispiel verwendeten Dateien weisen die gleiche Struktur und Erweiterung auf (.csv).
Es gibt 12 CSV-Dateien, eine für jeden Monat des Kalenderjahres 2019. Die folgende Abbildung zeigt die ersten 15 Zeilen der Datei für den Monat Januar.
Die Anzahl der Zeilen variiert von Datei zu Datei, aber alle Dateien weisen einen Kopfzeilenabschnitt in den ersten vier Zeilen auf. Sie haben Spaltenüberschriften in der fünften Zeile, und die Daten für die Tabelle beginnen in der sechsten Zeile und werden durch alle nachfolgenden Zeilen fortgesetzt.
Ziel ist es, alle 12 Dateien in einer einzigen Tabelle zu kombinieren. Diese kombinierte Tabelle enthält die Kopfzeile oben in der Tabelle und enthält den Quellnamen, das Datum, das Land, die Einheiten und die Umsatzdaten für das gesamte Jahr in separaten Spalten nach der Kopfzeile.
Tabellenvorschau
Wenn Sie eine Verbindung mit dem Ordner herstellen, der die zu kombinierenden Dateien hosten soll – in diesem Beispiel ist der Name dieses Ordners CSV-Dateien– wird das Dialogfeld "Tabellenvorschau" angezeigt, in dem der Ordnerpfad in der oberen linken Ecke angezeigt wird. Die Datenvorschau zeigt die Dateisystemansicht an.
Wählen Sie für dieses Beispiel Kombinieren aus. Wählen Sie für Excel oder Power Query Desktop Daten kombinieren und transformieren aus.
Anmerkung
In einer anderen Situation können Sie Daten transformieren auswählen, um Ihre Daten weiter zu filtern und zu transformieren, bevor Sie die Dateien kombinieren. Das Auswählen Kombinieren wird nur empfohlen, wenn Sie sicher sind, dass der Ordner nur die Dateien enthält, die Sie kombinieren möchten.
Dialogfeld "Dateien kombinieren"
Nachdem Sie in der Tabellenvorschau kombinieren ausgewählt haben, wird das Dialogfeld Dateien kombinieren angezeigt.
Anmerkung
Power Query erkennt automatisch, welcher Connector basierend auf der ersten Datei in der Liste verwendet werden soll. Weitere Informationen zum CSV-Konnektor finden Sie unter Text/CSV.
Behalten Sie in diesem Beispiel alle Standardeinstellungen bei (Beispieldatei als Erste Datei und die Standardwerte für Dateiursprung, Trennzeichen und Datentyperkennung).
Wählen Sie jetzt rechts unten Daten transformieren aus, um zur Ausgabeabfrage zu wechseln.
Ausgabeabfrage
Nachdem Sie Daten transformieren im Dialogfeld Dateien kombinieren ausgewählt haben, werden Sie in der Abfrage, die Sie ursprünglich aus der Verbindung mit dem lokalen Ordner erstellt haben, zurück zum Power Query-Editor weitergeleitet. Die Ausgabeabfrage enthält nun den Quelldateinamen in der spalte links neben den Daten aus den einzelnen Quelldateien in den verbleibenden Spalten.
Die Daten befinden sich jedoch nicht im richtigen Format. Sie müssen die obersten vier Zeilen aus jeder Datei entfernen, bevor Sie sie kombinieren. Wenn Sie diese Änderung in jeder Datei vornehmen möchten, bevor Sie sie kombinieren, wählen Sie die Transformationsbeispieldatei Abfrage im Bereich Abfragen auf der linken Seite des Bildschirms aus.
Ändern der Transformationsbeispieldateiabfrage
In dieser Abfrage Transformationsbeispieldatei geben die Werte in der Spalte Datum an, dass die Daten für den Monat April gelten, der das Jahr-Monat-Tag-Format (JJJJ-MM-TT) aufweist. April 2019.csv ist die erste Datei, die in der Tabellenvorschau angezeigt wird.
Sie müssen jetzt eine neue Gruppe von Transformationen anwenden, um die Daten zu bereinigen. Jede Transformation wird automatisch in eine Funktion innerhalb der Hilfsabfragen Gruppe konvertiert, die auf jede Datei im Ordner angewendet wird, bevor die Daten aus jeder Datei kombiniert werden.
Die Transformationen, die der Abfrage Transformationsbeispieldatei hinzugefügt werden müssen, sind:
Entfernen der obersten Zeilen: Wählen Sie zum Ausführen dieses Vorgangs das Tabellensymbolmenü in der oberen linken Ecke der Tabelle aus, und wählen Sie dann Obere Zeilen entfernenaus.
Geben Sie im Dialogfeld "Oberste Zeilen entfernen"4ein, und wählen Sie dann OKaus.
Nachdem Sie OKausgewählt haben, enthält die Tabelle nicht mehr die ersten vier Zeilen.
Erste Zeile als Überschriften verwenden: Wählen Sie erneut das Tabellensymbol und dann Erste Zeile als Überschriften verwenden aus.
Das Ergebnis dieses Vorgangs fördert die erste Zeile der Tabelle auf die neuen Spaltenüberschriften.
Nach Abschluss dieses Vorgangs versucht Power Query standardmäßig, die Datentypen der Spalten automatisch zu erkennen und einen neuen Geänderten Spaltentyp Schritt hinzuzufügen.
Überarbeitung der Ergebnisabfrage
Wenn Sie zur CSV-Dateien Abfrage in Power Query Desktop zurückkehren, wird im letzten Schritt ein Fehler angezeigt, der "Die Spalte "Spalte1" der Tabelle wurde nicht gefunden." Wenn Sie zurück zur CSV-Dateien Abfrage in Power Query Online wechseln, werden die änderungen, die Sie zuvor vorgenommen haben, um die ersten vier Zeilen zu entfernen und die erste Zeile als Überschriften zu verwenden, nicht auf die Tabelle angewendet. Wählen Sie in Power Query Online auf der Registerkarte Start“ die Option Aktualisieren aus. Sobald der Bildschirm aktualisiert wurde, wird dieselbe Fehlermeldung angezeigt.
Der Grund für diesen Fehler besteht darin, dass der vorherige Status der Abfrage einen Vorgang für eine Spalte mit dem Namen Column1ausgeführt hat. Aufgrund der Änderungen an der Transformationsbeispieldatei Abfrage ist diese Spalte jedoch nicht mehr vorhanden. Weitere Informationen: Umgang mit Fehlern in Power Query
Sie können diesen letzten Schritt der Abfrage aus der Angewendete Schritte Bereich entfernen, indem Sie auf der linken Seite des Namens des Schritts das X-Löschsymbol auswählen. Nachdem Sie diesen Schritt gelöscht haben, zeigt Ihre Abfrage die richtigen Ergebnisse an.
Beachten Sie jedoch, dass keiner der Spalten, die aus den Dateien abgeleitet sind (Datum, Land, Einheiten, Umsatz), einen bestimmten Datentyp zugewiesen haben. Weisen Sie den richtigen Datentyp jeder Spalte mithilfe der folgenden Tabelle zu.
Spaltenname | Datentyp |
---|---|
Datum | Datum |
Land | Text |
Einheiten | Ganze Zahl |
Einnahme | Währung |
Nachdem Sie die Datentypen für jede Spalte definiert haben, können Sie die Tabelle laden.
Anmerkung
Informationen zum Definieren oder Ändern von Spaltendatentypen finden Sie unter Datentypen.
Verifizierung
Um zu überprüfen, ob alle Dateien kombiniert werden, können Sie das Filtersymbol auf der Source.Name Spaltenüberschrift auswählen, das alle Namen der kombinierten Dateien anzeigt. Wenn die Warnung „Liste ist möglicherweise unvollständig“ angezeigt wird, wählen Sie unten im Menü Mehr laden aus, um weitere verfügbare Werte in der Spalte anzuzeigen.
Nachdem Sie "Weitereladen" ausgewählt haben, werden alle verfügbaren Dateinamen angezeigt.