Power Query: Daten laden, bereinigen, transformieren – alles automatisiert!
Das Problem: Datenchaos ohne Power Query:
- Manuelle Datenbereinigung! Stunden für Copy-Paste!
- Fehlerhafte Daten! Typen durcheinander!
- Keine Automatisierung! Jeden Monat von vorne!
- Mehrere Quellen! Konsolidierung manuell!
- Keine Audit-Trail! Wer hat was geändert?
Die Lösung: Power Query! Automatische Daten-Pipelines, ETL-Workflows, Datencleaning!
In dieser Reihe lernst du: Von grundlegenden Imports bis zu Advanced-Transformationen!
1. Power Query Praxisreihe – Die 8 Module
| Modul | Titel | Level | Fokus | Praktische Cases |
|---|---|---|---|---|
| 1 | Erste Schritte mit Power Query | 🟩 Anfänger | Grundlagen, UI, Erste Query | Excel-Datei laden, einfache Filter |
| 2 | Datenquellen verbinden | 🟩 Anfänger | Excel, CSV, Web, SQL, APIs | CSV-Import, Excel-Multi-Sheet, Web-Table |
| 3 | Datencleaning & Bereinigung | 🟨 Mittel | Duplikate, Fehler, Formate | Duplikate entfernen, Fehler bereinigen, Spalten aufteilen |
| 4 | Transformationen & Aggregationen | 🟨 Mittel | GroupBy, Pivot, Zusammenfassen | Sales aggregieren, Pivot erzeugen, Metriken berechnen |
| 5 | Mehrere Quellen zusammenführen | 🟨 Mittel | Append, Merge, Join | Vertrieb + Lager zusammenbinden, Multi-Source-ETL |
| 6 | Spaltenfunktionen & Berechnungen | 🟨 Mittel | Spalten hinzu, Custom Columns, M-Code | Berechnete Spalten, Text-Operationen, Logik |
| 7 | Advanced: Indizierung & Parameter | 🟥 Fortgeschritten | Index-Spalten, Parameter, Functions | Dynamische Parameter, wiederverwendbare Functions |
| 8 | Komplexe ETL-Pipelines | 🟥 Fortgeschritten | Multi-Step Workflows, Error Handling | End-to-End-Pipeline, Fehlerbehandlung, Logging |
2. MODUL 1: Erste Schritte mit Power Query
🟩 AnfängerWas ist Power Query?
- Extract: Daten aus verschiedenen Quellen laden!
- Transform: Daten reinigen & umformen!
- Load: Ergebnis in Excel/Power Pivot laden!
Die Power Query Oberfläche:
🔧 Erste Query erstellen (Schritt für Schritt):
- Data Tab → Get Data → From File → Excel!
- Datei auswählen (Budget.xlsx)!
- Sheet wählen (z.B. "Sales")!
- Tabelle auswählen!
- Load → Power Query Editor öffnet sich!
- Header-Zeile: Meist automatisch erkannt!
- Datentypen: Spalten-Header → Datentyp ändern!
- Filter: Spalten-Header → Filter einstellen!
- Sortieren: Spalten-Header → Sortierung!
- Home → Close & Load → New Sheet!
- Oder: Close & Load To → Spezifisches Blatt!
- Query ist jetzt im Workbook registriert!
📚 Praktisches Beispiel:
Ausgangsdaten (sales.csv):
- Get Data → From File → CSV!
- Datei: sales.csv auswählen!
- Auto-erkannt: Header Row 1, Separator ","!
- Data Types: Date = Date, Quantity = Whole Number!
- Load → Excel-Tabelle erstellen!
3. MODUL 2: Datenquellen verbinden
🟩 AnfängerDatenquellen im Überblick:
| Quelle | Format | Komplexität | Häufig? |
|---|---|---|---|
| Excel File | .xlsx, .xlsm | Niedrig | ✅✅✅ |
| CSV/Text | .csv, .txt | Niedrig | ✅✅✅ |
| SQL Database | SQL Server, MySQL | Mittel | ✅✅ |
| Web Table | HTML Tabelle | Mittel | ✅ |
| API / JSON | JSON, REST | Hoch | ✅ |
| SharePoint | SharePoint List | Mittel | ✅✅ |
🔧 Verschiedene Quellen laden:
4. MODUL 3: Datencleaning & Bereinigung
🟨 MittelDie häufigsten Datenprobleme:
- 🔴 Duplikate: Gleiche Zeilen mehrfach!
- 🔴 Fehlende Werte: NULL, leer, "#N/A"!
- 🔴 Falsche Typen: "100" als Text statt Zahl!
- 🔴 Whitespace: Leerzeichen am Anfang/Ende!
- 🔴 Inkonsistente Formate: Datum: "01.01.26" vs "1/1/26"!
- 🔴 Unerwünschte Spalten: Index, Debug-Spalten!
🔧 Cleaning-Techniken:
- Select Column → Home → Remove Duplicates!
- Oder: Spalten auswählen, dann Remove Duplicates!
- Resultat: Nur noch unique Zeilen!
- Spalte-Header → "Replace Values"!
- Ersetze: null, #N/A, "" mit Standard (z.B. 0 oder "Unknown")!
- Oder: Zeilen mit null löschen ("Remove Rows" → "Remove Errors")!
- Spalte-Header → Split Column → By Delimiter!
- Beispiel: "FirstName LastName" → Zwei Spalten!
- Oder: By Text Length (für festes Format)!
- Spalten-Header → Data Type Dropdown!
- Wähle: Text, Whole Number, Decimal, Date, etc.!
- Fehler: Wenn Typ nicht passt → #Error anzeigen!
📚 Praktisches Beispiel:
Rohdaten:
- Duplikate: Rows 1-3 = Duplikate! → Remove!
- NULL: Row 4 Name = NULL → Remove oder Fill!
- Case: Name → Proper Case (First Letter Capital)!
- Status: Normalize zu lowercase ("active" nur)!
- Whitespace: TRIM (Name, Email, Phone)!
- Phone: Standardformat (0049...)!
5. MODUL 4: Transformationen & Aggregationen
🟨 MittelGroup By & Aggregation:
- Group By: Daten nach Spalte gruppieren + Aggregat!
- Pivot: Spalten zu Zeilen drehen (Matrix-View)!
- Unpivot: Spalten zu Zeilen machen (normalisieren)!
6. MODUL 5: Mehrere Quellen zusammenführen
🟨 MittelAppend vs. Merge:
| Operation | Zweck | Beispiel |
|---|---|---|
| Append | Zeilen kombinieren (Vertikal) | 2020 Sales + 2021 Sales |
| Merge | Spalten kombinieren (Horizontal/Join) | Sales + Customer Info |
- Query 1 öffnen (z.B. Q1_Sales)!
- Home → Append Queries → Query 2 (Q2_Sales)!
- Result: Q1 + Q2 in einer Tabelle!
- Query 1 öffnen (Sales)!
- Home → Merge Queries → Query 2 (Customer)!
- Select Join-Spalte (z.B. Customer ID)!
- Join Type: Inner, Left, Right, Full Outer!
- Result: Sales + Customer Info in einer Zeile!
7. MODUL 6: Spaltenfunktionen & Berechnungen
🟨 MittelCustom Columns mit M-Code:
- Home → Add Column → Custom Column!
- Formel eingeben (z.B. [Preis] * [Menge])!
- Name eingeben (z.B. "Total")!
- OK!
8. MODUL 7 & 8: Advanced & Komplexe Pipelines
🟥 FortgeschrittenAdvanced Techniken:
- Index-Spalten: Für Seriennummern, Row-Nummern!
- Parameter: Dynamische Werte (z.B. FilterDatum)!
- Functions: Wiederverwendbare Queries!
- Error Handling: try-catch mit try-otherwise!
9. Best Practices für Power Query
2. Applied Steps dokumentieren: Kommentare hinzufügen (Rechtsklick → Rename)!
3. Fehlerhafte Schritte separieren: Nicht: Raw → Final in 1 Query! Lieber: 3 Queries!
4. M-Code erst spät optimieren: UI-Schritte zuerst, dann Code!
5. Backups der Source-Queries: Falls Quelle kaputt geht!
10. Häufige Fehler & Lösungen
11. Checkliste: Bist du bereit für Power Query?
- Ich verstehe Extract → Transform → Load (ETL)
- Ich kann Excel-Dateien in Power Query laden
- Ich kann CSV-Dateien importieren
- Ich kann Web-Tabellen scrapen
- Ich kann Duplikate entfernen
- Ich kann Spalten aufteilen (Split)
- Ich kann Group By nutzen
- Ich kann Queries mergen & appenden
- Ich kann Custom Columns mit M-Code erstellen
- Ich kann eine End-to-End-Pipeline bauen!
Mit Power Query wird Datenchaos zu sauberen Daten! 🚀✨
Nächstes Modul: Modul 1 – Erste Schritte (mit detaillierten Schritt-für-Schritt-Videos & Templates!)