Warum SQL und Datenbanken für Excel-Nutzer wichtig sind
Stellt euch vor, eure Firma speichert alle Kundendaten, Verkaufszahlen oder Produktdetails in einer großen Datenbank. Excel-Dateien sind dafür oft nicht geeignet, weil sie bei sehr großen Datenmengen langsam werden und nicht gut für mehrere Benutzer gleichzeitig funktionieren. Datenbanken wie MySQL, PostgreSQL, SQL Server oder Oracle sind dafür optimiert, riesige Datenmengen effizient zu speichern, zu verwalten und abzurufen.
Als Excel-Nutzer ist es unglaublich wertvoll, wenn ihr wisst, wie ihr direkt auf diese Datenbanken zugreifen könnt. Anstatt jemanden zu bitten, euch einen Export zu schicken, der vielleicht veraltet ist, könnt ihr euch die benötigten Daten jederzeit selbst holen. Das ermöglicht euch, immer mit den aktuellsten Informationen zu arbeiten und eure Analysen auf einer soliden, aktuellen Datenbasis aufzubauen. Außerdem könnt ihr genau die Daten abfragen, die ihr braucht, und müsst nicht riesige, unübersichtliche Exporte verarbeiten.
Daten aus einer Datenbank abrufen – Der Power Query Weg
Der modernste und flexibelste Weg, Daten aus externen Quellen in Excel zu importieren, führt über Power Query. Power Query ist ein mächtiges Tool zum Importieren, Bereinigen und Transformieren von Daten, das direkt in Excel integriert ist (ab Excel 2010 als Add-In, ab Excel 2016 fest integriert). Es ist ein echter Game-Changer für jeden, der mit Daten arbeitet.
Um Daten aus einer Datenbank abzurufen, geht ihr im Excel-Menüband auf die Registerkarte "Daten". In der Gruppe "Daten abrufen & transformieren" klickt ihr auf "Daten abrufen" und dann auf "Aus Datenbank". Hier seht ihr verschiedene Datenbanktypen, wie "Aus SQL Server-Datenbank", "Aus Access-Datenbank", "Aus IBM DB2-Datenbank" und viele mehr. Wählt den Datenbanktyp aus, auf den ihr zugreifen möchtet. Für die meisten Unternehmensanwendungen ist dies oft eine SQL Server-Datenbank.
Es öffnet sich ein Dialogfeld, in dem ihr die Server- und Datenbankinformationen eingeben müsst. Euer IT-Administrator oder Datenbankverantwortlicher kann euch diese Informationen geben. Dazu gehören der Servername und optional der Datenbankname. Klickt auf "OK". Nun werdet ihr möglicherweise aufgefordert, eure Anmeldeinformationen einzugeben. Dies kann eine Windows-Authentifizierung oder eine Datenbank-Authentifizierung mit Benutzername und Passwort sein.
Nach erfolgreicher Verbindung zeigt Excel einen Navigator an. Hier seht ihr alle Tabellen und Sichten (Views), die in der Datenbank verfügbar sind. Ihr könnt eine oder mehrere Tabellen auswählen, die ihr importieren möchtet. Anstatt die Daten direkt zu laden, empfehle ich dringend, auf "Daten transformieren" zu klicken.
Der Power Query Editor – Daten bereinigen und vorbereiten
Wenn ihr auf "Daten transformieren" klickt, öffnet sich der Power Query Editor. Dies ist ein separates Fenster, in dem ihr eure Daten vor dem Laden in Excel vorbereiten und bereinigen könnt. Dies ist der Ort, an dem die wahre Magie passiert.
Im Power Query Editor könnt ihr eine Vielzahl von Transformationen durchführen, ohne die Originaldaten in der Datenbank zu verändern. Ihr könnt zum Beispiel:
- Spalten entfernen, die ihr nicht benötigt.
- Spalten umbenennen, um sie verständlicher zu machen.
- Datentypen ändern, um sicherzustellen, dass Zahlen als Zahlen und Daten als Daten erkannt werden.
- Zeilen filtern, um nur relevante Informationen zu behalten (z.B. nur Verkäufe des letzten Jahres).
- Spalten aufteilen, wenn eine Spalte mehrere Informationen enthält (ähnlich wie "Text in Spalten" in Excel).
- Werte ersetzen, um Inkonsistenzen zu beheben (z.B. "DE" durch "Deutschland" ersetzen).
- Pivot- oder Entpivotieren von Spalten, um die Datenstruktur für eure Analyse anzupassen.
Daten laden und aktualisieren
Nachdem ihr eure Daten im Power Query Editor bereinigt und transformiert habt, klickt ihr auf "Schließen & laden" in der oberen linken Ecke des Editors. Excel lädt die vorbereiteten Daten in ein neues Arbeitsblatt als Excel-Tabelle. Diese Tabelle ist nun mit eurer Datenbank verbunden.
Um die Daten später zu aktualisieren, geht einfach in die geladene Tabelle in Excel, klickt mit der rechten Maustaste auf die Tabelle und wählt "Aktualisieren". Alternativ könnt ihr auch im Menüband auf der Registerkarte "Daten" in der Gruppe "Abfragen & Verbindungen" auf "Alle aktualisieren" klicken, um alle externen Datenverbindungen in eurer Arbeitsmappe zu aktualisieren.
SQL-Abfragen direkt in Excel verwenden (Optional)
Für fortgeschrittene Benutzer, die bereits SQL-Kenntnisse besitzen, bietet Power Query auch die Möglichkeit, eigene SQL-Abfragen zu schreiben. Anstatt Tabellen über den Navigator auszuwählen, könnt ihr eine SQL-Abfrage eingeben, die genau die Daten abruft, die ihr benötigt, und sogar Filter und Joins direkt in der Abfrage definiert.
Wenn ihr im Dialogfeld "Aus Datenbank" seid und die Server- und Datenbankinformationen eingegeben habt, könnt ihr die Option "Erweiterte Optionen" erweitern. Dort findet ihr ein Feld für eine "SQL-Anweisung". Hier könnt ihr eure SELECT-Anweisung eingeben, um spezifische Daten abzurufen. Zum Beispiel:
SELECT
CustomerID,
OrderDate,
TotalAmount
FROM
SalesOrders
WHERE
OrderDate >= '2024-01-01'
Diese Abfrage würde nur Kunden-IDs, Bestelldaten und Gesamtbeträge aus der Tabelle "SalesOrders" abrufen, die nach dem 1. Januar 2024 getätigt wurden. Das Schreiben eigener SQL-Abfragen gibt euch die maximale Kontrolle über die abgerufenen Daten.
Fazit und nächste Schritte
Der direkte Zugriff auf Datenbanken über Power Query in Excel ist ein enormer Vorteil für jeden, der regelmäßig mit größeren und dynamischen Datenmengen arbeitet. Es ermöglicht euch, unabhängig zu sein, immer mit den aktuellsten Daten zu arbeiten und eure Analysen auf einer viel solideren Grundlage aufzubauen, als es mit statischen Excel-Importen der Fall wäre.
Beginnt damit, die Grundlagen des Datenabrufs über Power Query zu verstehen und übt das Bereinigen und Transformieren der Daten im Power Query Editor. Wenn ihr tiefer einsteigen wollt, ist das Erlernen der Grundlagen von SQL ein lohnenswerter Schritt, der eure Fähigkeiten im Umgang mit Daten exponentiell erweitern wird.
Welche Datenbanken habt ihr in eurem Arbeitsalltag, auf die ihr gerne zugreifen würdet?
Keine Kommentare:
Kommentar veröffentlichen