Was genau machen die Werkzeuge "Text in Spalten" und "Duplikate entfernen"? Das Werkzeug "Text in Spalten" nimmt den Inhalt einer Zelle (oder einer ganzen Spalte) und teilt ihn in mehrere Spalten auf. Die Aufteilung erfolgt basierend auf einem Trennzeichen, das die einzelnen Informationseinheiten voneinander trennt (wie ein Komma, Semikolon, Tabulator oder Leerzeichen), oder basierend auf einer festen Breite der einzelnen Felder. Das Werkzeug "Duplikate entfernen" durchsucht einen ausgewählten Datenbereich nach doppelten Zeilen und entfernt diese automatisch, sodass nur die eindeutigen Zeilen übrig bleiben.
Warum solltest du diese Datenbereinigungswerkzeuge verwenden? Sie sind absolut notwendig, um deine Daten in ein Format zu bringen, das für Berechnungen, Filterung, Sortierung und Pivot-Tabellen geeignet ist. Mit "Text in Spalten" kannst du zum Beispiel eine Spalte mit vollen Namen in separate Spalten für Vor- und Nachname aufteilen, Adressen in Straße, Postleitzahl und Stadt trennen oder Datum und Uhrzeit, die in einer Zelle kombiniert sind, aufteilen. Dies ermöglicht es dir, mit den einzelnen Teilen der Informationen separat zu arbeiten. Mit "Duplikate entfernen" stellst du sicher, dass jede Entität in deiner Liste (z. B. jeder Kunde, jedes Produkt) nur einmal vorkommt. Doppelte Einträge können Analysen verzerren oder unnötigen Aufwand verursachen. Beide Werkzeuge sparen dir die Zeit und den Aufwand für manuelle Textmanipulationen oder das händische Suchen und Löschen von Duplikaten und reduzieren das Risiko von Fehlern erheblich.
Beginnen wir mit dem Werkzeug "Text in Spalten". Angenommen, du hast in Spalte A eine Liste von Namen im Format "Nachname, Vorname" und möchtest diese in zwei separate Spalten aufteilen: eine für den Nachnamen und eine für den Vornamen. Wähle die Spalte aus, die die Texte enthält, die du aufteilen möchtest (in unserem Beispiel Spalte A). Gehe im Menüband zum Reiter "Daten". In der Gruppe "Datentools" klicke auf den Button "Text in Spalten". Es öffnet sich der "Text in Spalten-Assistent".
Im Schritt 1 von 3 wählst du den Dateityp aus, der beschreibt, wie die einzelnen Datenfelder in deinen Zellen getrennt sind. Wähle "Getrennt" aus, wenn die Felder durch Zeichen wie Kommas, Semikolons, Tabulatoren oder Leerzeichen voneinander getrennt sind (dies ist am häufigsten der Fall). Wähle "Feste Breite" aus, wenn die Felder in Spalten fester Breite ausgerichtet sind, mit Leerzeichen dazwischen (dies ist seltener bei modernen Daten). Klicke auf "Weiter >".
Im Schritt 2 von 3 wählst du das oder die Trennzeichen aus, die Excel verwenden soll, um den Text aufzuteilen. Setze ein Häkchen bei dem Trennzeichen, das deine Daten trennt, in unserem Beispiel "Komma". Du kannst auch weitere Trennzeichen auswählen (z. B. "Leerzeichen"), wenn deine Daten durch verschiedene Zeichen getrennt sind. Die Option "Behandeln von aufeinander folgenden Trennzeichen als ein Trennzeichen" ist nützlich, wenn mehrere Leerzeichen oder Trennzeichen hintereinander als ein einzelnes Trennzeichen behandelt werden sollen. Im unteren Bereich "Datenvorschau" siehst du, wie deine Daten mit den ausgewählten Trennzeichen aufgeteilt werden. Überprüfe, ob die Aufteilung korrekt aussieht. Klicke auf "Weiter >".
Im Schritt 3 von 3 nimmst du die letzten Einstellungen vor. Im Bereich "Datenvorschau" siehst du die Spalten, die Excel erstellen wird. Du kannst auf jede Spalte in der Vorschau klicken, um das Spalten-Datenformat festzulegen. Wähle das passende Format für jede Spalte aus: "Standard" (Excel entscheidet automatisch), "Text" (gut für Codes, die führende Nullen haben könnten, wie Postleitzahlen), "Datum" (wenn die Spalte Datumsangaben enthält, wähle das Format) oder "Nicht importieren (Spalte überspringen)", wenn du eine der aufgeteilten Spalten nicht benötigst. Im Feld "Ziel" klicke in das Feld und wähle dann die einzelne Zelle aus, in der die linke obere Ecke deiner aufgeteilten Daten erscheinen soll. Stelle sicher, dass in den Spalten rechts von dieser Zelle keine wichtigen Daten stehen, da das Werkzeug "Text in Spalten" die bestehenden Daten in diesen Spalten überschreiben wird! Klicke auf "Fertig stellen". Excel teilt nun den Text aus deiner Quellspalte in die angegebenen Zielspalten auf.
Nun zum Werkzeug "Duplikate entfernen". Angenommen, du hast eine lange Liste von Kundennamen und E-Mail-Adressen, und du weißt, dass es in der Liste doppelte Einträge für dieselben Kunden geben könnte, die du entfernen möchtest, um eine saubere Liste zu erhalten. Wähle den Datenbereich aus, aus dem du Duplikate entfernen möchtest (dies kann eine einfache Liste oder eine Intelligente Tabelle sein). Wähle am besten den gesamten Bereich, der alle Spalten enthält, die zur Definition eines eindeutigen Eintrags wichtig sind. Gehe im Menüband zum Reiter "Daten". In der Gruppe "Datentools" klicke auf den Button "Duplikate entfernen". Es öffnet sich das Dialogfenster "Duplikate entfernen".
Im Bereich "Spalten" siehst du eine Liste aller Spalten in dem von dir ausgewählten Datenbereich. Aktiviere die Kontrollkästchen für die Spalten, die Excel zur Identifizierung von Duplikaten verwenden soll. Eine Zeile wird als Duplikat betrachtet und entfernt, wenn alle Werte in den ausgewählten Spalten in dieser Zeile mit den Werten in den gleichen Spalten einer anderen Zeile übereinstimmen. Wenn du Duplikate basierend auf *allen* Spalten in deinem Bereich finden möchtest, klicke auf "Alle auswählen". Wenn nur bestimmte Spalten für die Duplikat-Erkennung relevant sind (z. B. E-Mail und Name, aber nicht die Telefonnummer), wähle nur diese Spalten aus. Wenn deine Daten Überschriften haben, stelle sicher, dass das Kontrollkästchen "Meine Daten haben Überschriften" aktiviert ist, damit die erste Zeile nicht als Teil der Daten behandelt wird. Klicke auf "OK".
Excel durchsucht nun den von dir ausgewählten Bereich. Es entfernt die doppelten Zeilen direkt aus deiner Liste (die erste gefundene Instanz einer doppelten Zeile bleibt erhalten, die nachfolgenden Duplikate werden gelöscht) und zeigt dir eine Meldung an, wie viele Duplikate gefunden und entfernt wurden und wie viele eindeutige Werte verbleiben. Wichtig: Das Entfernen von Duplikaten ist eine permanente Aktion, die Daten werden gelöscht. Es ist ratsam, eine Kopie deiner Datenliste zu erstellen, bevor du "Duplikate entfernen" anwendest, falls du die ursprüngliche Liste doch noch benötigst.
Sowohl "Text in Spalten" als auch "Duplikate entfernen" sind statische Werkzeuge. Wenn du sie einmal angewendet hast und sich die Quelldaten später ändern (neuer Text in der Ursprungsspalte oder neue Duplikate werden hinzugefügt), musst du die Werkzeuge erneut ausführen, um die Änderungen zu übernehmen. Für dynamische Datenbereinigung, die sich automatisch aktualisiert, wären Power Query oder Formeln mit Dynamic Arrays die passenderen Werkzeuge. Aber für die schnelle Bereinigung von statischen Daten sind diese Werkzeuge unschlagbar einfach und effizient.
Die Werkzeuge "Text in Spalten" und "Duplikate entfernen" sind grundlegende und sehr nützliche Funktionen in Excel für die Datenbereinigung und -vorbereitung. Sie helfen dir, häufige Probleme mit Textformaten und doppelten Einträgen schnell zu beheben, sodass deine Daten sauber und bereit für die Analyse sind. Wenn du regelmäßig Daten aus verschiedenen Quellen importierst, sollten diese Werkzeuge ein fester Bestandteil deines Arbeitsablaufs werden.
Mit den Werkzeugen zur Datenbereinigung hast du heute zwei weitere praktische Werkzeuge in deine Excel-Zauberkiste aufgenommen, die dir helfen, deine Daten für die Analyse vorzubereiten. Nutze "Text in Spalten", um Daten aufzuteilen, und "Duplikate entfernen", um deine Listen zu bereinigen. In den nächsten Artikeln von Excel Zauber werden wir uns weiteren fortgeschrittenen Techniken und Funktionen widmen, die dich auf deinem Weg zum Excel-Meister weiter begleiten werden. Bleib sauber und lass dich weiterhin von der Magie von Excel verzaubern!
Keine Kommentare:
Kommentar veröffentlichen