Wenn es notwendig ist, alle Zeilen, die einem bestimmten Muster entsprechen, aus mehreren Textdateien zu löschen, ist die manuelle Bearbeitung sehr ineffizient. In diesem Artikel wird am Beispiel des Löschens von Anhängen wie Annex A und Annex B erläutert, wie Sie mehrere TXT-Dateien in HeSoft Doc Batch Tool importieren, die Funktion zum Suchen und Ersetzen ganzer Zeilen auswählen, den regulären Ausdruck Annex [A-Z] als Platzhalter verwenden und durch Leerlassen der Ersetzungsliste die Massenlöschung durchführen, um Benutzern bei der schnellen Bereinigung großer Textdatenmengen zu helfen.
Wenn viele Büromaterialien konvertiert, exportiert oder zusammengefasst werden, entstehen oft zahlreiche TXT-Textdateien. Diese Dateien enthalten häufig unerwünschte Zeilen, wie z. B. Anhangbeschreibungen, Verzeichnishinweise, Systemmarkierungen, wiederholte Kopfzeilen oder Protokolletiketten. Eine einzelne Datei zu bearbeiten ist nicht schwierig, aber wenn Sie mehrere Textdateien in einem Ordner haben, wird das einzelne Öffnen, Suchen, Löschen und Speichern zu einer typischen ineffizienten Routinearbeit.
Die in diesem Artikel vorgestellte Methode verwendet Platzhalter und reguläre Ausdrücke, um alle übereinstimmenden Zeilen in mehreren Textdateien stapelweise zu löschen. In diesem Beispiel sollen Anhangzeilen wie Annex A, Annex B, Annex C, Annex D gelöscht werden. Ihr gemeinsames Merkmal ist, dass sie mit Annex beginnen, gefolgt von einem Großbuchstaben. Daher kann Annex [A-Z] verwendet werden, um diese Art von Text zusammenzufassen und von einer Bürosoftware automatisch stapelweise verarbeiten zu lassen.
Das in diesem Artikel verwendete Werkzeug ist das im Screenshot gezeigte „ HeSoft Doc Batch Tool “. Es handelt sich um eine dokumentenstapelverarbeitende Software für Büroszenarien, die sich für die zentrale Erledigung wiederkehrender Dateiverarbeitungsaufgaben eignet. Nachfolgend wird der vollständige Ablauf von der Anzeige der Originaldateien bis zum Abschluss der Stapellöschung in der Reihenfolge der tatsächlichen Screenshots beschrieben.
Anwendungsszenarien: Wenn Sie eine „ganze Zeile mit einem Muster“ löschen müssen
In der Textverarbeitung sind das Löschen einiger fester Zeichen und das Löschen einer ganzen Zeile zwei unterschiedliche Anforderungen. Wenn der Inhalt einer Zeile beispielsweise „Annex A Food and drink standards - revised 2020“ lautet, bleibt beim Löschen von nur „Annex A“ der erklärende Text in der Datei, was zu einem unvollständigen Inhalt führen kann. Das eigentliche Ziel ist es, die gesamte Zeile zu löschen, die Annex A enthält.
Die Funktion „Vollständige Zeilen in Textdateien anhand von Schlüsselwörtern suchen und ersetzen“ in HeSoft Doc Batch Tool ist genau auf diese Anforderung ausgerichtet. Sie kann Zielzeilen anhand von Schlüsselwörtern oder Ausdrücken finden und dann die gesamte Zeile ersetzen oder löschen.
Zu den Dateitypen und Geschäftsszenarien, für die die Methode in diesem Artikel geeignet ist, gehören:
- Stapelweises Bereinigen von Anhang-, Verzeichnis- oder Beschreibungszeilen in mehreren .txt-Dateien;
- Löschen aller Datensatzzeilen, die ein bestimmtes Schlüsselwort in Protokolldateien enthalten;
- Bereinigen von aus Systemen exportierten Textdaten, Entfernen wiederholter Kopfzeilen oder Kommentare;
- Verarbeiten umfangreicher Textlisten, Löschen von Zeilen mit festen Präfixen oder Nummerierungsmustern;
- Durchführen einer stapelweisen Textbereinigung ohne Code schreiben oder Skripte ausführen zu müssen.
Wenn es sich bei Ihren Dateien um Word-Dokumente handelt, wie z. B. .docx oder .doc, oder um PDF- oder Excel-Tabellen, sollten Sie in der Software nach dem entsprechenden Werkzeugtyp suchen. Die Screenshots in diesem Artikel zeigen den TXT-Dateiverarbeitungsprozess unter dem Textwerkzeug, daher liegt der Schwerpunkt auf dem stapelweisen Löschen von Zeilen in Textdateien.
Status vor der Verarbeitung: Mehrere TXT-Dateien warten auf eine einheitliche Bereinigung
Sehen wir uns zunächst den Status der Dateien vor der Verarbeitung an. Der Screenshot zeigt, dass sich im selben Ordner 5 Textdateien mit den Namen 1.txt, 2.txt, 3.txt, 4.txt und 5.txt befinden. Sie alle sind für die Stapelverarbeitung vorgesehen.

Wenn wir eine der Textdateien öffnen, sehen wir, dass im Dateiinhalt eine Gruppe von Annex-Zeilen vorhanden ist. Die rot umrandeten Annex A, Annex B, Annex C, Annex D sind der Inhalt, der in diesem Artikel gelöscht werden soll. Auf diese Zeilen folgen unterschiedliche Beschreibungen, was zeigt, dass es sich nicht um exakt denselben festen Text handelt.

Gerade weil sich die Beschreibungen nach jeder Zeile unterscheiden, ist die Verarbeitung über „vollständige Zeilen mit Schlüsselwörtern“ besser geeignet. Wir müssen nur den gemusterten Teil der Zeile erkennen, also Annex plus den Buchstaben, und die Software kann die gesamte Zeile löschen. Es ist nicht notwendig, jede vollständige Zeile einzeln in die Suchliste einzugeben.
Ergebnis nach der Verarbeitung: Alle Zeilen, die der Annex-Regel entsprechen, sind verschwunden
Nach Abschluss der Verarbeitung ist im Ergebnis-Screenshot zu sehen, dass die Zeilen Annex A bis Annex D gelöscht wurden. Die Datei behält die obere Überschrift „Annexes“ sowie das nachfolgende Inhaltsverzeichnis und die nummerierten Einträge bei. Dies zeigt, dass die Verarbeitung zielgenau war und keine irrelevanten Inhalte mitgelöscht wurden.

Der Vorteil dieser Art der Stapelverarbeitung liegt in der Konsistenz der Ergebnisse. Solange in mehreren Dateien Annex-Zeilen mit dem gleichen Muster vorhanden sind, verarbeitet die Software alle importierten Dateien nach derselben Regel, ohne dass eine manuelle Einzelfallprüfung erforderlich ist. Für die Aufbereitung großer Mengen an Textdaten kann dies den Zeitaufwand für sich wiederholende Tätigkeiten erheblich reduzieren.
Arbeitsschritte: Stapellöschung mit HeSoft Doc Batch Tool durchführen
Schritt 1: Öffnen des Textwerkzeug-Funktionsbereichs
Nach dem Öffnen von HeSoft Doc Batch Tool bietet die linke Navigationsleiste Einstiegspunkte für verschiedene Arten von Bürodatei-Verarbeitung, z. B. Word-Werkzeuge, Excel-Werkzeuge, PowerPoint-Werkzeuge, PDF-Werkzeuge und Textwerkzeuge. Da die Beispieldateien die Endung .txt haben, wählen wir den Eintrag „Textwerkzeuge“.
Suchen und wählen Sie in der Liste der Textwerkzeuge den Punkt „Vollständige Zeilen in Textdateien anhand von Schlüsselwörtern suchen und ersetzen“. Im Screenshot befindet sich diese Funktion an zweiter Stelle, mit dem Hinweis: Sie können damit stapelweise vollständige Zeilen, die ein bestimmtes Schlüsselwort in Textdateien enthalten, löschen oder durch neuen Text ersetzen.

Nach der Auswahl dieser Funktion gelangen Sie in einen assistentengeführten Verarbeitungsprozess. Der Assistent hilft Nutzern, in der richtigen Reihenfolge Dateien zu importieren, Regeln festzulegen, den Speicherort einzustellen und die Verarbeitung zu starten – ideal für Büroanwender, die keine Skripte schreiben möchten.
Schritt 2: Hinzufügen oder Importieren mehrerer Textdateien
Im Schritt „Zu verarbeitende Datensätze auswählen“ müssen alle zu verarbeitenden TXT-Dateien zur Liste hinzugefügt werden. Oben rechts in der Oberfläche befinden sich Aktionsschaltflächen wie „Datei hinzufügen“, „Aus Ordner importieren“, „Leeren“ und „Mehr“. Im Beispiel wurden bereits die fünf Dateien 1.txt bis 5.txt importiert.

Die angezeigten Informationen in der Liste umfassen Nummer, Name, Pfad, Erweiterung, Erstellungs- und Änderungsdatum. Anhand dieser Informationen kann die Korrektheit der Dateiauswahl überprüft werden. Beispielsweise zeigt die Spalte „Erweiterung“ txt, und die Spalte „Pfad“ zeigt das Verzeichnis D:\test\ an. Nachdem Sie sich vergewissert haben, dass keine Dateien fehlen oder versehentlich hinzugefügt wurden, klicken Sie unten auf „Weiter“.
Für Stapelverarbeitungsaufgaben ist die Überprüfung der Dateiliste sehr wichtig. Denn die nachfolgenden Regeln werden auf alle Dateien in der Liste angewendet. Wenn versehentlich nicht relevante Dateien in die Liste aufgenommen werden, werden auch diese verarbeitet.
Schritt 3: Suchmethode auf „Text mit Formel unscharf suchen“ einstellen
Nach Aufruf von „Verarbeitungsoptionen einrichten“ sehen Sie als erstes die „Suchmethode“. Im Screenshot gibt es die beiden Optionen „Text exakt suchen“ und „Text mit Formel unscharf suchen“. Da wir mit einem Platzhalter-regulären Ausdruck eine Textklasse abgleichen möchten, wählen wir „Text mit Formel unscharf suchen“.

Diese Auswahl bestimmt die Flexibilität der Suchregeln. Wenn Sie nur einen feststehenden Text suchen möchten, können Sie die exakte Suche verwenden. Wenn Sie variierende Inhalte wie Annex A, Annex B, Annex C abgleichen möchten, ist die unscharfe Formelsuche erforderlich.
Schritt 4: Eingabe der Übereinstimmungsregel Annex [A-Z]
Geben Sie in der linken „Liste der zu suchenden Schlüsselwörter“ Folgendes ein:
Annex [A-Z]
Diese Regel passt auf Texte, in denen auf „Annex“ ein Großbuchstabe folgt. Annex A, Annex B, Annex C und Annex D im Beispiel entsprechen alle dieser Regel. Da die Funktion auf vollständige Zeilen angewendet wird, werden diese Zeilen, die den passenden Inhalt enthalten, als Ganzes behandelt.
Hier ein praktischer Denkansatz: Beobachten Sie vor der Stapelverarbeitung die gemeinsamen Merkmale der Zielzeilen. Kopieren Sie nicht voreilig jede vollständige Zeile in die Suchliste, sondern extrahieren Sie zuerst das Muster. Je eindeutiger das Muster, desto prägnanter der Ausdruck und desto höher der Wert für die spätere Wiederverwendung.
Schritt 5: Liste der ersetzenden Schlüsselwörter leer lassen
Der rechte Bereich ist die „Liste der ersetzenden Schlüsselwörter“, daneben steht der Hinweis „Leer lassen bedeutet Löschen“. Wenn das Ziel also ist, alle übereinstimmenden Zeilen zu löschen, geben Sie auf der rechten Seite keinen Ersatztext ein. Links wird gesucht, rechts bleibt für die Löschung leer.
Wenn Sie auf der rechten Seite Inhalte eingeben, könnte die Software die Ersetzungslogik ausführen und die gefundene Zeile durch den eingegebenen Text ersetzen. Unser Ziel hier ist die Löschung der Annex-Zeilen, also bleibt das Feld am besten leer.
Schritt 6: Speicherort einrichten und Verarbeitung starten
Nachdem Sie die Such- und Löschregeln festgelegt haben, klicken Sie unten auf „Weiter“. Wie in der Fortschrittsleiste zu sehen ist, folgen nun „Speicherort einrichten“ und „Verarbeitung starten“. Der Speicherort bestimmt das Ausgabeverzeichnis für die verarbeiteten Dateien. Es wird empfohlen, die Ausgabeergebnisse getrennt von den Originaldateien zu speichern, um die Unterschiede vor und nach der Verarbeitung leichter vergleichen zu können.
Wenn Sie den Schritt zum Starten der Verarbeitung erreichen, wird die Software die Löschregeln Datei für Datei gemäß der Importliste ausführen. Öffnen Sie nach Abschluss der Verarbeitung einige Ausgabedateien stichprobenartig, um zu bestätigen, dass Zeilen wie Annex A, Annex B gelöscht wurden, während der Haupttext und das Inhaltsverzeichnis erhalten geblieben sind.
Häufige Fragen und Hinweise
1. Sollten die Platzhalter/RegEx-Regeln so breit wie möglich formuliert sein?
Nein. Je breiter die Regel, desto größer der Abgleichbereich und desto höher das Risiko ungewollter Löschungen. Wenn Sie z. B. nur „Annex“ schreiben, könnten alle Zeilen abgeglichen werden, die „Annex“ enthalten, einschließlich solcher, die Sie möglicherweise behalten möchten, wie Überschriftenzeilen. Dieser Artikel verwendet Annex [A-Z], was im Vergleich zu nur „Annex“ zielgerichteter ist.
2. Warum wurde die Überschrift „Annexes“ nicht gelöscht?
Der Beispielausdruck lautet Annex [A-Z] und erfordert ein Leerzeichen und einen Großbuchstaben nach „Annex“. „Annexes“ erfüllt diese Regel nicht, daher wurde es beibehalten. Dies zeigt, wie ein gut durchdachter Ausdruck verhindern kann, dass Inhalte, die nicht gelöscht werden sollen, versehentlich mitgelöscht werden.
3. Kann man die Verarbeitung zuerst mit einigen wenigen Dateien testen?
Das ist empfehlenswert. Obwohl die Stapelverarbeitung effizient ist, sind die Auswirkungen von Regel-Fehlern größer. Sie können zuerst 1 oder 2 Beispieldateien für einen Test importieren, um sicherzustellen, dass das Ergebnis den Erwartungen entspricht, und dann den gesamten Ordner für die Stapelverarbeitung importieren.
4. Wie kann ich die Ergebnisse nach der Verarbeitung überprüfen?
Sie können ein paar Ausgabedateien öffnen und den Inhalt vor und nach der Verarbeitung vergleichen. Im Beispiel dieses Artikels enthielt die Datei vor der Verarbeitung die Zeilen Annex A bis Annex D, nach der Verarbeitung sind diese Zeilen verschwunden, während das Inhaltsverzeichnis und die nachfolgende nummerierte Liste erhalten geblieben sind. Entspricht das Ergebnis diesem Bild, zeigt dies, dass die Regel korrekt eingerichtet war.
Zusammenfassung: Nutzen Sie Bürosoftware für die stapelweise Textbereinigung
Wenn in mehreren Textdateien gleichartige Zeilen vorhanden sind, die gelöscht werden müssen, ist die manuelle Bearbeitung nicht der optimale Ansatz. Mit HeSoft Doc Batch Tool können Sie die sich wiederholende Abfolge aus „Datei öffnen, Inhalt suchen, ganze Zeile löschen, Datei speichern“ in einer einzigen Stapelaufgabe zusammenfassen.
Die entscheidende Einrichtung im Beispiel dieses Artikels ist: Wählen Sie im Textwerkzeug „Vollständige Zeilen in Textdateien anhand von Schlüsselwörtern suchen und ersetzen“, importieren Sie mehrere txt-Dateien, verwenden Sie „Text mit Formel unscharf suchen“, geben Sie Annex [A-Z] ein und lassen Sie die Liste mit den ersetzenden Schlüsselwörtern leer. So können Sie stapelweise alle vollständigen Zeilen löschen, die der Regel Annex gefolgt von einem Buchstaben entsprechen.
Wenn Sie gerade dabei sind, eine große Menge an TXT-Dateien, Protokolldateien oder exportierten Texten zu bereinigen, wird empfohlen, zuerst die gemeinsamen Muster der zu löschenden Inhalte zu analysieren und dann die Stapelverarbeitung mit einem Platzhalter-regulären Ausdruck durchzuführen. Dies kann die sich wiederholende Arbeit erheblich reduzieren, die Effizienz der Dateibereinigung steigern und zu einheitlichen Ergebnissen für mehrere Dateien führen.