Wenn eine Charge von TXT-Dateien alle überflüssige Zeilen mit derselben Struktur enthält, ist das Öffnen und einzelne Löschen sehr ineffizient. Dieser Artikel zeigt anhand von HeSoft Doc Batch Tool , wie Sie mehrere TXT-Dateien importieren, unter „Mit Formel unscharf Text suchen“ Platzhalter-RegEx-Regeln wie Annex [A-Z] eingeben und das Ersetzungsfeld leer lassen, um so alle vollständigen Zeilen zu löschen, die die Ziel-Schlüsselwörter enthalten – ideal für Textbereinigung, Protokollbereinigung und Datenarchivierung.
In der täglichen Büroarbeit werden TXT-Textdateien häufig zum Speichern von Verzeichnissen, Protokollen, Datenexporten oder systemgenerierten Erläuterungen verwendet. Sie sind leichtgewichtig und einfach zu öffnen, haben aber auch ein häufiges Problem: Wenn viele Dateien vorhanden sind, wird jede scheinbar einfache Bereinigungsaktion zu einer sich wiederholenden Arbeit. Beispielsweise enthalten mehrere Textdateien erklärende Anhangszeilen wie Annex A, Annex B, Annex C, und Sie möchten nur das Hauptverzeichnis und den Hauptinhalt behalten. Wenn Sie jede Datei einzeln öffnen und löschen, verschwenden Sie nicht nur Zeit, sondern es kommt aufgrund von Ermüdung auch leicht zu versehentlichem Löschen oder Übersehen.
Dieser Artikel stellt eine Methode vor, die sich besser für die Stapelverarbeitung im Büro eignet: Verwenden Sie HeSoft Doc Batch Tool und nutzen Sie die Funktion „Vollständige Zeilen in Textdateien anhand von Schlüsselwörtern suchen und ersetzen“ in Kombination mit Platzhalter- und regulären Ausdrücken, um ganze Zeilen mit bestimmten Schlüsselwörtern stapelweise zu löschen. Es ersetzt nicht einfach ein bestimmtes Wort, sondern findet und löscht eine ganze Zeile nach einer Regel und eignet sich daher besonders für die Verarbeitung von strukturiertem Text wie Verzeichniszeilen, Kommentarzeilen, Protokollzeilen, nummerierten Zeilen usw.
Im Folgenden werden die Anwendungsszenarien, die Ergebnisse vor und nach der Verarbeitung, die Softwareschritte und wichtige Hinweise erläutert, damit Sie nach der Lektüre die Stapelbereinigung von TXT-Dateien selbst durchführen können.
Anwendungsszenarien: Stapelweises Löschen von regelmäßigen Inhalten in Textdateien
Wenn Ihre Textdateien Inhalt in einem festen Format enthalten, der bereinigt werden muss, können Sie die Verwendung von Platzhaltern und regulären Ausdrücken in Betracht ziehen. Mit festem Format ist nicht unbedingt ein völlig identischer Text gemeint, sondern auch Inhalte, die „am Anfang gleich sind und sich im weiteren Verlauf ändern“. Wie zum Beispiel Annex A, Annex B, Annex C, Annex D in diesem Artikel – obwohl die Buchstaben unterschiedlich sind, folgen sie alle dem Muster „Annex“ gefolgt von einem Leerzeichen und einem Großbuchstaben.
Diese Methode eignet sich für folgende Szenarien:
- In mehreren TXT-Dateien gibt es gleichartige Anhangszeilen, Erläuterungszeilen, die stapelweise gelöscht werden müssen;
- In Protokolldateien existieren Datensatzzeilen, die ein bestimmtes Kennzeichen enthalten und einheitlich bereinigt werden sollen;
- In Datenexportdateien gibt es wiederholte Kopfzeilen, Kommentare, Seitenzahlen, die entfernt werden müssen;
- In Textmaterialien gibt es regelmäßige Zeilen wie „Chapter 1“, „Chapter 2“ oder „Annex A“, „Annex B“, die nach Regeln verarbeitet werden sollen;
- Sie möchten eine Stapeltextbereinigung mit Bürosoftware durchführen, ohne Skripte schreiben zu müssen.
HeSoft Doc Batch Tool ist ein Tool zur Stapelverarbeitung von Dokumenten in Bürosoftware. Sein Wert liegt nicht in der Bearbeitung einzelner Dateien, sondern darin, dieselbe Verarbeitungsaktion auf mehrere Dateien anzuwenden. Für Benutzer, die häufig TXT-Dateien, Textmaterialien und Stapelexporte verarbeiten, können solche Funktionen den sich wiederholenden Arbeitsaufwand erheblich reduzieren.
Ergebnisvorschau: Datei- und Inhaltsstatus vor der Stapelverarbeitung
Vor der Verarbeitung befinden sich im Beispielordner 5 TXT-Dateien, nämlich 1.txt, 2.txt, 3.txt, 4.txt, 5.txt. Das bedeutet, dass es sich diesmal nicht um die Bearbeitung einer einzelnen Datei handelt, sondern um die Anwendung einer einheitlichen Regel auf eine Gruppe von Textdateien.

Wenn Sie 1.txt öffnen, sehen Sie am Anfang der Datei die Überschrift „Annexes“ und darunter die Einträge Annex A, Annex B, Annex C, Annex D usw. Diese Zeilen enthalten zusätzlich unterschiedliche Beschreibungstexte, z. B. „Food and drink standards - revised 2020“, „The secondary school analysed meal“ usw. Die rot markierten Einträge von Annex A bis Annex D sind die Zielzeilen, die diesmal gelöscht werden sollen.

Wenn Sie nur normales Suchen und Ersetzen verwenden, müssten Sie möglicherweise Annex A, Annex B, Annex C, Annex D und sogar noch mehr Buchstaben separat verarbeiten. Dies würde die Anzahl der Regeln erhöhen und wäre für eine spätere Wiederverwendung nicht förderlich. Ein sinnvollerer Ansatz ist es, diese Inhalte mit einem einzigen Ausdruck zusammenzufassen, z. B. Annex [A-Z], damit die Software gleichartige Zeilen von Annex A bis Annex Z automatisch erkennt.
Ergebnisvorschau: Die Zielzeilen wurden nach der Verarbeitung vollständig gelöscht
Nach Abschluss der Stapelverarbeitung können Sie die generierten Textdateien überprüfen. Sie werden feststellen, dass die ursprünglichen Zeilen Annex A, Annex B, Annex C, Annex D verschwunden sind. Am Anfang der Datei ist „Annexes“ erhalten geblieben, gefolgt von Contents und den konkreten Verzeichniseinträgen. Die rot markierte Position zeigt, dass der Zielbereich bereinigt wurde.

Dieses Verarbeitungsergebnis zeigt, dass die Software nicht nur die Zeichenkette „Annex A“ gelöscht hat, sondern die gesamte Zeile, die den übereinstimmenden Inhalt enthält. Für die Stapelbereinigung von Text ist dies ein entscheidender Punkt. Wenn nur das Schlüsselwort gelöscht wird, können die nachfolgenden Beschreibungstexte zurückbleiben. Das Löschen der gesamten Zeile sorgt dafür, dass nutzlose Datensätze vollständig verschwinden.
Schritte: Vom Importieren der Dateien bis zum Einrichten der regulären Löschregel
Schritt 1: Die entsprechende Funktion im Texttool finden
Nach dem Start von HeSoft Doc Batch Tool sehen Sie auf der linken Seite mehrere Toolkategorien, darunter Word-Tools, Excel-Tools, PowerPoint-Tools, PDF-Tools, Texttools usw. Da es sich bei der aktuellen Verarbeitung um TXT-Textdateien handelt, müssen Sie „Texttools“ auswählen.
Wählen Sie auf der Seite der Texttools „Vollständige Zeilen in Textdateien anhand von Schlüsselwörtern suchen und ersetzen“. Der Beschreibung im Screenshot können Sie entnehmen, dass diese Funktion dazu dient, ganze Zeilen, die ein bestimmtes Schlüsselwort enthalten, in Textdateien stapelweise zu löschen oder durch neuen Text zu ersetzen.

Der Grund für die Auswahl dieser Funktion ist einfach: Wir möchten die gesamte Zeile löschen, nicht nur ein bestimmtes Wort. Das „Vollständige Zeilen“ im Funktionsnamen entspricht genau der Anforderung.
Schritt 2: Die zu verarbeitenden TXT-Dateien stapelweise importieren
Nach dem Aufrufen der Funktionsseite besteht der erste Schritt darin, „die zu verarbeitenden Datensätze auszuwählen“. Oben rechts auf der Oberfläche finden Sie Optionen wie „Dateien hinzufügen“ und „Dateien aus Ordner importieren“. Bei wenigen Dateien können Sie diese direkt hinzufügen; bei einer großen Anzahl von TXT-Dateien im selben Ordner eignet sich der Import aus einem Ordner besser.
Im Beispiel wurden bereits 5 Textdateien importiert. Die Liste zeigt Informationen wie Dateiname, Pfad, Erweiterung, Erstellungszeitpunkt und Änderungszeitpunkt an. Hier sehen Sie, dass der Dateipfad unter D:\test\ liegt und die Erweiterung aller Dateien txt ist.

Klicken Sie nach dem Import nicht sofort auf den nächsten Schritt. Es wird empfohlen, zunächst drei Informationen zu prüfen: Erstens, ob die Anzahl der Dateien korrekt ist; zweitens, ob die Dateierweiterungen alle txt sind, die verarbeitet werden sollen; drittens, ob der Pfad dem Zielverzeichnis entspricht. Klicken Sie nach der Bestätigung auf „Weiter“.
Schritt 3: Suchmodus auf unscharfe Formelsuche einstellen
Nachdem Sie zu „Verarbeitungsoptionen einrichten“ gelangt sind, müssen Sie zunächst den Suchmodus festlegen. Im Screenshot ist die Option „Unschärfe Formelsuche für Text verwenden“ ausgewählt. Diese Option eignet sich, um Text mit Platzhaltern, Bereichsausdrücken oder regex-ähnlichen Regeln abzugleichen.

Bei der Auswahl der normalen exakten Suche kann normalerweise nur fester Text abgeglichen werden. Inhalte wie Annex A, Annex B, Annex C sind zwar ähnlich, aber nicht identisch. Mit der unscharfen Formelsuche können Sie mehrere Varianten mit einer einzigen Regel abdecken.
Schritt 4: Annex [A-Z] in die Schlüsselwortliste eingeben
Geben Sie in die linke „Liste der zu suchenden Schlüsselwörter“ Folgendes ein:
Annex [A-Z]
Dieser Ausdruck dient dazu, Text abzugleichen, bei dem auf „Annex“ ein Großbuchstabe folgt. Die Beispiele Annex A, Annex B, Annex C, Annex D im Beispiel entsprechen alle dieser Regel. Da diese Funktion die gesamte Zeile verarbeitet, die das Schlüsselwort enthält, werden diese Zeilen als Ganzes als zu verarbeitende Zeilen erkannt.
In der Praxis können Sie den Ausdruck auch an Ihren eigenen Dateiinhalt anpassen. Wenn Sie beispielsweise nummerierte Zeilen abgleichen möchten, können Sie einen Ausdruck entwerfen, der dem Nummerierungsmuster entspricht. Wenn Sie Zeilen mit einem festen Präfix abgleichen möchten, können Sie das feste Präfix in die Schlüsselwortliste schreiben. Dieser Artikel geht jedoch nicht näher auf andere Regeln ein, der Schwerpunkt liegt auf dem Verständnis des Konzepts, „eine Gruppe ähnlicher Zeilen mit einem einzigen Ausdruck abzugleichen“.
Schritt 5: Ersatzinhalt leer lassen, um die gesamte Zeile zu löschen
Der rechte Bereich ist die „Liste der Schlüsselwörter nach dem Ersetzen“. Im Screenshot ist dieser Bereich leer, und die Benutzeroberfläche zeigt den Hinweis „Leer lassen bedeutet Löschen“. Wenn Ihr Ziel also darin besteht, die übereinstimmende Zeile zu löschen, lassen Sie die rechte Seite leer und geben Sie keine Leerzeichen, Symbole oder sonstigen Text ein.
Dieser Punkt ist sehr wichtig. Leer lassen bedeutet Löschen. Wenn Sie andere Inhalte eingeben, führt das Verarbeitungsergebnis dazu, dass die Zielzeile durch den angegebenen Text ersetzt und nicht entfernt wird. Nachdem Sie den Ausdruck auf der linken Seite und den leeren Status auf der rechten Seite bestätigt haben, klicken Sie auf „Weiter“.
Schritt 6: Speicherort festlegen und Verarbeitung starten
Gemäß dem Prozess oben auf der Seite sind die nachfolgenden Schritte „Speicherort festlegen“ und „Verarbeitung starten“. Der Speicherort wird verwendet, um anzugeben, wohin die verarbeiteten Dateien ausgegeben werden. Das stapelweise Löschen ist eine nicht zu vernachlässigende Inhaltsänderung. Es wird empfohlen, die Ergebnisse an einem neuen Speicherort zu speichern, um einen Vergleich mit den Originaldateien zu erleichtern.
Nachdem Sie den Speicherort festgelegt haben, beginnen Sie mit der Verarbeitung. Die Software verarbeitet die Dateien nacheinander gemäß der Importliste. Überprüfen Sie nach Abschluss der Verarbeitung die Ausgabedateien, um festzustellen, ob die Annex-Zeilen wie erwartet gelöscht wurden. Ist das Ergebnis korrekt, können Sie dieselbe Methode auf weitere TXT-Dateien anwenden.
Häufige Fragen und wichtige Hinweise
1. Wird bei dem Ausdruck zwischen Groß- und Kleinschreibung unterschieden?
In den zusätzlichen Optionen im Screenshot gibt es die Einstellung „Groß-/Kleinschreibung ignorieren“. Wenn Ihre Datei möglicherweise gleichzeitig Annex A, annex A oder ANNEX A enthält, können Sie diese Option nach Bedarf aktivieren. Im Beispiel dieses Artikels ist der Zielinhalt in standardmäßiger Großschreibung, daher wurde diese Option nicht besonders berücksichtigt.
2. Warum bleiben nach der Verarbeitung noch Leerzeilen übrig?
Im Screenshot nach der Verarbeitung ist zwischen Annexes und Contents eine Leerzeile erhalten geblieben. Dies hängt normalerweise mit der ursprünglichen Textstruktur und den Zeilenumbrüchen nach dem Löschen der Zeilen zusammen. Der Schwerpunkt dieses Artikels liegt auf dem Löschen der gesamten Zeile, die den übereinstimmenden Inhalt enthält. Ob Leerzeilen weiter entfernt werden sollen, kann je nach tatsächlichem Bereinigungsbedarf in einem weiteren Schritt behandelt werden.
3. Kann man mehrere Suchregeln auf einmal eingeben?
Auf der Oberfläche wird von einer „Liste der zu suchenden Schlüsselwörter“ gesprochen, was bedeutet, dass die Sucheinträge listenartig verwaltet werden können. In der Praxis können Sie bei unterschiedlichen Regelkategorien diese separat eintragen. Es wird jedoch empfohlen, zunächst mit einer Regel zu testen, die korrekte Ausgabe zu bestätigen und dann weitere Regeln hinzuzufügen, um einen zu großen Übereinstimmungsbereich zu vermeiden.
4. Ist vor der Verarbeitung eine Sicherung erforderlich?
Es wird empfohlen, die Originaldateien aufzubewahren oder die Ergebnisse in einem neuen Ordner auszugeben. Der größte Vorteil der Stapelverarbeitung ist die Geschwindigkeit, aber das bedeutet auch, dass sich eine fehlerhafte Regel schnell auf viele Dateien auswirken kann. Ein sichererer Büro-Workflow ist: zuerst sichern, dann testen und schließlich stapelweise ausführen.
Zusammenfassung: Steigerung der Effizienz der Textbereinigung durch regelbasierte Stapelverarbeitung
Dieser Artikel hat demonstriert, wie Sie mit HeSoft Doc Batch Tool ganze Zeilen, die ein bestimmtes Schlüsselwort enthalten, stapelweise aus TXT-Dateien löschen können. Der Kernprozess ist: Texttools aufrufen, „Vollständige Zeilen in Textdateien anhand von Schlüsselwörtern suchen und ersetzen“ auswählen, mehrere TXT-Dateien importieren, „Unschärfe Formelsuche für Text verwenden“ auswählen, Annex [A-Z] eingeben, den Ersatzinhalt leer lassen und schließlich den Speicherort festlegen und die Verarbeitung starten.
Im Vergleich zur manuellen Bearbeitung eignet sich diese Methode besser für eine große Anzahl von Dateien, sich wiederholende Inhalte und die regelbasierte Textbereinigung. Solange die Zielzeilen ein klares Muster aufweisen, können Sie die sich wiederholende Arbeit mit Platzhaltern und regulären Ausdrücken der Bürosoftware überlassen. Es wird empfohlen, vor der Verarbeitung einer großen Anzahl von Dateien einige Testdateien auszuwählen und die Regel zu testen, und nach Bestätigung der Korrektheit die Stapelausführung zu starten, um sowohl Effizienz als auch Sicherheit zu gewährleisten.