Wenn ein Ordner viele TXT-Dateien enthält, aus denen Sie einheitlich Zahlen, Nummerierungen oder Schlüsselwörter mit einem bestimmten Format entfernen müssen, ist das einzeln Öffnen und Bearbeiten sehr ineffizient. Dieser Artikel erklärt anhand des Screenshots HeSoft Doc Batch Tool , wie Sie von einem Textwerkzeug aus die Suchen-und-Ersetzen-Funktion öffnen, mehrere TXT-Dateien importieren, unter den Verarbeitungsoptionen die Formel zur unscharfen Textsuche auswählen, \d+ zum Abgleichen fortlaufender Ziffern eingeben und die Schlüsselwortliste nach dem Ersetzen leer lassen, um so Schlüsselwörter in Form von Ziffern im Textinhalt stapelweise zu löschen.
Viele Büroszenarien sind nicht kompliziert, kosten aber besonders viel Zeit. Zum Beispiel befinden sich in einem Ordner Dutzende oder sogar Hunderte von TXT-Texten, die alle mit unnötigen Zahlen, Nummerierungen oder Statistikwerten durchsetzt sind. Sie können natürlich mit einem Texteditor Datei für Datei öffnen und dann Suchen und Löschen ausführen, aber bei einer großen Anzahl von Dateien vervielfacht sich die sich wiederholende Arbeit schnell, und es ist schwer sicherzustellen, dass jede Datei nach denselben Regeln verarbeitet wird. Dieser Artikel stellt einen Ansatz vor, der besser für die Stapelverarbeitung im Büro geeignet ist: Verwenden Sie HeSoft Doc Batch Tool , um mit Platzhalter- und regulären Ausdrücken Schlüsselwörter stapelweise aus mehreren TXT-Dateien zu löschen.
Das Ziel des Beispiels in diesem Artikel ist es, alle Zahlen im Text zu löschen. Die Verarbeitungsregel verwendet \d+, es kann aufeinanderfolgende Ziffern abgleichen; der Ersetzungsinhalt bleibt leer, was bedeutet, dass der gefundene Inhalt gelöscht wird. Dieser Ablauf eignet sich für Szenarien wie Textdatenbereinigung, stapelweises Entfernen von Nummerierungen, stapelweises Löschen von Statistikzahlen und stapelweises Ordnen gesammelter Texte.
Anwendungsszenario: Mehrere TXT-Dateien in einem Ordner benötigen einheitliche Schlüsselwortlöschung
Wenn Sie nur eine Datei bearbeiten, reicht das Suchen und Ersetzen eines normalen Editors aus. Wenn das Bearbeitungsobjekt jedoch ein ganzer Ordner wird, ist der Effizienzunterschied sehr deutlich. Im Screenshot umfassen die zu verarbeitenden Dateien big_bang.txt, black_holes.txt, dark_energy.txt, dark_matter.txt, galaxies.txt, allesamt Teile derselben Textdaten. Ihre Inhaltsstruktur ist ähnlich, und es können überall Zahlen oder Schlüsselwörter vorhanden sein, die einheitlich bereinigt werden müssen.
Diese Art der Stapelverarbeitung eignet sich für folgende Anforderungen: Stapelweises Löschen von Zahlen aus mehreren TXT-Texten; Stapelweises Bereinigen von Nummerierungen in englischsprachigen Materialien; Stapelweises Löschen von Inhalten mit festem Format in Protokolldateien; Stapelweises Entfernen von Seitenzahlen, laufenden Nummern und Statistikwerten aus Materialien; Stapelweises Ersetzen oder Löschen eines bestimmten sensiblen Wortes; Einheitliche Ausführung derselben Bereinigungsregeln in mehreren Textdokumenten. Im Vergleich zur manuellen Bearbeitung eignen sich die Stapelverarbeitungsfunktionen von Bürosoftware besser für sich wiederholende, regelbasierte Dateiorganisationsaufgaben.
Effektvorschau: Was sind die Probleme mit den Dateien und Inhalten vor der Verarbeitung
Vor der Verarbeitung sind im Ordner mehrere TXT-Textdateien zu sehen. Sie alle sind zu verarbeitende Objekte. Würde man sie einzeln öffnen, prüfen und ändern, entstünde viel repetitive Arbeit.

Nach dem Öffnen von black_holes.txt sieht man im Haupttext viele Zahlen, zum Beispiel „10“, „30“ usw. Diese Zahlen sind im Screenshot besonders hervorgehoben, was zeigt, dass sie die zu löschenden Zielinhalte sind. Für einen einzelnen Artikel scheint das manuelle Löschen nicht schwierig zu sein; aber wenn dieselbe Regel auf mehrere Dateien angewendet werden soll, ist ein Stapelwerkzeug zuverlässiger.

Ergebnis nach der Verarbeitung: Zahlenschlüsselwörter werden durch Leerzeichen ersetzt
Nach Ausführung des stapelweisen Suchens und Ersetzens zeigt die Ansicht derselben Datei, dass die ursprünglichen Zahlen gelöscht wurden. Die grünen Stellen im Screenshot zeigen die leeren Textstellen nach dem Löschen. Beispielsweise werden an den ursprünglichen Positionen der Zahlen keine Inhalte wie „10“ oder „30“ mehr angezeigt, was zeigt, dass die Abgleichregel auf den Text angewendet wurde.

Ein wichtiger Punkt ist hier zu verstehen: Das sogenannte „stapelweise Löschen von Schlüsselwörtern“ ist im Wesentlichen ein „stapelweises Suchen und Ersetzen durch Nichts“. Wenn die Software einen Inhalt findet, der der Regel entspricht, und das Schlüsselwort nach der Ersetzung nicht ausgefüllt ist, wird der gefundene Inhalt entfernt. Diese Methode kann sowohl feste Wörter als auch Textarten löschen, die einer Regel entsprechen.
Bedienungsschritte: Vom Importieren von Dateien bis zum Einrichten der regulären Löschregeln
Schritt 1: Suchen-und-Ersetzen-Funktion im Textwerkzeug öffnen
Wählen Sie nach dem Start von HeSoft Doc Batch Tool in der linken Navigationsleiste „Textwerkzeug“. Klicken Sie in der Funktionsliste auf „Schlüsselwörter in Text suchen und ersetzen“. Aus der Oberflächenbeschreibung geht hervor, dass diese Funktion zum stapelweisen Suchen und Ersetzen von Schlüsselwörtern in Textdateiinhalten dient und sich sehr gut für diese Aufgabe der einheitlichen Bereinigung mehrerer TXT-Dateien eignet.

Das erwartete Ergebnis dieses Schrittes ist der Einstieg in den Ablauf des stapelweisen Suchens und Ersetzens. Die Wahl der richtigen Funktion ist sehr wichtig, denn das diesmalige Bearbeitungsobjekt ist der Textinhalt, nicht Dateinamen, Ordnernamen oder Dateiformatkonvertierung.
Schritt 2: Die zu verarbeitenden Dateien zur Aufgabenliste hinzufügen
Nach dem Betreten der Funktionsseite besteht der erste Schritt darin, „Zu verarbeitende Datensätze auswählen“. Oben rechts auf der Seite werden „Datei hinzufügen“ und „Dateien aus Ordner importieren“ angeboten. Wenn sich alle TXT-Dateien im selben Verzeichnis befinden, ist der Import aus dem Ordner bequemer; wenn nur einige Dateien verarbeitet werden sollen, kann man sie manuell hinzufügen.

Im Beispiel wurden bereits 5 Dateien importiert, die Liste zeigt Informationen wie laufende Nummer, Name, Pfad, Erweiterung, Erstellungszeit, Änderungszeit usw. Nach dem Import wird empfohlen, zwei Punkte zu prüfen: Erstens, ob die Anzahl der Dateien korrekt ist (die Zusammenfassung im Screenshot zeigt 5 Datensätze); zweitens, ob der Pfad auf das zu bearbeitende Verzeichnis verweist, z. B. liegt der Beispielpfad unter D:\test. Klicken Sie nach der Bestätigung unten auf „Weiter“.
Schritt 3: „Formel für unscharfe Textsuche verwenden“ auswählen
Wählen Sie im Bereich „Verarbeitungsoptionen einrichten“ unter „Suchmethode“ die Option „Formel für unscharfe Textsuche verwenden“. Im Screenshot ist diese Option rot umrahmt und ausgewählt. Der Vorteil dieses Modus liegt darin, dass man Regeln ähnlich wie reguläre Ausdrücke verwenden kann, um Text abzugleichen, und nicht nur eine exakte Suche nach einer festen Zeichenkette möglich ist.

Die Wahl von „Text exakt suchen“ eignet sich besser zum Löschen völlig identischer Wörter, z. B. zum Löschen aller Vorkommen des Wortes „Testversion“; im jetzigen Fall sollen jedoch verschiedene Zahlen gelöscht werden, die sich in Länge und Inhalt unterscheiden, daher ist die unscharfe Formelsuche besser geeignet.
Schritt 4: \d+ eingeben, Ersetzungsinhalt leer lassen
Geben Sie in der linken „Liste der zu suchenden Schlüsselwörter“ \d+ ein. Dieser Ausdruck kann eine oder mehrere aufeinanderfolgende Ziffern abgleichen. Beispielsweise würde er „4“, „10“, „100“ und „26000“ als zu verarbeitende Inhalte erkennen.
In der rechten „Liste der Schlüsselwörter nach der Ersetzung“ ist kein Inhalt einzutragen. Der Hinweis auf der Oberfläche „Nicht ausfüllen bedeutet Löschen“ besagt, dass Leerlassen das Löschen bewirkt. Klicken Sie nach Abschluss der Einstellungen weiter auf „Weiter“, um zur Einstellung des Speicherorts zu gelangen, und starten Sie dann gemäß dem Oberflächenablauf die Verarbeitung.
Wenn Sie mehrere Regeln löschen müssen, können Sie diese entsprechend der Eingabemethode der Softwareliste getrennt eintragen. Um fehlerhafte Treffer zu vermeiden, wird empfohlen, zuerst mit einem kleinen Ordner zu testen und die Stapelverarbeitung der formellen Daten erst durchzuführen, nachdem die korrekte Löschwirkung bestätigt wurde.
Häufige Fragen und Hinweise
1. Warum erscheinen nach der Verarbeitung Leerstellen in den Sätzen
Weil im vorliegenden Fall nur die Zahlen selbst gelöscht wurden, nicht aber die Leerzeichen oder Einheiten davor oder danach. Beispielsweise würde aus „10 times“ nach dem Löschen „ times“. Dies ist ein normales Ergebnis. Wenn Sie auch überflüssige Leerzeichen mitverarbeiten möchten, muss die Abgleichregel weiter verfeinert oder im Anschluss an die Zahlenlöschung eine Leerzeichenbereinigung durchgeführt werden.
2. Kann der Platzhalter-RegEx irrtümlich benötigte Zahlen löschen
Das ist möglich. Der Abgleichbereich von \d+ ist sehr breit; alle aufeinanderfolgenden Ziffern können gelöscht werden, einschließlich Jahreszahlen, Entfernungen, Mengen, Nummerierungen usw. Daher muss vor der formellen Verarbeitung unbedingt sichergestellt werden, dass alle diese Zahlen zum zu löschenden Bereich gehören. Bei wichtigen Dateien wird empfohlen, zuerst eine Sicherungskopie zu erstellen oder die Ausgabe an einem neuen Speicherort zu speichern.
3. Kann man nur eine bestimmte Zahl löschen
Wenn Sie nur eine feste Zahl löschen möchten, können Sie einen spezifischeren Suchbegriff verwenden, nicht \d+. Möchten Sie z. B. nur „2026“ löschen, suchen Sie einfach nach „2026“. Wenn Sie eine bestimmte Art von Nummerierung löschen möchten, muss ein präziserer Ausdruck entsprechend der Nummerierungsregel erstellt werden.
4. Ist diese Methode für Word-Dokumente geeignet
Dieser Artikel demonstriert die Vorgehensweise für TXT-Textdateien. Für doc- oder docx-Dokumente von Word sollten die entsprechenden Word-Werkzeuge der Software oder Funktionen, die die Bearbeitung von Dokumentinhalten unterstützen, verwendet werden. Dateien unterschiedlicher Formate haben unterschiedliche Strukturen; es wird empfohlen, vor der Verarbeitung einen Test mit einer Kopie durchzuführen.
Fazit: Mit einem Stapelverarbeitungs-Bürotool die Effizienz der Textbereinigung steigern
Das stapelweise Löschen von Schlüsselwörtern in Textdateien besteht im Wesentlichen darin, die vielen sich wiederholenden Aufgaben Suchen, Ersetzen und Speichern an die Software zu delegieren. HeSoft Doc Batch Tool bietet einen Ablauf zum stapelweisen Importieren von Dateien, regelbasiertem Suchen und Ersetzen durch leeren Inhalt (Löschen) und eignet sich zur Verarbeitung von Zahlen, Nummerierungen und regelhaftem Inhalt in mehreren TXT-Texten.
Wenn Sie häufig Textmaterialien ordnen, Inhalte sammeln, Protokolldateien oder stapelweise Dokumente bearbeiten, wird empfohlen, den Ablauf dieses Artikels als Grundvorlage zu verwenden: Zuerst Dateien importieren, dann „Formel für unscharfe Textsuche verwenden“ wählen, Abgleichregel eingeben, Ersetzungsinhalt leer lassen, zuletzt Speicherort festlegen und ausführen. Dies kann sich wiederholende Arbeit deutlich reduzieren und stellt sicher, dass stapelweise Dateien einheitliche Verarbeitungsergebnisse erhalten.