Wenn es in mehreren Word-, docx- oder doc-Dokumenten Inhalte mit ähnlichen, aber nicht identischen Mustern gibt, ist das manuelle Löschen in jeder Datei sehr ineffizient. In diesem Artikel wird am Beispiel von HeSoft Doc Batch Tool gezeigt, wie Sie mit der Funktion "Suchen und Ersetzen von Schlüsselwörtern in Word" und regulären Ausdrücken ungenaue Übereinstimmungen für Großbuchstabenabkürzungen, Zahlen und andere Inhalte finden und das Ersetzungsfeld leer lassen können, um Schlüsselwörter stapelweise zu löschen. Dies eignet sich für die Bearbeitung von Vorlagendokumenten, Kursmaterialien, Vertragsdokumenten und die Bereinigung sensibler Felder in großen Mengen.
Beim Aufräumen vieler Word-Dokumente tritt häufig eine Situation auf: Der zu löschende Inhalt ist kein festes Wort, sondern eine Art von Text mit Regelmäßigkeiten. Beispielsweise befinden sich in Dokumenten dreistellige englische Großbuchstaben-Abkürzungen, Nummerierungen, Stundenzahlen, Vorlagenkennungen usw. Das einzeln Öffnen von docx-Dateien zum Suchen und Löschen ist nicht nur zeitaufwendig, sondern es wird auch leicht etwas übersehen.
Dieser Artikel beschreibt, wie Sie mit der Bürosoftware " HeSoft Doc Batch Tool " Schlüsselwörter stapelweise und unscharf in mehreren Word-, docx- und doc-Dokumenten mithilfe von regulären Ausdrücken löschen können. Der Kerngedanke ist: Text unscharf per Formel suchen, um eine Klasse von Inhalten zu finden; die Liste der zu ersetzenden Schlüsselwörter leer lassen, sodass die Software den gefundenen Inhalt direkt löscht.
Anwendungsszenarien
Diese Methode eignet sich für Word-Stapelbereinigungsaufgaben, bei denen "der Inhalt Regeln folgt, der genaue Text aber nicht völlig identisch ist", zum Beispiel:
- Stapelweises Löschen von Großbuchstaben-Abkürzungen wie BOT, ELA und anderen dreibuchstabigen englischen Codes in mehreren Word-Dokumenten;
- Stapelweises Löschen von Zahlen in docx-Dokumenten, wie Stundenzahlen, Nummerierungen, laufende Nummern, Geldbeträge;
- Bereinigen von Formatierungsmarkierungen, Codes und Platzhaltern in Vorlagendokumenten;
- Einheitliches Suchen, Ersetzen oder Löschen in einer Reihe von Word-Dateien, ohne die Dateien einzeln öffnen zu müssen.
Im Vergleich zur gewöhnlichen "genauen Textsuche" eignen sich reguläre Ausdrücke besser für die unscharfe Suche. Beispielsweise kann [A-Z]{3} aufeinanderfolgende 3 Großbuchstaben finden, \d+ kann eine oder mehrere Ziffern finden.
Ergebnisvorschau: vor und nach der Verarbeitung
Vor der Verarbeitung: Mehrere docx-Dateien müssen einheitlich bereinigt werden
Im Beispiel sind 6 Word-Dokumente zu verarbeiten, das Dateiformat ist jeweils docx. Bei manueller Verarbeitung müsste man 1.docx bis 6.docx einzeln öffnen und Inhalte jeweils suchen und löschen.

Öffnet man eines der Dokumente, sieht man im Text zu bereinigende Inhalte, zum Beispiel BOT im Titel, ELA im Textkörper und die Zahl 60. Diese Inhalte sind nicht unbedingt in jedem Dokument genau gleich, aber sie folgen bestimmten Regeln: drei Großbuchstaben, aufeinanderfolgende Ziffern.

Nach der Verarbeitung: Gefundene Schlüsselwörter wurden stapelweise gelöscht
Nach Abschluss der Verarbeitung wurden die Inhalte, die den Regeln des regulären Ausdrucks entsprachen, aus dem Word-Dokument gelöscht. Im Beispiel wurden die dreibuchstabigen Großbuchstaben-Abkürzungen und die Zahlen entfernt, die Hauptstruktur des Dokuments blieb erhalten.

Der Vorteil dieser Methode liegt darin, dass nicht jedes konkrete Schlüsselwort im Voraus aufgelistet werden muss. Solange das Schlüsselwort der festgelegten Regel entspricht, kann es stapelweise gefunden und gelöscht werden.
Schritte: Stapelweises unscharfes Löschen von Word-Schlüsselwörtern mit regulären Ausdrücken
Schritt 1: Word-Werkzeug öffnen und "Schlüsselwörter in Word suchen und ersetzen" wählen
Öffnen Sie HeSoft Doc Batch Tool und wählen Sie links Word Tools. Suchen und klicken Sie in der Funktionsliste auf "Schlüsselwörter in Word suchen und ersetzen". Diese Funktion dient zum stapelweisen Suchen, Ersetzen oder Löschen von Schlüsselwörtern in Word-Dateiinhalten.

Nach Auswahl dieser Funktion gelangt die Software in einen Assistenten zur Stapelverarbeitung, wo Sie schrittweise Dateien hinzufügen, Suchregeln und Speicherorte festlegen und die Verarbeitung starten.
Schritt 2: Zu verarbeitende Word-, docx-Dateien hinzufügen
Nachdem Sie die Funktionsseite betreten haben, klicken Sie im 1. Schritt "Zu verarbeitende Sätze wählen" auf Dateien hinzufügen, um die zu verarbeitenden Word-Dokumente zur Liste hinzuzufügen. Wenn die Dateien zentral in einem Ordner gespeichert sind, können Sie auch Dateien aus Ordner importieren verwenden.

Nach dem Hinzufügen zeigt die Liste Dateiname, Pfad, Erweiterung, Erstellungsdatum und Änderungsdatum an. Im Beispiel wurden 6 docx-Dateien importiert, was bedeutet, dass diese Dateien alle an der folgenden Batch-Such- und Ersetzungsaufgabe teilnehmen. Klicken Sie unten auf Weiter, nachdem Sie die Dateien überprüft haben.
Schritt 3: "Formel zur unscharfen Textsuche verwenden" wählen
Im 2. Schritt "Verarbeitungsoptionen einrichten" finden Sie die "Suchmethode". Wenn Sie reguläre Ausdrücke für die unscharfe Suche verwenden möchten, sollten Sie Formel zur unscharfen Textsuche verwenden wählen, nicht die normale genaue Textsuche.

Dieser Schritt ist sehr wichtig. Wenn Sie die unscharfe Formelsuche wählen, gleicht die Software Word-Inhalte gemäß den eingegebenen Ausdrucksregeln ab, anstatt nur nach einem bestimmten festen Wort zu suchen.
Schritt 4: Auszufüllende reguläre Ausdrücke für die Löschung eingeben
Geben Sie links in die Liste der zu suchenden Schlüsselwörter die abzugleichenden Regeln ein. Im Beispiel wurden zwei Regeln eingegeben:
- [A-Z]{3}: Findet aufeinanderfolgende 3 englische Großbuchstaben, z. B. BOT, ELA;
- \d+: Findet eine oder mehrere aufeinanderfolgende Ziffern, z. B. 60, 100, 2026.
Rechts befindet sich die Liste der zu ersetzenden Schlüsselwörter. Der Hinweis in der Oberfläche "Nichts eintragen bedeutet löschen" besagt, dass die rechte Ersetzungsliste einfach leer bleiben kann, wenn das Ziel das stapelweise Löschen der gefundenen Inhalte ist.
Das heißt, die Verarbeitungslogik in diesem Beispiel lautet: Finde alle Texte, die [A-Z]{3} und \d+ entsprechen, und ersetze sie dann mit leerem Inhalt, um sie zu löschen.
Schritt 5: Weiter klicken, Speicherort festlegen und Verarbeitung starten
Klicken Sie auf Weiter, nachdem die Regeln festgelegt sind. Folgen Sie dem Assistenten, um mit den Schritten "Speicherort festlegen" und "Verarbeitung starten" fortzufahren. Es wird empfohlen, die verarbeiteten Dateien in einem neuen Verzeichnis zu speichern, um sie von den ursprünglichen Word-Dateien zu unterscheiden und später leichter die Ergebnisse zu überprüfen.
Nach dem Start der Verarbeitung führt die Software die Such- und Ersetzungsoperationen nacheinander für die hinzugefügten Word-Dokumente durch. Nach Abschluss der Verarbeitung öffnen Sie die Ausgabedatei zur Kontrolle und sollten sehen, dass die regelkonformen Schlüsselwörter stapelweise gelöscht wurden.
Häufige Fragen und Hinweise
1. Warum bedeutet eine leere Liste der zu ersetzenden Schlüsselwörter Löschen?
In der Such- und Ersetzungslogik ist "Ersetzen durch Nichts" gleichbedeutend mit dem Löschen des gefundenen Inhalts. Auch der Hinweis im Screenshot rechts "Nichts eintragen bedeutet löschen" zeigt dies. Solange also links eine Suchregel eingetragen und rechts kein Ersetzungsinhalt ausgefüllt wird, kann stapelweise gelöscht werden.
2. Können reguläre Ausdrücke versehentlich Inhalte löschen?
Das ist möglich. Reguläre Ausdrücke suchen nach einer Art von Regel, nicht nach einem einzelnen festen Wort. Beispielsweise findet \d+ alle aufeinanderfolgenden Ziffern. Wenn das Dokument Nummerierungen, Daten, Seitenzahlen, Geldbeträge oder andere Zahlen enthält, könnten diese ebenfalls gelöscht werden. Es wird empfohlen, vor der eigentlichen Verarbeitung mit wenigen Dateien zu testen.
3. Für welche Inhalte eignet sich [A-Z]{3} zum Löschen?
Es eignet sich zum Löschen von aufeinanderfolgenden 3 englischen Großbuchstaben, z. B. BOT, ELA, ABC. Wenn das Dokument andere dreibuchstabige Großbuchstaben-Abkürzungen enthält, die dieser Regel entsprechen, werden diese ebenfalls gelöscht. Möchten Sie nur bestimmte feste Wörter löschen, können Sie präzisere Regeln oder die normale genaue Suche verwenden.
4. Muss die Option "Groß-/Kleinschreibung ignorieren" aktiviert werden?
Wenn nur Großbuchstaben gefunden werden sollen, wird normalerweise nicht empfohlen, die Groß-/Kleinschreibung zu ignorieren. Denn das Aktivieren dieser Option könnte den Suchbereich erweitern und dazu führen, dass auch Kombinationen aus Kleinbuchstaben erkannt werden. Wählen Sie je nach Dokumentinhalt mit Bedacht.
5. Sollten die Originaldateien vor der Verarbeitung gesichert werden?
Eine Sicherung wird empfohlen. Ein Merkmal der Stapelverarbeitung ist, dass sie mehrere Dateien gleichzeitig betrifft, insbesondere Löschoperationen mit regulären Ausdrücken. Falsch eingestellte Regeln können zu unnötigem Inhaltsverlust führen. Es ist sicherer, die Ergebnisse in einem neuen Ordner zu speichern.
Zusammenfassung
Mit HeSoft Doc Batch Tool können Sie die Löschaufgaben, die sonst das einzeln Öffnen von Word-, docx- und doc-Dateien erfordern, in eine einzige Stapelverarbeitungsaufgabe umwandeln. Über die Funktion "Schlüsselwörter in Word suchen und ersetzen" und die Wahl von "Formel zur unscharfen Textsuche verwenden" können Sie mit regulären Ausdrücken eine Klasse von Schlüsselwörtern finden. Lassen Sie den Ersetzungsinhalt leer, um diese Inhalte stapelweise zu löschen.
Wenn Sie häufig viele Word-Dokumente von Nummerierungen, Abkürzungen, Vorlagenmarkierungen oder vertraulichen Feldern bereinigen müssen, können Sie zunächst die passenden Regeln vorbereiten, mit wenigen Dateien testen und nach Bestätigung der Richtigkeit die Stapelverarbeitung ausführen. So können Sie sowohl sich wiederholende Arbeit reduzieren als auch die Effizienz der Dokumentenorganisation deutlich steigern.