Wenn mehrere Word-, docx- oder doc-Dokumente ähnliche, aber nicht identische Inhalte enthalten, z. B. feste englische Abkürzungen, Nummern, Zahlen, Codefragmente usw., ist das manuelle Löschen durch Öffnen jeder Datei zeitaufwändig und fehleranfällig. In diesem Artikel wird beschrieben, wie Sie die Funktion „Schlüsselwörter in Word suchen und ersetzen“ in HeSoft Doc Batch Tool verwenden, um durch reguläre Ausdrücke unscharfe Übereinstimmungen zu erzielen und den Ersatzinhalt leer zu lassen, um bestimmte Textmuster in mehreren Word-Dateien gleichzeitig zu löschen.
Beim Organisieren vieler Word-Dokumente tritt häufig das Problem auf, dass jede Datei einige zu löschende Schlüsselwörter enthält, deren Inhalt jedoch nicht vollständig identisch ist. So gibt es beispielsweise Stellen mit dreibuchstabigen englischen Großbuchstaben-Abkürzungen, andere mit nummerierten Codes, Stundenzahlen, Code oder anderen variablen Inhalten. Das manuelle Suchen und Löschen in jeder docx- oder doc-Datei ist nicht nur ineffizient, sondern auch fehleranfällig.
Für solche Szenarien eignet sich besser der Einsatz von Bürosoftware, die die Stapelverarbeitung von Dateien unterstützt. Am Beispiel von „ HeSoft Doc Batch Tool “ wird im Folgenden demonstriert, wie Sie mit regulären Ausdrücken Schlüsselwörter in mehreren Word-Dokumenten stapelweise unscharf löschen können. In diesem Artikelbeispiel müssen aus mehreren Word-Dateien dreistellige Großbuchstaben wie BOT sowie numerische Inhalte wie 60 gelöscht werden.
Anwendungsszenarien
Die stapelweise Löschung von Word-Schlüsselwörtern mit regulären Ausdrücken eignet sich für Dokumentbereinigungsaufgaben, bei denen „der Inhalt einer Regel folgt, der konkrete Text jedoch nicht feststeht“, zum Beispiel:
- Stapelweises Löschen von Zahlen, Nummerierungen, Jahreszahlen, Beträgen usw. in Word-, docx- und doc-Dateien;
- Stapelweises Löschen von englischen Abkürzungen mit festem Format, wie dreibuchstabige Großbuchstaben-Codes;
- Stapelweises Bereinigen von variablen Feldern in Verträgen, Kursmaterialien, Berichten;
- Einheitliches Ersetzen einer bestimmten Kategorie von Schlüsselwörtern in mehreren Word-Dokumenten durch nichts, um eine stapelweise Löschung zu erreichen;
- Gleichzeitige Bearbeitung dutzender oder hunderter Word-Dateien, um wiederholtes Öffnen, Suchen und Löschen zu vermeiden.
Solange der zu löschende Inhalt durch einen regulären Ausdruck beschrieben werden kann, lässt er sich durch die Methode „unscharfe Suche + Ersetzen durch nichts“ stapelweise entfernen.
Ergebnisvorschau: Vergleich vor und nach der Verarbeitung
Vor der Verarbeitung: Mehrere Word-Dateien müssen einheitlich bereinigt werden
Im Beispielordner befinden sich 6 Word-Dokumente mit der Dateierweiterung docx. Falls in der Praxis mehr Word-Dateien verarbeitet werden müssen, können diese auf die gleiche Weise stapelweise importiert werden.

Beim Öffnen eines der Dokumente sieht man, dass der Haupttext zu löschende Inhalte enthält. Zum Beispiel das BOT am Titelanfang und die Zahl 60 im Fließtext. Verteilen sich solche Inhalte auf mehrere Dateien, wäre das manuelle Löschen sehr mühsam.

Nach der Verarbeitung: Gefundene Schlüsselwörter wurden stapelweise gelöscht
Nach Abschluss der Verarbeitung wurden die ursprünglich den Regeln entsprechenden Inhalte gelöscht. So wurden beispielsweise die dreibuchstabigen Großbuchstaben und Zahlen entfernt, während der restliche Text erhalten blieb. Damit wurde die unscharfe Löschung mittels regulärer Ausdrücke über mehrere Word-Dateien hinweg erreicht.

Vorgehensweise: Stapelweises unscharfes Löschen von Word-Schlüsselwörtern mit regulären Ausdrücken
Schritt 1: Word-Werkzeug aufrufen und „Suchen und Ersetzen von Schlüsselwörtern in Word“ wählen
Öffnen Sie HeSoft Doc Batch Tool , wählen Sie links Word-Werkzeuge und klicken Sie dann in der Funktionsliste auf „Suchen und Ersetzen von Schlüsselwörtern in Word“. Diese Funktion dient zum stapelweisen Suchen und Ersetzen von Schlüsselwörtern in Word-Dateiinhalten, kann aber auch durch „Ersetzen durch leeren Inhalt“ zum stapelweisen Löschen verwendet werden.

Ziel der Auswahl dieser Funktion ist es, dass die Software einheitliche Such- und Ersetzungsregeln auf mehrere Word-Dokumente anwendet, anstatt jede Datei einzeln manuell zu bearbeiten.
Schritt 2: Die zu verarbeitenden Word-Dateien hinzufügen
Auf der Funktionsseite können Sie im 1. Schritt „Zu verarbeitende Datensätze auswählen“ über Dateien hinzufügen einzelne oder mehrere Word-Dokumente importieren oder über Dateien aus Ordner importieren stapelweise Dokumente aus einem bestimmten Ordner laden.

Nach dem Import zeigt die Liste Informationen wie Dateinummer, Name, Pfad, Erweiterung, Erstellungsdatum und Änderungsdatum an. Im Beispiel wurden die 6 Dateien 1.docx bis 6.docx importiert, was bedeutet, dass alle diese Dokumente in die anschließende Stapelverarbeitung einbezogen werden.
Nachdem Sie die Dateiliste überprüft haben, klicken Sie auf Weiter, um zu den Verarbeitungsoptionen zu gelangen.
Schritt 3: Unscharfe Suchmethode wählen und regulären Ausdruck eingeben
Auf der Seite „Verarbeitungsoptionen festlegen“ müssen Sie vor allem die Suchmethode und die Schlüsselwortliste konfigurieren. Da der zu löschende Inhalt kein feststehendes Wort ist, sondern Text, der einem bestimmten Muster folgt, wählen Sie als Suchmethode Formel für unscharfe Textsuche verwenden.

Geben Sie in der linken Liste der zu suchenden Schlüsselwörter den regulären Ausdruck ein. Im Beispiel wurden zwei Regeln eingetragen:
- [A-Z]{3}: Findet 3 aufeinanderfolgende Großbuchstaben, z. B. BOT, ELA usw.;
- \d+: Findet eine oder mehrere aufeinanderfolgende Ziffern, z. B. 60, 2026, 123 usw.
Rechts befindet sich die Liste der zu ersetzenden Schlüsselwörter. Der Hinweis im Screenshot „Leer bedeutet löschen“ zeigt an, dass in diesem Fall die rechte Ersetzungsspalte leer bleibt. So ersetzt die Software bei der Stapelverarbeitung die vom linken regulären Ausdruck gefundenen Inhalte durch nichts, löscht sie also.
Klicken Sie nach der Konfiguration auf Weiter, um zur Festlegung des Speicherorts und zum Starten des Prozesses zu gelangen.
Schritt 4: Speicherort festlegen und Stapelverarbeitung starten
Im Seitenablauf sehen Sie die weiteren Schritte Speicherort festlegen und Verarbeitung starten. Es wird empfohlen, die verarbeiteten Word-Dateien in einem neuen Verzeichnis zu speichern, um sie von den Originaldateien zu unterscheiden und nach der Verarbeitung leichter Stichproben durchführen zu können.
Nach Bestätigung des Speicherorts starten Sie die Verarbeitung, und die Software wendet automatisch denselben Satz Such- und Ersetzungsregeln auf alle importierten Word-, docx- oder doc-Dateien an. Überprüfen Sie nach Abschluss die Ausgabedateien, um sicherzustellen, dass die zu löschenden Schlüsselwörter tatsächlich entfernt wurden.
Hinweise zur Konfiguration des regulären Ausdrucks
Dieses Beispiel verwendet den Ansatz der „unscharfen Suche“ anstelle der exakten Suche nach einem einzelnen, feststehenden Schlüsselwort. Übliche Muster sind:
- [A-Z]{3}: Findet 3 aufeinanderfolgende Großbuchstaben;
- \d+: Findet aufeinanderfolgende Ziffern;
- [A-Za-z]+: Findet aufeinanderfolgende englische Buchstaben;
- \s+: Findet aufeinanderfolgende Leerzeichen.
In der Praxis sollten die Regeln sorgfältig entsprechend dem Dokumentinhalt erstellt werden. Je breiter der Erfassungsbereich des regulären Ausdrucks, desto mehr Inhalt wird gelöscht; je präziser der Bereich, desto geringer das Risiko ungewollter Löschungen.
Häufige Fragen und Hinweise
1. Warum führt eine leere Ersetzungsliste zum Löschen von Inhalten?
Die Logik von Suchen und Ersetzen lautet: „Finde den linken Inhalt und ersetze ihn durch den rechten.“ Wenn die rechte Seite leer bleibt, wird der gefundene Text durch nichts ersetzt, was einer Löschung aus dem Word-Dokument gleichkommt.
2. Könnte der reguläre Ausdruck versehentlich andere Inhalte löschen?
Das ist möglich. Zum Beispiel würde [A-Z]{3} alle Folgen von 3 aufeinanderfolgenden Großbuchstaben finden, nicht nur BOT. Wenn das Dokument auch ELA, PDF, DOC usw. enthält, könnten diese ebenfalls gefunden werden. Daher wird empfohlen, vor der Verarbeitung eine Sicherung der Originaldateien zu erstellen oder die Regeln zunächst mit wenigen Musterdokumenten zu testen.
3. Kann man mehrere Arten von Inhalten mit unterschiedlichen Mustern gleichzeitig löschen?
Ja. Im Beispiel wurden die beiden Regeln [A-Z]{3} und \d+ gleichzeitig in der Schlüsselwortliste verwendet, um sowohl dreibuchstabige Großbuchstaben als auch Zahlen zu löschen. Wenn mehr Inhaltstypen gelöscht werden sollen, können Sie weitere Regeln zeilenweise hinzufügen.
4. Können sowohl doc- als auch docx-Dateien auf diese Weise verarbeitet werden?
Die Screenshots in diesem Artikel zeigen docx-Dateien. Bei der tatsächlichen Stapelverarbeitung können Sie die Word-Dateitypen auswählen, die von der Importliste der Software unterstützt werden. Es wird empfohlen, wichtige doc- und docx-Dokumente vor der Stapelverarbeitung zu kopieren.
5. Wie kann ich das Ergebnis nach der Verarbeitung überprüfen?
Es wird empfohlen, einige verarbeitete Word-Dateien im Ausgabeverzeichnis zu öffnen und Schlüsselstellen wie Titel, Fließtext und Nummerierungen zu vergleichen, um zu bestätigen, dass der reguläre Ausdruck nur den gewünschten Inhalt gelöscht und keinen anderen wichtigen Text beeinträchtigt hat.
Zusammenfassung
Wenn mehrere Word-Dokumente eine große Anzahl ähnlicher, zu löschender Schlüsselwörter enthalten, ist die stapelweise unscharfe Löschung mit regulären Ausdrücken wesentlich effizienter als das manuelle Suchen und Löschen in jeder Datei. Mit der Funktion „Suchen und Ersetzen von Schlüsselwörtern in Word“ von HeSoft Doc Batch Tool müssen Sie nur die Dateien importieren, die unscharfe Suche auswählen, den regulären Ausdruck eingeben und den Ersetzungstext leer lassen, um den Zieltext in mehreren docx- und doc-Dateien stapelweise zu bereinigen.
Wenn Sie oft Word-Unterlagen organisieren, Nummerierungen stapelweise löschen, Code-Abkürzungen entfernen oder Dokumentinhalte einheitlich bearbeiten müssen, empfiehlt es sich, zuerst Testdateien vorzubereiten, die Regex-Regeln zu validieren und die Stapelverarbeitung dann auszuführen. Das steigert die Effizienz und verringert das Risiko ungewollter Löschungen.