Wenn mehrere Word-, DOCX- oder DOC-Dokumente ähnliche Inhalte wie Nummerierungen, Abkürzungen oder fest formatierte Codes enthalten, die einheitlich gelöscht werden müssen, ist das manuelle Öffnen und Ersetzen in jedem Dokument sehr zeitaufwendig. Dieser Artikel zeigt am Beispiel von HeSoft Doc Batch Tool , wie Sie mit der Funktion „Suchen und Ersetzen von Schlüsselwörtern in Word“ reguläre Ausdrücke verwenden, um Schlüsselwörter unscharf zu finden und das Ersetzungsfeld leer zu lassen. So können Sie bestimmte Textmuster in mehreren Word-Dateien auf einmal löschen – geeignet für Dokumentenbereinigung, Datenmaskierung und die vereinheitlichte Formatierung großer Dokumentmengen.
Beim Organisieren einer großen Anzahl von Word-Dokumenten stößt man häufig auf wiederkehrende, aber nicht völlig identische Inhalte, die gelöscht werden müssen, z. B. englische Großbuchstabenabkürzungen, Zahlen, Kursnummern, Chargennummern, Seitenzahlen oder andere Texte, die einem festen Muster folgen. Wenn man docx- und doc-Dateien einzeln öffnet, um sie manuell zu suchen und zu ersetzen, ist das nicht nur ineffizient, sondern es kann auch leicht etwas übersehen werden. Mit den Batch-Verarbeitungsfunktionen von Office-Software können reguläre Ausdrücke verwendet werden, um mehrere Word-Dateien unscharf abzugleichen und die Ersetzungsinhalte leer zu lassen, um so eine Batch-Löschung von Schlüsselwörtern zu erreichen.
Im folgenden Beispiel wird anhand von „ HeSoft Doc Batch Tool “ im Screenshot gezeigt, wie die Funktion "Suchen und Ersetzen von Schlüsselwörtern in Word" verwendet wird, um mit regulären Ausdrücken übereinstimmende Inhalte in mehreren Word-Dokumenten stapelweise zu löschen.
Anwendungsszenarien
Diese Methode eignet sich für die Verarbeitung von Word-Inhalten, bei denen "Schlüsselwörter nicht vollständig festgelegt sind, aber einem deutlichen Muster folgen". Zum Beispiel:
- Stapelweises Löschen von englischen Großbuchstabenabkürzungen wie BOT, ELA usw. in mehreren Word-Dokumenten.
- Stapelweises Löschen von Zahleninhalten wie 60, 2026, 001 usw. in Dokumenten.
- Bereinigung von Nummerierungen, Codes, temporären Markierungen oder formatierten Platzhaltern in docx- und doc-Dateien.
- Reduzierung sich wiederholender Vorgänge in Szenarien wie Dokumentenarchivierung, Dokumentenanonymisierung, Bereinigung von Vertragsvorlagen und Organisation von Lehrmaterialien.
In diesem Beispiel müssen 6 Word-Dokumente im selben Ordner verarbeitet werden.

Effektvorschau: Vor und nach der Verarbeitung
Vorher: Mehrere Word-Dokumente enthalten musterkonforme Schlüsselwörter
In den Word-Dokumenten vor der Verarbeitung ist zu sehen, dass Titel und Text einige zu löschende Inhalte enthalten, wie die englischen Großbuchstabenabkürzungen "BOT", "ELA" und die Zahl "60". Wenn solche Inhalte über viele Dateien verstreut sind, ist das manuelle Löschen sehr mühsam.

Nachher: Die durch den regulären Ausdruck gefundenen Inhalte wurden stapelweise gelöscht
Nach Abschluss der Verarbeitung wurden die ursprünglich musterkonformen Inhalte gelöscht. Beispielsweise wurde "BOT" aus dem Titel entfernt, und "ELA" sowie die Zahl "60" usw. erscheinen im Text nicht mehr. Da die Liste der ersetzten Schlüsselwörter leer ist, löscht die Software den gefundenen Text direkt.

Vorgehensweise: Batch-Löschung von Word-Schlüsselwörtern mit regulären Ausdrücken
Schritt 1: Word-Tool öffnen und Funktion Suchen und Ersetzen auswählen
Öffnen Sie HeSoft Doc Batch Tool und wählen Sie links "Word-Tools". Suchen Sie in der Werkzeugliste nach "Suchen und Ersetzen von Schlüsselwörtern in Word" und klicken Sie darauf. Diese Funktion dient dem stapelweisen Suchen und Ersetzen von Schlüsselwörtern in Word-Dateien und ermöglicht auch die Batch-Löschung, indem der "Ersetzungsinhalt" leer gelassen wird.

Ziel dieses Schritts ist es, das spezielle Modul für die Textsuche und -ersetzung in Word zu betreten, um den Import mehrerer docx- oder doc-Dateien vorzubereiten.
Schritt 2: Die zu verarbeitenden Word-Dateien hinzufügen
Klicken Sie auf der Funktionsseite auf "Dateien hinzufügen" oder "Dateien aus Ordner importieren", um die per Batch zu verarbeitenden Word-Dokumente in die Liste aufzunehmen. Im Screenshot wurden bereits 1.docx bis 6.docx importiert, insgesamt 6 Einträge. In der Tabelle sind Informationen wie Dateiname, Pfad, Erweiterung, Erstellungszeit und Änderungszeit zu sehen.

Klicken Sie nach Überprüfung der Dateiliste unten auf "Weiter". Wenn versehentlich Dateien hinzugefügt wurden, können Sie diese über die Löschfunktion in der Liste entfernen, um eine Bearbeitung unerwünschter Dokumente zu vermeiden.
Schritt 3: Unscharfe Suche mit regulären Ausdrücken einrichten
Wählen Sie auf der Seite "Verarbeitungsoptionen festlegen" bei der Suchmethode "Formel zur unscharfen Textsuche verwenden". Aus der Schreibweise der Regeln im Screenshot ist ersichtlich, dass hier passende reguläre Ausdrücke eingegeben werden können, z. B.:
- [A-Z]{3}: Entspricht 3 aufeinanderfolgenden Großbuchstaben, kann zum Löschen von Abkürzungen wie BOT, ELA verwendet werden.
- \d+: Entspricht einer oder mehreren Ziffern, kann zum Löschen von Zahleninhalten wie 60, 2026, 001 verwendet werden.
Geben Sie die abzugleichenden Regeln zeilenweise in die "Liste der zu suchenden Schlüsselwörter" ein. Die rechte "Liste der zu ersetzenden Schlüsselwörter" bleibt leer, da der Hinweis "Nicht ausfüllen bedeutet Löschen" besagt. Das bedeutet, die Software findet die mit der linken Regel übereinstimmenden Inhalte und löscht diese direkt.

Klicken Sie nach Abschluss der Einstellungen auf "Weiter", um den Speicherort festzulegen und die Verarbeitung zu starten. Da die Screenshots der Folgeseiten nicht gezeigt werden, folgen Sie im tatsächlichen Betrieb einfach den Anweisungen des Software-Assistenten, um "Speicherort festlegen" und "Verarbeitung starten" abzuschließen.
Empfehlungen für reguläre Ausdrücke
Beim Batch-Löschen von Word-Schlüsselwörtern sollte der reguläre Ausdruck so präzise wie möglich sein, um ein versehentliches Löschen von normalem Text zu vermeiden. Hier sind einige gängige Ansätze:
- Löschen fortlaufender Ziffern: \d+ kann verwendet werden.
- Löschen von 3 aufeinanderfolgenden Großbuchstaben: [A-Z]{3} kann verwendet werden.
- Löschen von Nummern mit festem Präfix und Ziffern: Kombinieren Sie Buchstaben- und Ziffernregeln je nach tatsächlichem Inhalt.
- Wenn Sie nur ein bestimmtes Format löschen möchten, verwenden Sie keine zu weit gefassten Ausdrücke.
Falls der Dokumentinhalt komplexer ist, empfiehlt es sich, den Vorgang zunächst mit wenigen Word-Dateien zu testen und erst nach Bestätigung des erwarteten Ergebnisses alle docx- oder doc-Dateien per Batch zu verarbeiten.
Häufige Fragen und Hinweise
1. Warum werden Inhalte durch Leerlassen des Ersetzungsfeldes gelöscht?
In der Such- und Ersetzungslogik steht "Gesuchter Inhalt" für den zu lokalisierenden Text und "Ersetzungsinhalt" dafür, durch was er ersetzt wird. Wenn die Liste der zu ersetzenden Schlüsselwörter nicht ausgefüllt wird, zeigt die Software den Hinweis "Nicht ausfüllen bedeutet Löschen", sodass der gefundene Inhalt durch nichts (also Leerstring) ersetzt und somit gelöscht wird.
2. Können reguläre Ausdrücke versehentlich andere Inhalte löschen?
Das ist möglich. Beispielsweise würde \d+ alle Ziffern finden. Wenn Seitenzahlen, Jahreszahlen oder Mengenangaben im Text ebenfalls dem Muster entsprechen, könnten sie mitgelöscht werden. Daher ist vor der Batch-Verarbeitung von Word-Dokumenten unbedingt zu prüfen, ob die Regel zu weit gefasst ist.
3. Können sowohl doc- als auch docx-Dateien auf diese Weise verarbeitet werden?
Das gezeigte Screenshot-Beispiel verwendet docx-Dateien. Für die Batch-Verarbeitung von Word-Dokumenten können Sie in der Regel die Dateien in den von der Software unterstützten Formaten importieren. Befolgen Sie im tatsächlichen Betrieb die in der Werkzeugliste erkannten Erweiterungen und Importergebnisse.
4. Ist eine Sicherung vor der Batch-Verarbeitung erforderlich?
Es wird empfohlen, zuerst die Originaldateien zu sichern, insbesondere wenn es sich um Batch-Löschungen von Inhalten handelt. So können Sie selbst bei ungenauen regulären Ausdrücken zur Originalversion zurückkehren und den Vorgang erneut durchführen.
Zusammenfassung
Durch die Verwendung regulärer Ausdrücke zum unscharfen Batch-Löschen von Schlüsselwörtern in Word kann die repetitive Arbeit des einzelnen Öffnens, Suchens und Löschens in eine einmalige Regeleinstellung und Batch-Ausführung umgewandelt werden. Für die Dokumentenbereinigung, Inhaltsanonymisierung und Materialorganisation einer großen Anzahl von docx- und doc-Dateien kann diese Art von Bürosoftware die manuelle Arbeitszeit erheblich reduzieren und das Risiko übersehener Löschungen senken.
Wenn Sie in mehreren Word-Dateien Nummerierungen, Abkürzungen, Zahlen oder andere reguläre Texte verarbeiten, folgen Sie den Schritten in diesem Artikel: Wählen Sie "Suchen und Ersetzen von Schlüsselwörtern in Word", importieren Sie Dateien, aktivieren Sie die unscharfe Suchregel, lassen Sie den Ersetzungsinhalt leer und führen Sie die Batch-Löschung durch.