Wenn in mehreren TXT-Textdateien viele einheitlich zu ersetzende Zahlen, Nummerierungen, Daten oder variable Schlüsselwörter vorhanden sind, ist das manuelle Öffnen und Suchen/Ersetzen in jeder Datei nicht nur zeitaufwändig, sondern auch fehleranfällig. Dieser Artikel zeigt am Beispiel des Ersetzens fortlaufender Zahlen in mehreren Textdateien durch AAA, wie Sie mit der Funktion „Text in Schlüsselwörtern suchen und ersetzen“ in HeSoft Doc Batch Tool mithilfe des regulären Ausdrucks \d+ Zahlen unterschiedlicher Länge auf einmal abgleichen und stapelweise ersetzen können. Dies eignet sich für Szenarien wie Datenbereinigung, Textanonymisierung, Protokollverarbeitung und Inhaltsstandardisierung.
Im Büroalltag, bei der Datenorganisation, der Datenbereinigung und der Inhaltsaufbereitung vor der Veröffentlichung stoßen viele Menschen auf ein ähnliches Problem: Ein Ordner enthält dutzende oder sogar hunderte von TXT-Textdateien, in denen verschiedene Zahlen, Nummern, Mengen, Jahreszahlen, Beträge oder andere variable Texte verstreut sind. Lässt sich ein einzelnes festes Wort ersetzen, mag eine gewöhnliche Suchen-und-Ersetzen-Funktion noch ausreichen; sollen aber Zahlen unterschiedlicher Länge wie „10“, „30“, „100“ oder „26000“ einheitlich durch denselben Inhalt ersetzt werden, ist das manuelle Öffnen und Bearbeiten jeder einzelnen Datei extrem ineffizient.
Das Kernproblem, das dieser Artikel lösen soll, ist: Wie kann man mit Platzhaltern oder regulären Ausdrücken in mehreren Textdateien unterschiedliche Arten von Schlüsselwörtern suchen und in einem Schritt durch einen angegebenen Text ersetzen? Im Beispiel werden wir alle fortlaufenden Ziffern in mehreren TXT-Dateien einheitlich durch „AAA“ ersetzen. Die verwendete Software ist die Office-orientierte Anwendung „ HeSoft Doc Batch Tool “. Ihr Wert liegt in der Stapelverarbeitung von Dateien und der Reduzierung von Routinearbeit, besonders geeignet für Büroszenarien, in denen häufig TXT-Dateien, Textmaterialien, Protokolldateien und exportierte Dokumentinhalte verarbeitet werden müssen.
Anwendungsszenarien: Welche Textinhalte eignen sich für die Stapelersetzung mit regulären Ausdrücken
Der Vorteil der Stapelsuche und -ersetzung mit regulären Ausdrücken liegt darin, dass sie nicht nur ein festes Wort findet, sondern eine Klasse von Inhalten anhand von Regeln abgleichen kann. Das in diesem Artikel verwendete \d+ beispielsweise gleicht ein oder mehrere aufeinanderfolgende Ziffern ab. Unabhängig davon, ob „5“, „10“, „30“, „100“ oder durch Trennzeichen getrennte Ziffernblöcke wie in „26.000“ im Text vorkommen, können sie gemäß der Regel erkannt und ersetzt werden.
Diese Art der Stapelverarbeitung eignet sich für folgende Szenarien:
- Stapelweise Anonymisierung von Textdateien: Einheitliches Ersetzen von Nummern und Mengenangaben in TXT-, Protokoll- und Datendateien durch Platzhalter.
- Inhaltsstandardisierung: Einheitliches Ändern variabler Zahlen in mehreren Texten in feste Kennungen, um spätere Korrektur oder Vorlagenverarbeitung zu erleichtern.
- Stapelweise Bereinigung englischsprachiger Materialien: Beispielsweise enthalten englische Fachartikel, Anleitungen oder exportierte Texte viele numerische Werte, die einheitlich ersetzt werden müssen.
- Verarbeitung von Programmprotokollen oder Konfigurationstexten: Portnummern, Statuscodes, IDs, Zählerwerte und ähnliche Inhalte in Protokolldateien können regelbasiert stapelweise verarbeitet werden.
- Bereinigung vieler TXT-Dateien: Dateien wie big_bang.txt, black_holes.txt, dark_energy.txt müssen nicht einzeln geöffnet werden, sondern können direkt in der Software gemäß der Dateiliste einheitlich verarbeitet werden.
Wenn Ihr Bedarf die Stapelersetzung von Inhalten in Word-Dokumenten ist, lässt sich der Ansatz auch auf Szenarien mit doc, docx und anderen Dokumenten erweitern; die Screenshots in diesem Artikel zeigen jedoch den Ablauf der Stapelsuche und -ersetzung für TXT-Dateiinhalte unter dem Textwerkzeug, daher konzentrieren sich die folgenden Erläuterungen auf TXT-Dateien.
Ergebnisvorschau: Vor der Verarbeitung enthalten mehrere TXT-Dateien unterschiedliche Zahlen
Vor der Verarbeitung wurden im Ordner mehrere TXT-Textdateien vorbereitet, darunter big_bang.txt, black_holes.txt, dark_energy.txt, dark_matter.txt, galaxies.txt usw. Der Inhalt solcher Dateien ist normalerweise unabhängig voneinander. Bei manueller Bearbeitung müsste jede Datei einzeln geöffnet und die Suchen-und-Ersetzen-Funktion ausgeführt werden, was viele sich wiederholende Schritte bedeutet.

Am Beispiel von black_holes.txt enthält der Dateiinhalt viele Zahlen, wie z. B. „10“, „30“, „5“, „100“, „4“, „26.000“ usw. Im Screenshot sind einige Zahlen rot markiert. Es ist zu erkennen, dass diese Zahlen unterschiedlich lang und an verschiedenen Stellen verstreut sind. Eine einfache Suche mit festen Schlüsselwörtern kann kaum alle Fälle auf einmal abdecken.

Genau hier zeigt sich die Stärke der Stapelersetzung mit regulären Ausdrücken. Wir müssen nicht jede einzelne Zahl wie 10, 30, 100 eingeben, sondern können mit einem Regelausdruck „alle fortlaufenden Ziffern“ abgleichen. Im Beispiel lautet die Regel \d+, der ersetzte Inhalt ist „AAA“.
Ergebnisvorschau: Nach der Verarbeitung wurden Zahlen einheitlich durch AAA ersetzt
Nach Abschluss der Stapelverarbeitung zeigt sich beim erneuten Öffnen von black_holes.txt, dass die ursprünglichen Zahlen im Text durch „AAA“ ersetzt wurden. So wurden beispielsweise die vorherigen Radiuswerte, Vielfachen der Masse, Sonnenmassenangaben, Entfernungsangaben usw. alle zu dem einheitlichen Platzhaltertext.

Der Ergebnisgrafik ist zu entnehmen, dass die Stapelersetzung nicht nur die aktuell geöffnete Datei bearbeitet, sondern dieselbe Regel gemäß der Aufgabenliste auf mehrere Textdateien anwendet. Für Büroangestellte bedeutet dies, dass bei korrekter Regeleinstellung eine große Anzahl von TXT-Dateien in einem gesamten Ordner auf einmal verarbeitet werden kann, was die sich wiederholenden Schritte Öffnen, Suchen, Ersetzen und Speichern erheblich reduziert.
Vorgehensweise: Stapelsuche und -ersetzung mit HeSoft Doc Batch Tool
Im Folgenden wird der vollständige Arbeitsablauf anhand der Screenshot-Reihenfolge erläutert. Wichtig ist, den Zweck jedes Schrittes zu verstehen: Zuerst die Funktion wählen, dann die Dateien importieren, dann die Suchregel mit regulärem Ausdruck und den Ersetzungsinhalt festlegen und abschließend speichern und die Verarbeitung starten.
Schritt 1: „Text-Werkzeuge“ aufrufen und „Text in Schlüsselwörtern suchen und ersetzen“ wählen
Nach dem Öffnen von HeSoft Doc Batch Tool wählen Sie in der linken Funktionskategorie „Text-Werkzeuge“. Die Hauptoberfläche zeigt mehrere Funktionen zur Stapelverarbeitung von Text an, z. B. Text in Word umwandeln, Text in PDF umwandeln, HTML in TXT umwandeln usw. In diesem Artikel verwenden wir Punkt 1: „Text in Schlüsselwörtern suchen und ersetzen“.

Ziel dieses Schrittes ist es, das speziell für die Stapelsuche und -ersetzung von Textinhalten vorgesehene Funktionsmodul aufzurufen. Anders als die Einzeldatei-Suche-und-Ersetzen-Funktion in einem normalen Editor richtet sich diese Funktion an mehrere Textdateien und kann denselben Satz an Such- und Ersetzungsregeln auf die gesamte Aufgabenliste anwenden. Nach dem Klicken auf diese Funktion gelangen Sie auf eine geführte Verarbeitungsseite.
Schritt 2: Hinzufügen der zu verarbeitenden TXT-Dateien
Auf der Funktionsseite ist der erste Schritt „Zu verarbeitende Einträge auswählen“. Oben rechts in der Oberfläche sehen Sie Schaltflächen wie „Datei hinzufügen“, „Dateien aus Ordner importieren“, „Leeren“, „Mehr“ usw. Im Beispiel wurden bereits 5 TXT-Dateien importiert. Die Liste zeigt Nummer, Name, Pfad, Erweiterung, Erstellungszeit, Änderungszeit und eine Aktionsspalte an.

Wenn nur wenige Dateien verarbeitet werden sollen, können Sie „Datei hinzufügen“ verwenden; befinden sich alle Dateien im selben Ordner, empfiehlt sich eher „Dateien aus Ordner importieren“, um mehrere TXT-Dateien auf einmal zur Liste hinzuzufügen. Überprüfen Sie nach dem Import die Dateinamen und Pfade auf Richtigkeit und löschen Sie nicht benötigte Dateien über die Aktionsspalte. Die Anzeige „Einträge: 5“ am Ende der Liste zeigt an, dass die aktuelle Aufgabe 5 Textdateien verarbeiten wird.
Das erwartete Ergebnis dieses Schrittes ist: Alle TXT-Dateien, deren Inhalt ersetzt werden soll, befinden sich in der Aufgabenliste, haben die Erweiterung txt und die Pfade zeigen auf den korrekten Dateispeicherort. Nach Bestätigung klicken Sie unten auf „Weiter“, um die Verarbeitungsoptionen festzulegen.
Schritt 3: „Formel für unscharfe Textsuche verwenden“ wählen
Auf der Seite „Verarbeitungsoptionen festlegen“ sehen Sie den Bereich „Suchmethode“. Die Oberfläche bietet zwei Optionen: „Text exakt suchen“ und „Formel für unscharfe Textsuche verwenden“. Da dieser Artikel verschiedene Ziffern abgleichen möchte und nicht eine bestimmte feste Zahl, muss „Formel für unscharfe Textsuche verwenden“ gewählt werden.

„Formel für unscharfe Textsuche verwenden“ kann hier als regelbasierte Suche verstanden werden. Für die Stapelersetzung von Zahlen, Nummern und variablen Zeichen ist sie flexibler als die exakte Suche. Die exakte Suche eignet sich zum Ersetzen fester Wörter, z. B. „black hole“ durch „Schwarzes Loch“ zu ersetzen; reguläre Ausdrücke oder Platzhalterregeln eignen sich zum Abgleichen einer Klasse von Inhalten, z. B. aller Ziffern, spezifischer Nummernformate oder Text zwischen festen Präfixen und Suffixen.
Schritt 4: Eingabe des regulären Ausdrucks \d+ in der Schlüsselwortliste
Geben Sie in der linken „Liste der zu suchenden Schlüsselwörter“ den regulären Ausdruck \d+ ein. Die Bedeutung dieses Ausdrucks ist: Gleiche ein oder mehrere aufeinanderfolgende Ziffern ab. Dabei steht \d für ein Ziffernzeichen und + dafür, dass das vorangehende Zeichen (die Ziffer) einmal oder mehrfach vorkommt. Somit kann die Regel sowohl einstellige, zweistellige als auch mehrstellige Ziffern im Text treffen.
Beispielsweise entsprechen die im Screenshot vor der Verarbeitung gezeigten „10“ und „30“ der Regel \d+. Auch andere Ziffernfragmente im Text wie „5“, „100“, „4“, „26“ und „000“ werden in ihrer jeweiligen fortlaufenden Ziffernfolge erkannt. Beachten Sie: Enthalten die Zahlen Kommas, Leerzeichen oder andere Trennzeichen, werden die fortlaufenden Ziffern entsprechend der Trennstellen separat abgeglichen. Dies sollten Sie bei der Festlegung der Ersetzungsregel vorab auf Übereinstimmung mit Ihren Erwartungen prüfen.
Schritt 5: Eingabe von AAA in der Liste der zu ersetzenden Schlüsselwörter
Geben Sie in der rechten „Liste der zu ersetzenden Schlüsselwörter“ den Text „AAA“ ein. Damit ist eine Suchen-und-Ersetzen-Beziehung hergestellt: Der von der linken Regel gefundene Zifferninhalt wird durch den rechts angegebenen Text AAA ersetzt. Der Screenshot zeigt rot markiert das linke \d+ und das rechte AAA, was anzeigt, dass die Regel eingerichtet ist.
Falls Ihre tatsächliche Anforderung abweicht, können Sie AAA durch andere Inhalte ersetzen. Zur Anonymisierung z. B. durch „***“, zur Vorlagenerstellung durch „{number}“ oder zur Platzhalterkorrektur durch „[Zahlenplatzhalter]“. Achten Sie jedoch bei der Einrichtung darauf, dass die Zuordnung der linken und rechten Regeln eindeutig ist, um versetzte mehrzeilige Regeln zu vermeiden.
Schritt 6: Weiter zum nächsten Schritt, Speicherort festlegen und Verarbeitung starten
Nach Abschluss der Schlüsselwort-Optionen klicken Sie unten auf „Weiter“. Im Ablauf der Oberfläche folgen die Schritte „Speicherort festlegen“ und „Verarbeitung starten“. Es wird empfohlen, beim Festlegen des Speicherorts ein Ausgabeverzeichnis zu wählen, das leicht zu unterscheiden ist, um ein Vermischen mit den Originaldateien und versehentliches Überschreiben oder erschwerte Rückverfolgbarkeit zu vermeiden. Nach Bestätigung des Speicherorts rufen Sie den Schritt Verarbeitung starten auf und führen die Aufgabe aus.
Das erwartete Ergebnis dieses Schrittes ist: Die Software führt gemäß der importierten Dateiliste für jede TXT-Datei dieselbe Suchen-und-Ersetzen-Regel mit regulärem Ausdruck aus und speichert die Verarbeitungsergebnisse am angegebenen Ort. Nach Abschluss der Verarbeitung können Sie stichprobenartig eine der Dateien öffnen und überprüfen, ob die Ziffern wie erwartet durch AAA ersetzt wurden.
Häufige Fragen und Hinweise
1. Warum \d+ verwenden, statt 10, 30, 100 einzeln einzugeben?
Weil es sich nicht um ein festes Schlüsselwort handelt. Einzelne Eingaben würden andere Ziffern übersehen und eignen sich nicht für die Verarbeitung vieler Dateien. \d+ gleicht fortlaufende Ziffern ab und kann so Ziffern unterschiedlicher Länge auf einmal abdecken, was besser zur Stapelersetzung passt.
2. Was ist der Unterschied zwischen „Text exakt suchen“ und „Formel für unscharfe Textsuche verwenden“?
Exakte Textsuche eignet sich zum Ersetzen fester Inhalte, z. B. fester Wörter, Phrasen oder Bezeichner. Formel für unscharfe Textsuche eignet sich, um mit Regeln eine Klasse von Inhalten abzugleichen, z. B. Ziffern, Nummern oder Zeichenketten eines bestimmten Formats. Da dieser Artikel alle Ziffern ersetzt, wird letztere gewählt.
3. Muss ich die Originaldateien vor der Stapelverarbeitung sichern?
Es wird empfohlen, ein Backup der Originaldateien aufzubewahren oder die Ergebnisse in einem neuen Verzeichnis zu speichern. Wenn die Regeln für die Stapelersetzung falsch gesetzt sind, kann dies nicht nur eine, sondern eine ganze Reihe von Dateien betreffen. Erst sichern, dann verarbeiten und abschließend stichprobenartig prüfen – das ist ein recht sicherer Arbeitsablauf im Büro.
4. Werden beim Ersetzen der Zahlen auch englische Texte beeinträchtigt?
Die Regel \d+ gleicht nur Ziffernzeichen ab und ersetzt nicht direkt gewöhnliche englische Buchstaben. Enthält der englische Text jedoch Ziffern, wie z. B. Jahreszahlen, Mengen, Entfernungen oder Nummern, werden auch diese ersetzt. Vor der Verarbeitung sollte sichergestellt sein, dass wirklich alle Ziffern einheitlich ersetzt werden sollen.
5. Lässt sich das auch für andere Formate wie doc, docx oder PDF verwenden?
Die Screenshots in diesem Artikel zeigen den Ablauf der Stapelsuche und -ersetzung für TXT-Dateiinhalte unter dem „Text-Werkzeug“. Für Word-Dokumente (doc, docx) oder PDF-Dateien sollten Sie die entsprechenden Word-Werkzeuge, PDF-Werkzeuge oder andere Funktionsmodule in der Software wählen. Aufgrund der unterschiedlichen Dateistrukturen können die Einstiegspunkte und Verarbeitungsregeln abweichen.
Fazit: Stapelersetzung mit regulären Ausdrücken macht aus manueller Textverarbeitung einen regelbasierten Prozess
Das Beispiel in diesem Artikel zeigt: Angesichts vieler Zahlen in mehreren TXT-Textdateien muss man nicht jede Datei einzeln öffnen oder jede unterschiedliche Zahl eingeben. Wählen Sie einfach in HeSoft Doc Batch Tool die Funktion „Text in Schlüsselwörtern suchen und ersetzen“, importieren Sie die zu verarbeitenden Dateien, wählen Sie „Formel für unscharfe Textsuche verwenden“, geben Sie \d+ als Suchregel ein und legen Sie AAA als Ersetzungsinhalt fest – schon lässt sich die Textersetzung stapelweise durchführen.
Der Kernnutzen dieser Methode liegt darin, Routinearbeiten von der Bürosoftware erledigen zu lassen und manuelle Arbeit in einen regelbasierten Prozess umzuwandeln. Für alle, die regelmäßig Daten organisieren, TXT-Dateien bereinigen, Protokolle verarbeiten, Inhalte anonymisieren oder Textvorlagen stapelweise ändern, kann die Beherrschung von Platzhaltern und regulären Ausdrücken zur Stapelsuche und -ersetzung die Effizienz deutlich steigern und das Risiko von Auslassungen verringern. Es wird empfohlen, die Regeln zunächst mit wenigen Testdateien zu prüfen und sie, nachdem die Ergebnisse korrekt sind, auf alle Textdateien im vollständigen Ordner anzuwenden.