Bei einer Reihe von TXT-Dateien ist das manuelle Suchen und Ersetzen sehr ineffizient, wenn in jeder Datei unterschiedliche Zahlen oder Nummern ersetzt werden müssen. Ausgehend von praktischen Büroszenarien erklärt dieser Artikel, wie Sie mit HeSoft Doc Batch Tool mehrere Textdateien in eine Aufgabe importieren und durch „Text mit Formel unscharf suchen“ die Regel \d+ eingeben, um alle übereinstimmenden Zahlen einheitlich durch AAA zu ersetzen. Der Artikel enthält einen Vorher-Nachher-Vergleich der Ergebnisse, detaillierte Schritte und Hinweise, um Benutzern die Methode zur Stapelsuche und -ersetzung von Textinhalten zu vermitteln.
In der täglichen Büroarbeit dienen Textdateien nicht nur der einfachen Aufzeichnung. Viele systemgenerierte Protokolle, Datenbankbeschreibungen, Schulungsmaterialien, gesammelte Webinhalte, Datenvermerke und technische Dokumentationen werden letztendlich im txt-Format gespeichert. Wenn die Anzahl dieser Dateien groß ist und darin ähnliche Inhalte einheitlich ersetzt werden müssen, wird die traditionelle manuelle Vorgehensweise sehr ineffizient.
Ein Beispiel: Eine Reihe von TXT-Dateien zum Thema Astronomie enthält eine Vielzahl von Zahlen: Masse, Entfernung, Radius, Jahr, Anzahl usw. Wenn diese Zahlen nun einheitlich durch einen Platzhalter AAA ersetzt werden sollen, zur Anonymisierung, für Tests oder zur Vorlagenverarbeitung, ist das einzelne Öffnen von Dateien wie big_bang.txt, black_holes.txt, dark_energy.txt offensichtlich nicht die ideale Lösung. Der bessere Ansatz ist die Nutzung der Stapelverarbeitungsfunktion einer Bürosoftware, um die Ersetzung durch Platzhalter oder reguläre Ausdrücke in einem Schritt durchzuführen.
Dieser Artikel beschreibt, wie Sie mit HeSoft Doc Batch Tool Schlüsselwörter in mehreren Textdateien suchen und ersetzen können. Diese Software gehört zu den Datei-Stapelverarbeitungswerkzeugen im Bereich Bürosoftware. Ihr Kernnutzen liegt in der Stapelverarbeitung von Dateien, der Reduzierung von Routineaufgaben und der Steigerung der Verarbeitungseffizienz. Am Beispiel "Alle Zahlen in mehreren TXT-Dateien durch AAA ersetzen" werden die Vorgehensweise und die einzelnen Schritte vollständig erläutert.
Anwendungsszenario: Am besten geeignet, wenn konkrete Schlüsselwörter unbekannt, aber das Inhaltsmuster bekannt ist
Normales Suchen und Ersetzen setzt voraus, dass Sie den zu suchenden konkreten Text kennen, z.B. suchen nach "2026" und ersetzen durch "2027". Oftmals soll jedoch nicht ein einzelnes festes Wort ersetzt werden, sondern eine ganze Kategorie von Inhalten. Beispielsweise alle Zahlen, alle Kennungen, alle Versionsnummern, alle Datumsteile. Hier ist die Suche mit Platzhaltern oder regulären Ausdrücken erforderlich.
Dieses Tutorial eignet sich für folgende Szenarien:
- Stapelersetzung von Zahlen in mehreren txt-Dateien: Beispielsweise das einheitliche Ersetzen von numerischen Werten in Dokumenten durch AAA, *** oder andere Platzhalter.
- Stapelanonymisierung von Textinhalten: Ersetzen von sensiblen Informationen wie Telefonnummern, Kennungen, Geldbeträgen oder statistischen Werten nach Regeln.
- Stapelnormalisierung von Materialvorlagen: Ersetzen variabler Felder in verschiedenen Dateien durch einheitliche Markierungen zur späteren Wiederverwendung.
- Stapelverarbeitung von Protokollen oder Exportdateien: Einheitliche Bereinigung großer, systemgenerierter Textmengen.
- Stapelersetzung veränderlicher Inhalte in englischen Texten: Beispielsweise eingestreute Zahlen, Einheitenwerte oder Kennungen in englischsprachigem Material.
Bei nur einer Datei mag manuelle Bearbeitung noch akzeptabel sein; bei Dutzenden oder Hunderten von Dateien zeigt der Nutzen eines Stapelverarbeitungswerkzeugs jedoch deutliche Vorteile. Es stellt sicher, dass dieselbe Regel auf alle ausgewählten Dateien angewendet wird und reduziert menschliche Auslassungen.
Ergebnisvorschau: Von verstreuten Zahlen zu einheitlichen Platzhaltern
Vor der Verarbeitung: Ordner mit mehreren zu verarbeitenden TXT-Dateien
Im Screenshot vor der Verarbeitung ist zu sehen, dass der Zielordner mehrere txt-Dateien enthält, darunter big_bang.txt, black_holes.txt, dark_energy.txt, dark_matter.txt und galaxies.txt. Diese Dateien haben oft ähnliche Inhaltsstrukturen, aber die konkreten Zahlen in jeder Datei sind unterschiedlich.

Bei manueller Vorgehensweise müssten diese Dateien einzeln geöffnet und die verschiedenen Zahlen gesucht werden. Problematisch ist, dass Sie nicht unbedingt wissen, welche Zahlen in jeder Datei vorkommen, und selbst wenn, müssten Sie den Ersetzungsvorgang mehrfach wiederholen.
Vor der Verarbeitung: Zahlen sind an verschiedenen Stellen in einer einzelnen Datei verteilt
Beim Öffnen von black_holes.txt sieht man im Text Zahlen wie 10, 30, die in englischen Absätzen eingebettet sind. Im Screenshot sind einige Zahlen mit roten Rahmen und Pfeilen markiert, was zeigt, dass diese Zahlen das Ziel dieser Stapelsuch- und -ersetzungsaktion sind.

Das gemeinsame Merkmal dieser Inhalte ist "besteht aus Ziffern", nicht dass sie einem festen Wert entsprechen. Wenn man der Software also mitteilen kann, dass alle Ziffern gesucht werden sollen, ist es nicht nötig, die konkreten Werte einzeln aufzulisten.
Nach der Verarbeitung: Die gefundenen Zahlen wurden durch AAA ersetzt
Nach Abschluss der Verarbeitung zeigt sich beim erneuten Betrachten von black_holes.txt, dass die ursprünglichen Zahlen zu AAA geworden sind. Im Screenshot erscheint an mehreren Stellen das grün markierte AAA, was zeigt, dass die Ersetzungsregel auf mehrere Zahlen in der Datei angewendet wurde.

Das Ergebnis zeigt, dass die Stapelersetzung nicht einfach ein bestimmtes Wort austauscht, sondern Inhalte findet, die einem Muster (Ausdruck) entsprechen. Dies ist der Kernnutzen von Platzhaltern und regulären Ausdrücken in der Stapeltextverarbeitung.
Schritte: Schlüsselwörter in Texten suchen und ersetzen
Schritt 1: Die entsprechende Funktion im Textwerkzeug öffnen
Wählen Sie nach dem Start von HeSoft Doc Batch Tool zunächst in der linken Funktionsleiste Textwerkzeug aus. Diese Kategorie enthält verschiedene Textverarbeitungsfunktionen wie Textkonvertierung, HTML-Konvertierung, Markdown-Konvertierung usw. Die diesmal benötigte Funktion ist die erste: Schlüsselwörter in Texten suchen und ersetzen.

Ziel der Auswahl dieser Funktion ist es, die Software in den Stapelsuche- und -ersetzungsablauf für Textdateiinhalte zu versetzen. Im Vergleich zur dateiweisen Bearbeitung in einem Editor sammelt das Stapelwerkzeug zunächst einheitlich die Dateien, dann werden die Regeln einheitlich festgelegt und schließlich wird alles in einem Durchgang verarbeitet.
Schritt 2: Dateien hinzufügen oder aus einem Ordner importieren
Nach dem Aufrufen der Funktionsseite zeigt der obere Bereich als aktuelle Aufgabe "Schlüsselwörter in Texten suchen und ersetzen" an. Schritt 1 des Ablaufs ist "Zu verarbeitende Datensätze auswählen". Oben rechts sehen Sie Schaltflächen wie Dateien hinzufügen, Aus Ordner importieren, Leeren und Mehr.

Wenn Dateien an verschiedenen Orten verstreut sind, können Sie sie über Dateien hinzufügen einzeln hinzufügen; befinden sich alle txt-Dateien im selben Ordner, ist der Import aus einem Ordner effizienter. Im Beispiel listet die Tabelle nach dem Import 5 Datensätze mit Informationen wie Dateiname, Pfad, Erweiterung, Erstellungsdatum und Änderungsdatum.
Das erwartete Ergebnis dieses Schritts ist, dass alle Textdateien, deren Inhalt ersetzt werden soll, in der Liste erscheinen und die Datensatzanzahl der Erwartung entspricht. Der untere Teil des Screenshots zeigt eine Datensatzanzahl von 5, was bedeutet, dass diese Aufgabe 5 TXT-Dateien verarbeiten wird. Klicken Sie nach Bestätigung der Liste auf Weiter.
Schritt 3: Suchmodus auf "Formel für unscharfe Textsuche verwenden" einstellen
In Schritt 2 "Verarbeitungsoptionen festlegen" muss zunächst der Suchmodus ausgewählt werden. Der Screenshot zeigt zwei Optionen: Präzise Textsuche, Formel für unscharfe Textsuche verwenden. Da in diesem Beispiel alle Ziffern gesucht werden sollen und nicht eine bestimmte Zeichenkette, wählen Sie Formel für unscharfe Textsuche verwenden.

Die "Formel für unscharfe Textsuche" kann hier als regelbasierte Suche verstanden werden. Für Anwender, die mit Suchausdrücken vertraut sind, ähnelt die Verwendung stark der von regulären Ausdrücken oder Platzhaltern: Eine Regel beschreibt eine Textklasse, und die Software sucht automatisch in mehreren Dateien danach.
Schritt 4: Eingabe der Suchregel \d+ und des Ersatztextes AAA
Geben Sie in der "Liste der zu suchenden Schlüsselwörter" ein:
\d+Geben Sie in der "Liste der zu ersetzenden Schlüsselwörter" ein:
AAADiese beiden Eingabefelder entsprechen einander. Links wird angegeben, wonach gesucht werden soll, rechts, wodurch der Treffer ersetzt werden soll. \d+ steht für die Übereinstimmung mit fortlaufenden Ziffern, AAA ist der Ersatztext. Nach der Einstellung werden alle passenden Ziffernfragmente in den Dateien durch AAA ersetzt.
Ziel dieses Schrittes ist es, vom "Ersetzen einer bestimmten Zahl" zum "Ersetzen aller Inhalte, die der Ziffernregel entsprechen" aufzusteigen. Wenn in einer Datei beispielsweise 5, 10, 30, 100, 26000 vorkommen, werden sie alle von derselben Regel verarbeitet.
Schritt 5: Speicherort einstellen und Verarbeitung starten
Der obere Teil der Benutzeroberfläche zeigt auch Schritt 3 "Speicherort festlegen" und Schritt 4 "Verarbeitung starten" an. Nachdem Sie die Schlüsselwortoptionen abgeschlossen haben, klicken Sie weiter auf Weiter und folgen dem Assistenten, um den Speicherort für die verarbeiteten Dateien festzulegen. Aus Sicherheitsgründen wird empfohlen, die Ergebnisse in einem neuen Ausgabeordner zu speichern.
Nach Festlegung des Speicherorts gehen Sie zum Schritt Verarbeitung starten. Nach der Ausführung wendet die Software dieselbe Suchen-und-Ersetzen-Regel auf die mehreren TXT-Dateien in der Liste an. Nach Abschluss können Sie eine oder mehrere Dateien öffnen und überprüfen, ob die ursprünglichen Ziffern zu AAA geworden sind.
Wichtige Punkte zu Regex und Platzhaltern: Erst die Regel verstehen, dann stapelweise ausführen
Der Schlüssel in diesem Fall ist \d+. Es sieht kurz aus, kann aber eine große Anzahl möglicher Ziffernfolgen repräsentieren. Das Verständnis seiner Bedeutung hilft, ähnliche Regeln in anderen Szenarien flexibel einzusetzen.
- \d: Übereinstimmung mit einem Ziffernzeichen.
- +: Übereinstimmung mit dem vorangehenden Element einmal oder mehrmals.
- \d+: Übereinstimmung mit einer fortlaufenden Ziffernfolge.
Es ist zu beachten, dass \d+ hauptsächlich auf fortlaufende Ziffern zutrifft. Bei einer Zahl mit Komma wie "26,000" im Text könnte sie 26 und 000 als zwei separate Ziffernfragmente behandeln, sodass das Ergebnis möglicherweise als AAA,AAA angezeigt wird. Für solche Zahlen mit Trennzeichen muss der Ausdruck weiter angepasst werden, wenn Sie einen vollständigen Ersatz wünschen.
Wenn Sie darüber hinaus Datumsangaben, Kennungen, Geldbeträge, Dezimalzahlen etc. verarbeiten möchten, sollten Sie die Regeln ebenfalls zuerst mit einer kleinen Stichprobendatei testen. Die Effizienz der Stapelverarbeitung ist hoch, aber nur unter der Voraussetzung, dass die Regeln korrekt sind.
Häufige Fragen und Hinweise
1. Können mehrere Suchen/Ersetzen-Paare gleichzeitig festgelegt werden
Wie in den Screenshots der "Schlüsselwortliste" und der "Ersetzungsschlüsselwortliste" zu sehen ist, unterstützt die Oberfläche das Ausfüllen von Such- und Ersetzungselementen in Listenform. Bei der tatsächlichen Nutzung ist darauf zu achten, dass die Inhalte der linken und rechten Seite genau einander entsprechen, um Verschiebungen zu vermeiden.
2. Was passiert, wenn der Ersatztext leer bleibt
Der rechte Bereich gibt den Hinweis "Leer lassen bedeutet löschen". Wenn der Ersatztext also leer bleibt, könnte der gefundene Inhalt gelöscht werden. Dies kann zur Stapelbereinigung von Texten nützlich sein, erfordert aber vor der Anwendung umso mehr ein Backup oder einen Test.
3. Werden Dateinamen beeinflusst
Der Funktionsname lautet "Schlüsselwörter in Texten suchen und ersetzen". Aus der Oberfläche und den Beispielen geht hervor, dass das Bearbeitungsobjekt der Textdateiinhalt ist, nicht der Dateiname. Wenn Sie Dateinamen stapelweise ändern müssen, sollten Sie die entsprechenden Werkzeuge im Bereich Dateinamen der Software verwenden.
4. Können Word-Dateien (docx, doc) verarbeitet werden
Dieser Artikel demonstriert die Verarbeitung von TXT-Dateien unter Textwerkzeug. Wenn Ihre Dateien Word-Dokumente sind, z. B. docx oder doc, sehen Sie in der linken Kategorie "Word-Werkzeug" der Software nach und wählen die passende Stapelverarbeitungsfunktion für Word-Dokumentinhalte.
5. Was ist die wichtigste Prüfung vor der Stapelersetzung
Am wichtigsten ist die Überprüfung der Dateiliste und der Ausdrucksregeln. Die Dateiliste bestimmt den Verarbeitungsumfang, die Ausdrucksregeln legen den zu ersetzenden Inhalt fest. Eine Fehleinstellung in einem dieser beiden Bereiche kann zu unerwarteten Ergebnissen führen.
Fazit: Die repetitive Textersetzung dem Stapelverarbeitungswerkzeug überlassen
Die stapelweise Ersetzung gleichartiger Inhalte in mehreren Textdateien ist ein sehr typischer Bedarf der Büroautomation. Mit HeSoft Doc Batch Tool können Sie zunächst TXT-Dateien stapelweise importieren, dann mittels "Formel für unscharfe Textsuche" die Regel \d+ eingeben und schließlich alle gefundenen Ziffern einheitlich durch AAA ersetzen. Im Vergleich zum manuellen Suchen und Ersetzen in jeder einzelnen Datei ist diese Methode schneller, stabiler und besser für die Verarbeitung großer Dateimengen geeignet.
Wenn Sie gerade eine Reihe von txt-Texten, Protokolldateien oder Materialentwürfen ordnen und Schlüsselwörter darin regelbasiert ersetzen müssen, empfiehlt es sich, zunächst einen Testordner vorzubereiten und die Schritte dieses Artikels für eine kleine Validierung durchzuspielen. Nachdem Sie das korrekte Ergebnis bestätigt haben, können Sie die Stapelverarbeitung auf die eigentlichen Dateien anwenden und so die Büroeffizienz bei gleichzeitiger Gewährleistung der Genauigkeit erheblich steigern.