Wenn mehrere TXT-Textdateien Zeilen enthalten, die ein bestimmtes Schlüsselwort, eine Jahreszahl oder eine Nummer enthalten, ist das einzelne Öffnen und Ändern der Dateien sehr ineffizient. Dieser Artikel zeigt, wie Sie mit HeSoft Doc Batch Tool die Funktion zum Ersetzen ganzer Zeilen in Textwerkzeugen verwenden, eine Formel zur unscharfen Textsuche auswählen, einen regulären Ausdruck als Übereinstimmungsregel eingeben und eine neue Ersetzungszeile festlegen können, um mehrere Textdateien auf einmal zu verarbeiten. Dies eignet sich für die Organisation von Bürodateien, die Aktualisierung von Verzeichnissen, die Bereinigung von Protokollen und die Wartung von Konfigurationsdateien.
Beim Batch-Ändern mehrerer TXT-Dateien ist das häufigste Problem nicht „Ersetzen nicht möglich“, sondern „der zu ersetzende Inhalt ist nicht völlig identisch“. Angenommen, es gibt eine Reihe von Textdateien, und jede Datei enthält eine Zeile ähnlich einer Anhang-Überschrift, die möglicherweise Jahreszahlen, Nummern oder Versionsinformationen enthält. Die Anforderung besteht nun darin, alle vollständigen Zeilen, die solche Schlüsselwörter enthalten, einheitlich durch eine neue Überschrift zu ersetzen. Wenn Sie jede Datei einzeln mit einem Editor öffnen und bearbeiten, wird die Wiederholungsarbeit umso deutlicher, je mehr Dateien vorhanden sind, und es ist schwer sicherzustellen, dass jede Datei einheitlich geändert wird.
Dieser Artikel stellt eine besser für die Batch-Verarbeitung im Büro geeignete Methode vor: Verwenden Sie HeSoft Doc Batch Tool , wählen Sie im Textwerkzeug „Vollständige Zeilen in Textdateien anhand von Schlüsselwörtern suchen und ersetzen“ aus, lokalisieren Sie Zielzeilen mithilfe von regulären Ausdrücken oder Platzhalterregeln und ersetzen Sie dann die gesamte übereinstimmende Zeile durch die angegebene neue Zeile. Das Beispiel verarbeitet mehrere TXT-Dateien, wobei das Ziel darin besteht, Zeilen mit einer vierstelligen Jahreszahl durch „Annex A - Q&A“ zu ersetzen.
Anwendungsszenarien
Diese Methode eignet sich besonders für die Verarbeitung von Textdateien mit ähnlicher Struktur, aber geringfügigen inhaltlichen Unterschieden. Zum Beispiel, wenn mehrere Projektbeschreibungs-TXTs alte Überarbeitungszeilen enthalten, die einheitlich durch eine neue Beschreibung ersetzt werden müssen; wenn aus mehreren Systemen exportierte Protokolldateien einen bestimmten Nummerntyp enthalten und die entsprechenden Zeilen durch einen festen Hinweis ersetzt werden müssen; wenn eine Anhang-Überschrift mit Jahreszahl in mehreren englischen Materialverzeichnissen stapelweise durch einen neuen Anhangnamen ersetzt werden muss; wenn mehrere Konfigurationstexte alte Parameterzeilen enthalten, die einheitlich durch neue Parameterzeilen ersetzt werden müssen.
Wenn nur ein festes Wort ersetzt werden soll, kann dies mit normalem Suchen und Ersetzen erledigt werden. Wenn Sie jedoch eine „vollständige Zeile mit einer bestimmten Art von Inhalt“ abgleichen möchten, sind reguläre Ausdrücke vorteilhafter. Beispielsweise kann \d{4} für vier aufeinanderfolgende Ziffern stehen und passt nicht nur auf 2020, sondern auch auf andere vierstellige Zahlen. In Kombination mit der Funktion zum Ersetzen vollständiger Zeilen kann ein „vollständiges Umschreiben von Zeilen, die einer Regel entsprechen“ erreicht werden.
HeSoft Doc Batch Tool gehört zur Kategorie der Stapelverarbeitungswerkzeuge in Bürosoftware. Der Hauptwert liegt in der Reduzierung sich wiederholender Vorgänge wie Öffnen, Kopieren, Einfügen und Speichern von Dateien. Für Stapelverarbeitungsaufgaben von TXT, Textdokumenten und anderen gängigen Bürodateien ist der einheitliche Import, die einheitliche Einstellung und die einmalige Ausführung in der Regel stabiler als die manuelle Bearbeitung.
Ergebnisvorschau: Von alten Zeilen mit Jahreszahl zu einer einheitlichen neuen Zeile
Vor der Verarbeitung: Viele Dateien, Zielzeilen über verschiedene TXTs verteilt
Im Screenshot vor der Verarbeitung ist zu sehen, dass der zu verarbeitende Ordner 5 TXT-Dateien enthält, nämlich 1.txt bis 5.txt. Obwohl das Beispiel nur 5 Dateien zeigt, könnten es in der Praxis Dutzende oder mehr sein. Je mehr Dateien, desto ungeeigneter ist es, sie einzeln zu öffnen und zu ändern.

Beim Öffnen von 1.txt sieht man Text wie „Annexes“ und „Contents“. Eine Zeile davon ist „Annex A - Food and drink standards - revised 2020“. Der rote Rahmen hebt die darin enthaltene „2020“ hervor, was das entscheidende Merkmal ist, das diese Regel erkennen soll. Beachten Sie, dass am Ende nicht nur die 2020, sondern die gesamte Zeile, die sie enthält, geändert werden soll.

Nach der Verarbeitung: Die gesamte Zeile wurde durch den neuen Standardinhalt ersetzt
Nach Abschluss der Verarbeitung wurde die Zeile, die ursprünglich die Jahreszahl enthielt, zu „Annex A - Q&A“. Die anderen Verzeichniszeilen in derselben Datei bleiben erhalten, was zeigt, dass die Ersetzungsregel keine Inhalte beeinflusst hat, die das Zielschlüsselwort nicht enthalten. Für die Batch-Bereinigung von Dokumenten sorgt dieser Effekt des „Ersetzens nur der passenden Zeilen“ für einen klareren Verarbeitungsumfang.

Vorgehensweise
Schritt 1: Finden der Funktion zum Ersetzen vollständiger Zeilen im Textwerkzeug
Navigieren Sie nach dem Start von HeSoft Doc Batch Tool im linken Menü zum „Textwerkzeug“. In der Oberfläche werden mehrere textbezogene Funktionen angezeigt. Die diesmal zu verwendende ist Punkt 2: „Vollständige Zeilen in Textdateien anhand von Schlüsselwörtern suchen und ersetzen“. Der rote Hinweis im Screenshot erklärt auch den Zweck dieser Funktion: Stapelweises Löschen oder Ersetzen vollständiger Zeilen, die ein bestimmtes Schlüsselwort enthalten, durch neuen Text.

Der Grund für die Auswahl dieser Funktion liegt darin, dass sie der Kernlogik dieser Anforderung entspricht: Sobald eine Zeile das Zielschlüsselwort enthält, wird diese gesamte Zeile ersetzt. Würde fälschlicherweise das normale „Schlüsselwörter in Text suchen und ersetzen“ gewählt, würden wahrscheinlich nur lokale Zeichen ersetzt und nicht die gesamte Zeile in den neuen Standardinhalt geändert werden können.
Schritt 2: Importieren der zu verarbeitenden Textdateien
Nach dem Aufruf der Funktion besteht der erste Schritt darin, „die zu verarbeitenden Datensätze auszuwählen“. Sie können bestimmte TXTs über „Dateien hinzufügen“ importieren oder über „Dateien aus Ordner importieren“ alle Dateien in einem gesamten Ordner stapelweise hinzufügen. Im Screenshot wurden bereits 5 Datensätze importiert, mit den Namen 1.txt, 2.txt, 3.txt, 4.txt, 5.txt, alle mit der Erweiterung txt.

Es wird empfohlen, die Liste nach dem Import sorgfältig zu überprüfen. Erstens, ob die Anzahl der Dateien korrekt ist (der Screenshot zeigt unten 5 Datensätze); zweitens, ob der Pfad dem erwarteten Verzeichnis entspricht, wie z. B. D:\test; und drittens, ob die Erweiterung dem Verarbeitungsobjekt entspricht. Klicken Sie nach der Bestätigung auf „Weiter“, um mit der Konfiguration der Verarbeitungsoptionen fortzufahren. Dieser Überprüfungsprozess verhindert, dass irrelevante Dateien zur Stapelverarbeitungsaufgabe hinzugefügt werden.
Schritt 3: Aktivieren der unscharfen Formelsuche für Text
Sehen Sie sich auf der Seite „Verarbeitungsoptionen einstellen“ zunächst die „Suchmethode“ an. Die Oberfläche bietet „Text exakt suchen“ und „Unschaffe Formelsuche für Text verwenden“. In diesem Beispiel wird „Unschaffe Formelsuche für Text verwenden“ gewählt, da nach einem Muster (vierstellige Ziffern) und nicht nach einem völlig feststehenden Wort gesucht werden soll.

Geben Sie in der linken Liste „Liste der zu suchenden Schlüsselwörter“ den Ausdruck \d{4} ein. Aus der Perspektive regulärer Ausdrücke bedeutet \d eine Ziffer und {4} das 4-malige aufeinanderfolgende Auftreten, die Gesamtbedeutung ist also vier aufeinanderfolgende Ziffern. Für die „2020“ im Screenshot trifft diese Regel genau zu, sodass diese Zeile als zu ersetzende Zeile identifiziert wird.
Schritt 4: Eingabe des ersetzenden Textes für die gesamte Zeile
Geben Sie in der rechten „Liste der ersetzenden Schlüsselwörter“ den Zielinhalt ein. Im Screenshot wurde „Annex A - Q&A“ eingegeben. Da der Funktionsname ausdrücklich das Ersetzen der „vollständigen Zeile“ in Textdateien benennt, ist der rechte Inhalt als die ersetzte, vollständig neue Zeile zu verstehen und nicht als lokal zu ersetzender Text.
Stellen Sie bei der Einrichtung sicher, dass die linke Regel und der rechte Ersetzungsinhalt eins zu eins übereinstimmen. Wenn es links nur eine Suchregel gibt, füllen Sie rechts auch nur ein Ersetzungsergebnis aus. Bei mehreren Regeln sollten diese einzeln überprüft werden, um Fehler durch nicht übereinstimmende Reihenfolge von Regeln und Ersetzungsinhalten zu vermeiden.
Schritt 5: Speicherort festlegen und Verarbeitung ausführen
Klicken Sie nach Abschluss der Regeleinstellungen erneut auf „Weiter“. Der obere Prozessablauf zeigt, dass danach noch „Speicherort festlegen“ und „Verarbeitung starten“ folgen. Der Speicherort ist entscheidend dafür, ob die Originaldateien überschrieben werden und wo die Ergebnisdateien gespeichert werden. Um die Vorher-Nachher-Effekte besser vergleichen zu können, wird empfohlen, vorzugsweise einen neuen Ausgabeort zu wählen oder zumindest vor dem Vorgang eine Sicherungskopie der Originaldateien zu erstellen.
In der Phase des Verarbeitungsstarts verarbeitet die Software jede TXT-Datei in der Reihenfolge der Liste. Überprüfen Sie nach Abschluss die Ergebnisdateien: Die Zielzeilen mit vierstelligen Ziffern sollten durch „Annex A - Q&A“ ersetzt worden sein. Wenn mehrere Dateien die gleiche Struktur haben, kann der identische Ersatz ganzer Zeilen mit derselben Regel in einem Durchgang erfolgen.
Häufige Fragen und Hinweise
Der Übereinstimmungsbereich des regulären Ausdrucks sollte gut kontrolliert werden
\d{4} ist zwar praktisch, hat aber einen recht breiten Übereinstimmungsbereich. Sobald in einer Zeile vier aufeinanderfolgende Ziffern auftauchen, könnte sie ersetzt werden. Wenn die Datei andere Jahreszahlen, Nummern, Seitenzahlen oder Codes enthält, die nicht ersetzt werden sollen, verwenden Sie keine zu breit gefasste Regel. Sie können zu einer spezifischeren Textkombination wechseln, z. B. ein Muster, das „revised“ und vier Ziffern enthält, oder direkt ein klareres, festes Schlüsselwort verwenden.
Lokales Ersetzen und Ersetzen ganzer Zeilen nicht verwechseln
Das Verarbeitungsobjekt dieser Funktion ist die vollständige Zeile. Angenommen, die Originalzeile lautet „Annex A - Food and drink standards - revised 2020“, würde sie nach der Ersetzung zu „Annex A - Q&A“ werden und nicht nur 2020 durch Q&A ersetzen. Stellen Sie vor der Verwendung sicher, dass die Anforderung tatsächlich die Änderung der gesamten Zeile ist.
Vor der Stapelverarbeitung einen kleinen Test durchführen
Wenn die Regel komplex ist, empfiehlt es sich, zunächst 1 bis 2 Beispieldateien zum Testen zu importieren. Bestätigen Sie, dass das Verarbeitungsergebnis den Erwartungen entspricht, bevor Sie alle Dateien stapelweise importieren. Dies reduziert das Risiko von Fehlersetzungen und hilft Ihnen zu überprüfen, ob das Format des ersetzten Textes den Anforderungen entspricht.
Option für Groß-/Kleinschreibung beachten
Die zusätzlichen Optionen im Screenshot enthalten „Groß-/Kleinschreibung ignorieren“. Wenn Sie nach englischen Schlüsselwörtern suchen und die Dateien möglicherweise Unterschiede in der Groß-/Kleinschreibung aufweisen, können Sie dies nach Bedarf aktivieren. Wenn Sie nach einem Ziffernmuster wie \d{4} suchen, hat die Groß-/Kleinschreibungsoption in der Regel wenig Einfluss.
Zusammenfassung
Die Kernidee beim stapelweisen Ersetzen von vollständigen Zeilen, die Schlüsselwörter in mehreren TXT-Dateien enthalten, besteht darin, zunächst die Übereinstimmungsregel zu definieren und dann das Ergebnis für die Ersetzung der gesamten Zeile festzulegen. HeSoft Doc Batch Tool bietet einen büroorientierten Batch-Textverarbeitungsprozess: Funktion wählen, Dateien importieren, Suchmodus einstellen, Ersetzungszeile eintragen, Speicherort festlegen und Verarbeitung starten. Im Vergleich zum manuellen Öffnen jeder Datei ist dieser Ansatz besser für Aufgaben mit hoher Wiederholungsrate, vielen Dateien und einheitlichen Regeln geeignet. Es wird empfohlen, die Originaldateien vor der formellen Verarbeitung zu sichern und den Übereinstimmungsbereich des regulären Ausdrucks zunächst mit Mustern zu validieren, bevor die Batch-Ausführung erfolgt.