Wenn mehrere TXT-Textdateien Zeilen mit Jahren, Nummern, Schlüsselwörtern oder fest formatierten Inhalten enthalten, die einheitlich durch neue Inhalte ersetzt werden müssen, ist das manuelle Öffnen und Bearbeiten jeder Datei nicht nur zeitaufwendig, sondern auch fehleranfällig. Dieser Text verwendet HeSoft Doc Batch Tool als Beispiel und zeigt, wie die Funktion „Vollständige Zeilen anhand von Schlüsselwörtern in Textdateien suchen und ersetzen“ genutzt werden kann. Mit Platzhalter- und regulären Ausdrücken werden ganze Zeilen, die eine vierstellige Zahl enthalten, abgeglichen und durch eine neue, angegebene Zeile ersetzt. Dies eignet sich für die Massenverarbeitung von TXT-Protokollen, Konfigurationsdateien, Checklisten-Dokumenten und Datentexten.
In der täglichen Büroarbeit, der Materialorganisation, der Systemwartung und der Datenbereinigung besteht häufig die Anforderung, dass viele TXT-Textdateien bestimmte Schlüsselwörter enthalten, wie z. B. Jahreszahlen, Nummern, Versionsnummern, Kundennamen, Vertragsnummern, Statusfelder usw. Wir möchten nicht nur das Schlüsselwort selbst ersetzen, sondern die gesamte Zeile, die dieses Schlüsselwort enthält, durch eine neue Zeile ersetzen.
Wenn es sich nur um ein oder zwei Dateien handelt, ist eine manuelle Bearbeitung mit Notepad, Notepad++ oder einem anderen Texteditor noch akzeptabel. Bei Dutzenden oder Hunderten von TXT-Dateien wäre das einzelne Öffnen, Suchen, Auswählen der ganzen Zeile, Löschen und Eingeben einer neuen Zeile jedoch sehr ineffizient und fehleranfällig, z. B. durch ausgelassene Änderungen, falsche Änderungen oder inkonsistente Formatierung. Dieser Artikel befasst sich mit diesem typischen Problem der Stapeltextverarbeitung: der Verwendung von Platzhalter-Regulärausdrücken, um in mehreren Textdateien alle Zeilen, die ein Schlüsselwort enthalten, durch eine neue Zeile zu ersetzen.
Am Beispiel von " HeSoft Doc Batch Tool " im Screenshot wird im Folgenden gezeigt, wie Sie mit der Stapelverarbeitungsfunktion der Office-Software einen vollständigen Zeilersetzungsvorgang für mehrere Textdateien gleichzeitig durchführen können. Im Beispiel gibt es mehrere Textdateien wie 1.txt, 2.txt, 3.txt, 4.txt, 5.txt, und eine Zeile in den Dateien enthält eine vierstellige Jahreszahl wie "2020". Wir verwenden einen regulären Platzhalterausdruck wie \d{4}, um vierstellige Zahlen zu finden, und ersetzen die gesamte Zeile, die diesen Treffer enthält, durch Annex A - Q&A.
Anwendungsszenarien: Wann ist ein Massenersetzen ganzer Zeilen mit Schlüsselwörtern erforderlich?
„Schlüsselwort suchen und gesamte Zeile ersetzen“ unterscheidet sich vom gewöhnlichen „Suchen und Ersetzen von Text“. Beim gewöhnlichen Ersetzen werden meist nur die gefundenen Zeichen ersetzt, z. B. „2020“ durch „2026“. Beim Ersetzen ganzer Zeilen wird die gesamte Zeile durch eine neue ersetzt, sobald sie das Zielschlüsselwort enthält. Diese Funktion eignet sich besser für strukturierte, semi-strukturierte oder formatierte Büromaterialien.
Zu den häufigsten Anwendungsszenarien gehören:
- Massenänderung bestimmter Einträge in TXT-Listen: Beispielsweise enthalten viele Listendateien Zeilen mit einer bestimmten Produktnummer, Kapitelnummer oder Jahreszahl, die durch einen neuen Titel vereinheitlicht werden sollen.
- Massenverarbeitung von Protokolldateien: Protokolle enthalten bestimmte Statuscodes, Fehlercodes oder Zeitformate, und die entsprechenden Zeilen sollen zur Archivierung oder Anonymisierung durch eine einheitliche Beschreibung ersetzt werden.
- Massenaktualisierung von Konfigurationsdateien: Mehrere Konfigurationstexte enthalten veraltete Serveradressen, Versionsnummern, Schalter oder Pfadinformationen, die zeilenweise ersetzt werden müssen, um unvollständige Konfigurationen zu vermeiden, die durch nur teilweise Änderungen entstehen könnten.
- Massenbereinigung von Materialtexten: Aus Webseiten, PDF-, Word-, DOCX-, DOC-Dokumenten oder Systemexporten stammende Texte enthalten oft Zeilen mit Daten, Nummern, Urheberrechtsinformationen, die vereinheitlicht oder standardisiert werden müssen.
- Massennormierung von Dokumentenverzeichniszeilen: Beispielsweise enthalten einige Dokumentenverzeichnisse einen alten Titel wie „Annex A - Food and drink standards - revised 2020“ und sollen direkt in „Annex A - Q&A“ geändert werden.
Für Büroangestellte sind diese Aufgaben sehr repetitiv. Die manuelle Bearbeitung ist technisch nicht schwierig, aber sehr zeitaufwendig. Mit Office-Software wie HeSoft Doc Batch Tool können Sie diese sich wiederholenden Vorgänge einem Stapelverarbeitungsprozess überlassen. Der Benutzer muss lediglich die Dateien, die Übereinstimmungsregeln und den Ersatzinhalt einstellen.
Ergebnisvorschau: Mehrere TXT-Dateien vor der Verarbeitung mit zu ersetzenden Zeilen
In der Dateiliste vor der Verarbeitung ist zu sehen, dass sich im aktuellen Ordner mehrere Textdateien mit den Namen 1.txt, 2.txt, 3.txt, 4.txt, 5.txt befinden. Diese Dateien können die zu verarbeitenden Zielinhalte enthalten.

Öffnen wir eine der Beispieldateien, 1.txt, so sehen wir im Textinhalt Verzeichnis- und Anhanginformationen. Die dritte Zeile lautet:
Annex A - Food and drink standards - revised 2020
Das Ende dieser Zeile enthält die vierstellige Zahl „2020“. Wenn unser Verarbeitungsziel lautet „Wenn eine Zeile eine vierstellige Zahl enthält, ersetze die gesamte Zeile durch einen neuen, festgelegten Inhalt“, dann ist dies eine Zeile, die ersetzt werden muss.

Es ist wichtig zu beachten, dass das Beispiel in diesem Artikel nicht einfach „2020“ durch ein neues Jahr ersetzt, sondern die gesamte Zeile, die „2020“ enthält, durch eine neue Zeile. Das bedeutet, dass das ursprüngliche „Annex A - Food and drink standards - revised 2020“ vollständig in „Annex A - Q&A“ geändert wird. Dies ist der Kernwert der Funktion „Vollständige Zeilen in Textdateien anhand eines Schlüsselworts suchen und ersetzen“.
Ergebnisvorschau: Zielzeile nach der Verarbeitung durch neue Zeile ersetzt
Öffnen wir nach Abschluss der Verarbeitung erneut 1.txt, sehen wir, dass die ursprüngliche Zeile mit „2020“ ersetzt wurde durch:
Annex A - Q&A

Anhand des Screenshots nach der Verarbeitung ist zu erkennen, dass das Ersetzungsergebnis nicht nur das Jahr geändert hat und auch nicht Inhalt an die ursprüngliche Zeile angehängt wurde, sondern die gefundene vollständige Zeile durch eine neue Textzeile ersetzt wurde. Andere Zeilen, die nicht der Regel entsprachen, wie „Annex B“, „Annex C“, „Contents“ und die nachfolgenden Verzeichniseinträge, bleiben unverändert. Diese Verarbeitungsweise ist sehr gut geeignet für Büroszenarien, in denen „ganze Zeilen mit einem Schlüsselwort massenhaft ersetzt werden“ sollen. Sie gewährleistet die einheitliche Aktualisierung der Zielzeilen und vermeidet gleichzeitig die Beeinflussung irrelevanter Inhalte.
Schritte: Verwenden von HeSoft Doc Batch Tool zum massenhaften Ersetzen ganzer Textzeilen
Schritt 1: Textwerkzeug öffnen und „Vollständige Zeilen in Textdateien anhand eines Schlüsselworts suchen und ersetzen“ wählen
Wählen Sie nach dem Öffnen von HeSoft Doc Batch Tool in der linken Werkzeugkategorie „Textwerkzeug“. Suchen Sie in der Funktionsliste den Eintrag „Vollständige Zeilen in Textdateien anhand eines Schlüsselworts suchen und ersetzen“ und klicken Sie darauf. Die Beschreibung dieser Funktion im Screenshot lautet „Stapelweises Löschen oder Ersetzen vollständiger Zeilen in Textdateien, die ein bestimmtes Schlüsselwort enthalten, durch neuen Text“, was genau der in diesem Artikel zu erledigenden Aufgabe entspricht.

Das Ziel dieses Schrittes ist es, zuerst die korrekte Stapelverarbeitungsfunktion aufzurufen. Da es in der Software auch andere Werkzeuge wie Text zu Word, Text zu PDF, HTML zu TXT, Markdown zu Word usw. gibt, wählen Sie bei reiner Textformatkonvertierung einfach eine andere Funktion. Wenn das Ziel aber „Schlüsselwort suchen und ganze Zeile ersetzen“ ist, sollte diese aktuelle Funktion verwendet werden.
Nach dem Aufrufen der Funktion führt die Software den Benutzer in einem assistentengeführten Prozess durch die Verarbeitung. In der Benutzeroberfläche sind die Schritte in der Reihenfolge zu sehen: Auswahl der zu verarbeitenden Datensätze, Festlegung der Verarbeitungsoptionen, Festlegung des Speicherorts, Verarbeitung starten. Dieser Ablauf eignet sich für die Stapelverarbeitung von Dateien und verhindert, dass der Benutzer wichtige Einstellungen vergisst.
Schritt 2: Die zu verarbeitenden TXT-Dateien für die Stapelverarbeitung hinzufügen
Nachdem Sie die Funktionsseite aufgerufen haben, müssen Sie zunächst die zu verarbeitenden Datensätze auswählen. Im Screenshot wurden bereits 5 TXT-Dateien importiert: 1.txt, 2.txt, 3.txt, 4.txt, 5.txt, die sich im Pfad D:\test\ befinden. Die Tabelle zeigt auch Informationen wie Erweiterung, Erstellungsdatum und Änderungsdatum an, damit der Benutzer überprüfen kann, ob die richtigen Dateien importiert wurden.

Oben rechts in dieser Benutzeroberfläche sind die Einträge „Dateien hinzufügen“, „Dateien aus Ordner importieren“, „Leeren“, „Mehr“ zu sehen. Wenn in der Praxis nur wenige bestimmte Dateien verarbeitet werden müssen, können diese über „Dateien hinzufügen“ importiert werden. Wenn ein Ordner viele TXT-Dateien zur einheitlichen Verarbeitung enthält, ist „Dateien aus Ordner importieren“ besser geeignet. Nach dem Import wird empfohlen, die Anzahl, die Namen und die Pfade der Dateien zu überprüfen, um sicherzustellen, dass dem Auftrag keine irrelevanten Dateien hinzugefügt wurden.
Das erwartete Ergebnis dieses Schritts ist: Alle Textdateien, bei denen eine ganze Zeile ersetzt werden muss, erscheinen in der Liste. Der untere Rand des Screenshots zeigt eine Datensatzanzahl von 5, was bedeutet, dass die aktuelle Stapelaufgabe 5 Textdateien verarbeitet. Wenn Sie sicher sind, dass alles korrekt ist, klicken Sie auf „Weiter“ am unteren Seitenrand, um mit den Verarbeitungsoptionen fortzufahren.
Schritt 3: Suchmethode einstellen und Platzhalter-Abgleich mit regulärem Ausdruck aktivieren
Auf der Seite „Verarbeitungsoptionen festlegen“ muss zunächst die Suchmethode eingestellt werden. Im Screenshot sind unter „Suchmethode“ die Optionen „Text genau suchen“ und „Text unscharf mit Formel suchen“ zu sehen. In diesem Beispiel wurde „Text unscharf mit Formel suchen“ gewählt. Diese Option eignet sich für den Abgleich mit Platzhaltern, Formeln oder ähnlich wie regulären Ausdrücken.

Warum wurde hier nicht „Text genau suchen“ gewählt? Weil das Beispiel eine vierstellige Zahl finden soll, die in der Praxis 2020, 2021, 2026 oder ein anderes Jahr sein könnte. Bei einer genauen Suche müsste jedes spezifische Jahr einzeln eingegeben werden. Ein Ausdruck wie \d{4} hingegen findet jede beliebige vierstellige Zahl und eignet sich besser für die Stapelverarbeitung variabler Inhalte in vielen Dateien.
Geben Sie in die „Liste der zu suchenden Schlüsselwörter“ ein:
\d{4}
Dieser Ausdruck bedeutet: Suche nach 4 aufeinanderfolgenden Ziffern. Die „2020“ in der Beispieldatei entspricht dieser Regel, daher wird die gesamte Zeile mit „2020“ als Zielzeile erkannt.
Sollte Ihr tatsächliches Geschäftsszenario nicht die Suche nach Jahreszahlen sein, können Sie dies nach Bedarf in andere Schlüsselwörter oder Ausdrücke ändern. Zum Beispiel um festen Text wie „ERROR“ zu finden, ein bestimmtes Präfix einer Vertragsnummer zu suchen oder Zeilen mit einer Versionsnummer zu finden. Entscheidend ist: Der hier eingegebene Inhalt dient der Beurteilung, welche Zeile ersetzt werden muss, und ersetzt nicht nur die gefundenen Zeichen selbst.
Schritt 4: Inhalt für die neue zu ersetzende Zeile eingeben
Geben Sie in die rechte Liste „Liste der zu ersetzenden Schlüsselwörter“ den gesamten Text der neuen Zeile ein. Im Beispiel wurde eingetragen:
Annex A - Q&A
Da die aktuelle Funktion „Ganze Zeilen suchen und ersetzen“ ist, ersetzt die Software die vollständige Zeile durch den in der rechten Spalte eingestellten neuen Text, wenn eine Zeile einen Treffer aus der linken Schlüsselwortliste enthält. Das bedeutet, aus:
Annex A - Food and drink standards - revised 2020
wird:
Annex A - Q&A
Der rechte Bereich im Screenshot enthält den Hinweis „Leer lassen bedeutet Löschen“. Das bedeutet, dass die gesamte Zeile, die das Schlüsselwort enthält, gelöscht werden kann, wenn der rechte Ersatzinhalt leer bleibt. Das Ziel dieses Artikels ist jedoch das Ersetzen durch eine neue Zeile, daher muss der neue Zeileninhalt eingegeben werden. Für die Bereinigung von Bürodokumenten ist dies besonders wichtig: Lassen Sie das Feld leer, wenn Zeilen mit einem bestimmten Schlüsselwort gelöscht werden sollen; füllen Sie es aus, wenn sie durch einen Standardtext aktualisiert werden sollen.
Schritt 5: Speicherort festlegen und mit der Stapelverarbeitung fortfahren
Nachdem Sie die Suchregel und den Ersatzinhalt festgelegt haben, klicken Sie weiter auf „Weiter“. Gemäß den Prozessangaben oben auf der Seite müssen Sie anschließend noch den Speicherort festlegen, bevor Sie die Verarbeitung starten. Obwohl die Screenshots in diesem Artikel hauptsächlich die wichtigsten Einstellungen der ersten beiden Schritte zeigen, geht aus dem Assistentenprozess klar hervor, dass die Software den Benutzer den Ausgabeort vor der endgültigen Ausführung bestätigen lässt.
Bei der Stapeländerung von Textdateien wird empfohlen, vorzugsweise ein neues Ausgabeverzeichnis zum Speichern der Verarbeitungsergebnisse zu wählen, anstatt die Originaldateien direkt zu überschreiben. Der Vorteil ist: Falls der Ausdruck falsch geschrieben oder der Ersatzinhalt nicht erwartungsgemäß ist, kann man immer noch zu den Originaldateien zurückkehren und die Verarbeitung wiederholen. Insbesondere bei der Verarbeitung vieler TXT-, LOG-, CSV- oder aus Word/DOCX/DOC konvertierter Textmaterialien ist es eine sicherere Methode, die Originaldateien beizubehalten.
Fahren Sie nach Abschluss der Speicherort-Einstellungen mit dem Schritt „Verarbeitung starten“ fort und führen Sie den Auftrag aus. Öffnen Sie nach Abschluss der Verarbeitung die ausgegebenen TXT-Dateien zur Überprüfung. Sie sollten sehen, dass die Zielzeilen mit der vierstelligen Zahl durch den neuen Inhalt der ganzen Zeile ersetzt wurden.
Konzept für Platzhalter-Regulärausdrücke: Vermeidung falscher Treffer
Das massenhafte Ersetzen ganzer Zeilen ist sehr effizient, aber die Regeln müssen mit Bedacht festgelegt werden. Denn ein zu weit gefasster Ausdruck könnte Zeilen treffen, die eigentlich nicht ersetzt werden sollen. Im Beispiel dieses Artikels findet \d{4} jede beliebige vierstellige Zahl. Enthält der Text neben Jahreszahlen auch andere vierstellige Nummern, Seitenzahlen, Beträge, Codes usw., könnten diese Zeilen ebenfalls als Zielzeilen erkannt werden.
Wenn Ihre Textstruktur komplexer ist, können Sie erwägen, die Regel zu präzisieren. Wenn Sie beispielsweise nur Zeilen ersetzen möchten, die Inhalte wie „revised 2020“ enthalten, verwenden Sie nicht nur die Jahreszahl, sondern ein Schlüsselwort, das näher am Geschäftstext liegt; wenn Sie nur die Jahreszahl in einer bestimmten Kapitelüberschrift ersetzen möchten, können Sie „Annex A“ mit einer Ziffernregel kombinieren. Auf diese Weise lässt sich das Risiko falscher Treffer verringern.
Vor der offiziellen Verarbeitung einer großen Anzahl von Dateien wird empfohlen, zunächst einige Beispieldateien zum Testen zu kopieren. Wenn Sie bestätigt haben, dass die Ersetzungsergebnisse Ihren Erwartungen entsprechen, importieren Sie den gesamten Ordner für die Stapelausführung. Dies ist eine empfohlene Vorgehensweise für alle Stapelverarbeitungswerkzeuge.
Häufige Fragen und Hinweise
1. Ersetzt diese Funktion das Schlüsselwort oder die ganze Zeile?
Aus dem Funktionsnamen und dem Verarbeitungseffekt geht hervor, dass sie die „vollständige Zeile, die das Schlüsselwort enthält“, ersetzt. Im Beispiel wurde „2020“ gefunden, aber letztendlich wurde die gesamte Zeile „Annex A - Food and drink standards - revised 2020“ ersetzt und nicht nur „2020“.
2. Warum sollte man „Text unscharf mit Formel suchen“ wählen?
Wenn Sie festen Text suchen möchten, können Sie die genaue Suche verwenden; wenn Sie variable Inhalte wie beliebige vierstellige Zahlen, verschiedene Jahre oder Nummern suchen möchten, sollten Sie „Text unscharf mit Formel suchen“ verwenden. \d{4} im Beispiel ist eine solche flexiblere Methode für den Ausdrucksabgleich.
3. Kann der rechte Ersatzinhalt leer sein?
Der Screenshot enthält den Hinweis „Leer lassen bedeutet Löschen“. Wenn Ihr Ziel das Löschen ganzer Zeilen mit einem bestimmten Schlüsselwort ist, können Sie den Ersatzinhalt leer lassen. Wenn Ihr Ziel wie in diesem Artikel darin besteht, die Zielzeile durch eine neue Zeile zu ersetzen, muss der Ersatztext eingegeben werden.
4. Hat dies Auswirkungen auf Zeilen, die das Schlüsselwort nicht enthalten?
Aus dem Ergebnis der Verarbeitung ist ersichtlich, dass Zeilen ohne Treffer unverändert bleiben. Solange die Suchregel genau eingestellt ist, verarbeitet die Software daher nur Zeilen, die das Zielschlüsselwort oder den passenden Ausdruck enthalten.
5. Können nur TXT-Dateien verarbeitet werden?
Dieser Artikel zeigt die massenhafte Ersetzung ganzer Zeilen in TXT-Textdateien. Für Bürodokumente wie Word, DOCX, DOC, PDF usw. ist es, wenn eine ähnliche Verarbeitung erforderlich ist, in der Regel notwendig, sie je nach Situation zunächst in ein verarbeitbares Textformat zu konvertieren oder die entsprechenden Word-, PDF- oder Textwerkzeuge in der Software zu verwenden. Andere Formate werden in diesem Artikel nicht behandelt, es gilt der im Screenshot gezeigte TXT-Stapelverarbeitungsprozess.
Fazit: Überlassen Sie das wiederholte Ersetzen ganzer Textzeilen dem Stapelverarbeitungswerkzeug
Das massenhafte Ersetzen ganzer Zeilen mit einem Schlüsselwort in mehreren Textdateien ist eine sehr typische Anforderung der Büroautomatisierung. Manuelle Verarbeitung ist nicht nur langsam, sondern es können auch leicht Dateien oder Zeilen übersehen werden. Mit HeSoft Doc Batch Tool können Sie mehrere TXT-Dateien importieren, einen Platzhalter-Regulärausdruck einrichten, die neue Zeile eintragen und die Speicherung und Verarbeitung dann schrittweise gemäß Assistent abschließen, um eine einmalige Konfiguration und massenhafte Ausführung zu erreichen.
Das Beispiel in diesem Artikel verwendet \d{4}, um Zeilen mit einer vierstelligen Zahl zu finden und die gesamte Zeile durch Annex A - Q&A zu ersetzen. Nach der Verarbeitung ist zu sehen, dass die Zielzeilen präzise ersetzt wurden, während andere Inhalte unverändert blieben. Für Benutzer, die Textinhalte massenhaft ändern, Materialien bereinigen, Konfigurationen aktualisieren, Verzeichnisse organisieren oder viele TXT-Dateien verarbeiten müssen, kann eine solche Office-Software den sich wiederholenden Arbeitsaufwand erheblich reduzieren und die Effizienz der Dateiverarbeitung steigern.
Wenn auch Sie mehrere Textdateien haben, bei denen die gesamte Zeile mit einem bestimmten Schlüsselwort einheitlich ersetzt werden muss, empfiehlt es sich, zunächst eine Handvoll Beispieldateien vorzubereiten, den Ausdruck zu testen und dann den gesamten Ordner für die Stapelverarbeitung zu importieren, sobald die Richtigkeit der Ergebnisse bestätigt ist. So kann sowohl die Effizienz sichergestellt als auch das Risiko von Fehlbedienungen gesenkt werden.