Bei der täglichen Verarbeitung von TXT-Text stoßen wir häufig auf redundante oder ähnliche Inhalte im Dokument, die bereinigt werden müssen. Dies können einige vom System generierte Tags, doppelte Daten einträge oder bestimmte Beschreibung wörter sein, die einheitlich bereinigt werden müssen, jedoch basierend auf der TXT-Datei. Es gibt keine Funktion zum Überprüfen, das manuelle Auffinden dieser ähnlichen Dateien ist nicht nur eine echte Verschwendung, sondern auch anfällig für Auslassungen. Wir können jedoch die Fuzzy-Matching-Methode verwenden, um schnell Absätze im Dokument zu identifizieren, die dem Schlüssel wort ähneln, das gelöscht werden muss, und eine Stapel löschung zu realisieren.
Hier ist eine Einführung, wie Sie mithilfe der Formel-Fuzzy nach mehreren ähnlichen Schlüssel wörtern im TXT-Notizbuch suchen und diese dann in Chargen löschen können, um den Inhalt des Dokuments präziser zu gestalten. Lassen Sie uns einen Blick darauf werfen!
Unter welchen Umständen möchten Sie mehrere ähnliche Texte oder Zahlen in einer TXT-Datei löschen?
Daten deduplizierung bereinigen
Die vom Verarbeitung programm generierten TXT-Dateien enthalten häufig eine große Anzahl doppelter Zahlen und Text datensätze mit demselben Format. Wenn Sie die unbrauchbar doppelten Informationen löschen müssen, können wir diese strukturierten Inhalte mithilfe von Fuzzy-Übereinstimmungen bereinigen, wodurch die TXT-Daten datei präziser und bequemer wird Analyse.
Volumen nummer löschen
In einigen TXT-Daten dateien gibt es eine große Anzahl von Nummern oder Markierungen, die keine praktische Bedeutung haben. Ein einzelnes Löschen ist sehr umständlich. Die Verwendung der Formel-Fuzzy-Suche nach entsprechenden Nummern kann schnell in Chargen gelöscht werden, wodurch die Lesbarkeit der Daten und die Verarbeitung effizienz verbessert werden.
Entfernen von Vorlagen informationen
Bei der Verarbeitung von E-Mails oder vom System generierten TXT-Dateien gibt es Vorlagen inhalte mit einer ähnlichen Struktur. Wir müssen die Kern informationen extrahieren. Wir müssen diese vorlagen artigen Duplikate löschen und nur bestimmte Schlüssel wörter beibehalten, die durch Unschärfe gefunden werden können. Löschen Sie den Text oder die Zahlen der entsprechenden Struktur stapel weise.
Die Fuzzy-Suche löscht die Effekt vorschau von Schlüssel wörtern in TXT
Vor der Verarbeitung:
Nach der Verarbeitung:
Schritte zum Fuzzy-Suchen nach Schlüssel wörtern in TXT und zum Entfernen von Stapeln
1. Öffnen Sie 【 HeSoft Doc Batch Tool 】, Wählen Sie [Text werkzeug]-[Schlüssel wörter im Text suchen und ersetzen].
2. Wählen Sie unter [Datei hinzufügen] oder [Datei aus einem Ordner importieren] eine Methode aus, um eine TXT-Datei hinzuzufügen, in der ähnliche Schlüssel wörter gelöscht werden müssen. Sie können die Datei auch direkt nach unten ziehen, um sie hinzuzufügen. Nachdem Sie bestätigt haben, dass keine Probleme mit der Datei vorliegen, klicken Sie auf Weiter.
3. Geben Sie die Options einstellungs oberfläche ein, wählen Sie [Text mit Formel unschärfe suchen], geben Sie die Formel für den regulären Ausdruck unter der Liste der gesuchten Schlüssel wörter ein, lassen Sie nach dem Ersetzen die Liste der Schlüssel wörter ohne Eingabe leer und klicken Sie schließlich erneut auf Weiter. Klicken Sie dann auf Durchsuchen und wählen Sie den Speicherort für die neue Datei aus.
4. Nachdem Sie auf das Ende der Verarbeitung gewartet haben, klicken Sie auf den roten Pfad, um den Ordner zu öffnen, um die TXT-Datei anzuzeigen, in der das Schlüssel wort erfolgreich gelöscht wurde.