En el proceso de procesamiento diario de texto TXT, a menudo nos encontramos con la necesidad de limpiar el contenido redundante duplicado o similar en el documento, que puede ser algunas marcas generadas por el sistema, barras de datos duplicadas o descriptores específicos que deben limpiarse de manera uniforme, pero basados en archivos TXT. No tiene la función de verificar duplicados, encontrar manualmente estos archivos similares no solo es un desperdicio real, sino que también es propenso a omisiones. Sin embargo, podemos utilizar el método de coincidencia difusa para identificar rápidamente párrafos en el documento que son similares a las palabras clave que deben eliminarse y lograr una limpieza de eliminación por lotes.
Aquí hay una introducción a cómo usar la fórmula para buscar vagamente varias palabras clave similares en el bloc de notas TXT, y luego eliminarlas por lotes de manera unificada para hacer que el contenido del documento sea más conciso, ¡echemos un vistazo!
¿En qué circunstancias debo eliminar varios textos o números estructurados similares en un archivo TXT?
Limpieza de datos duplicados
Los archivos TXT generados por el programa de procesamiento a menudo tienen una gran cantidad de números duplicados o el mismo formato y registros de texto. Si necesita eliminar información duplicada inútil, podemos usar la coincidencia difusa para limpiar estos contenidos estructuralmente similares, de modo que los archivos de datos TXT sean más concisos y convenientes. análisis.
Eliminar números de lote
En algunos archivos de datos TXT, hay una gran cantidad de números o anotaciones sin importancia práctica. La eliminación única es muy engorrosa. El uso de fórmulas para buscar los números correspondientes puede eliminar rápidamente en lotes, mejorando la legibilidad de los datos y la eficiencia del procesamiento.
Eliminar información de plantilla
En el procesamiento de correos electrónicos o archivos TXT generados por el sistema, habrá contenido de plantilla similar en estructura. Necesitamos extraer la información central, debemos eliminar estos contenidos duplicados con plantilla y solo mantener palabras clave específicas, que se pueden encontrar mediante búsqueda difusa. Elimine el texto o los números de la estructura correspondiente en lotes.
Vista previa del efecto de la búsqueda difusa para eliminar palabras clave en TXT por lotes
Antes de procesar:
Después del procesamiento:
Desenfoque de los pasos para buscar palabras clave en TXT y eliminarlas en masa
1. Abrir 【 HeSoft Doc Batch Tool 】, Seleccione [Herramienta de texto]-[Buscar y reemplazar palabras clave en el texto].
2. Seleccione un método en [Agregar archivo] o [Importar archivo de carpeta] para agregar archivos TXT que necesiten eliminar palabras clave similares, o puede arrastrar el archivo directamente a la parte inferior para agregarlo. Después de confirmar que no hay ningún problema con el archivo, haga clic en Siguiente.
3. Ingrese a la interfaz de configuración de opciones, seleccione [Use la fórmula para desenfocar el texto de búsqueda], ingrese la fórmula de expresión regular debajo de la lista de palabras clave buscadas, deje la lista de palabras clave reemplazadas en blanco y no ingrese, y finalmente haga clic en Siguiente nuevamente. Luego haga clic en Examinar para seleccionar la ubicación donde se guardará el nuevo archivo.
4. Después de esperar a que finalice el procesamiento, haga clic en la ruta roja para abrir la carpeta para ver el archivo TXT que eliminó con éxito las palabras clave.