Cuando los nombres de un gran número de archivos contienen números, códigos de cliente, códigos de región o códigos de proyecto, crear carpetas manualmente y mover los archivos uno por uno consume mucho tiempo. Este artículo toma como ejemplo 101, 102, 103 al inicio de los nombres de archivo para presentar cómo usar la función "Clasificar archivos por nombre" en HeSoft Doc Batch Tool , extrayendo los primeros tres dígitos del nombre del archivo mediante la expresión regular personalizada ^\d{3}, generando las carpetas de clasificación correspondientes por lotes y agrupando los archivos similares.
En el trabajo diario de oficina, muchos archivos no se amontonan de forma totalmente desordenada, sino que sus nombres ya contienen información que puede utilizarse para clasificarlos. Por ejemplo, en archivos como 101LON05417.txt, 102NYC53821.txt, 103PAR08578.txt, los números iniciales 101, 102, 103 pueden representar departamentos, clientes, lotes, ciudades, proyectos o tipos de pedido. El problema es que, cuando la cantidad de archivos aumenta de unas docenas a cientos o miles, revisar manualmente los nombres, crear carpetas y arrastrar archivos no solo es ineficiente, sino que también es fácil colocar archivos en ubicaciones incorrectas.
Este artículo aborda precisamente este típico problema de clasificar archivos por lotes según su nombre. Utilizaremos la función de organización de archivos del software de oficina " HeSoft Doc Batch Tool ", extrayendo los tres dígitos iniciales del nombre de archivo mediante expresiones regulares personalizadas, para luego permitir que el software clasifique automáticamente los archivos en las carpetas correspondientes. En el ejemplo, los archivos cuyos nombres comienzan con 101 se colocarán en la carpeta 101, los que comienzan con 102 en la carpeta 102, y los que comienzan con 103 en la carpeta 103. Esta lógica no solo es aplicable a archivos de texto TXT, sino también a documentos de Word doc, docx, hojas de cálculo de Excel xls, xlsx, PDFs, imágenes, archivos comprimidos y otros formatos comunes de oficina, siempre que exista una regla de clasificación estable en el nombre del archivo.
Escenarios aplicables: ¿Qué archivos son adecuados para la clasificación por lotes usando expresiones regulares según el nombre?
La "clasificación por nombre de archivo" es adecuada para procesar materiales cuyos nombres de archivo tienen patrones fijos. Por ejemplo, cuando el nombre del archivo comienza con un código de cliente, seguido del tipo de negocio y un número de serie; cuando los primeros caracteres son un número de proyecto, seguido de una abreviatura de ciudad o una fecha; cuando el final del nombre contiene un número de versión, mes o año; o cuando hay un código de departamento en una posición fija en medio del nombre. Siempre que esta información pueda ser coincidida mediante comodines o expresiones regulares, puede convertirse en el criterio de clasificación.
Tomando como ejemplo los archivos TXT de la captura de pantalla de este artículo, la estructura del nombre de archivo es aproximadamente: tres dígitos iniciales + código alfabético + número de serie + extensión. El criterio de clasificación que necesitamos es precisamente los tres dígitos al inicio del nombre del archivo, por lo que podemos usar la expresión regular ^\d{3} para coincidir. "^" indica que la coincidencia comienza desde el principio del nombre del archivo, "\d" representa un dígito, y "{3}" significa 3 dígitos consecutivos. Es decir, el software extraerá los 3 dígitos iniciales de cada nombre de archivo como el nombre de la carpeta de clasificación.
Este método es especialmente adecuado para los siguientes escenarios de oficina: archivar recibos financieros por código de proveedor, archivar informes de pruebas por código de equipo, archivar anexos comerciales por código de cliente, archivar materiales de proyecto por código de proyecto, archivar fotos o escaneos por número de lote, y archivar archivos de registro por número de servidor o módulo. En comparación con la organización manual, el procesamiento por lotes de archivos puede reducir el trabajo repetitivo, hacer que la estructura de carpetas sea más clara y facilitar la búsqueda, copia de seguridad y transferencia posteriores.
Vista previa del resultado: Archivos mezclados en el mismo directorio antes del procesamiento
Antes del procesamiento, todos los archivos están en la misma carpeta. Aunque ya se pueden distinguir los tres grupos 101, 102 y 103 al inicio de los nombres de archivo, permanecen mezclados. Si hay muchos archivos y se desea encontrar todos los materiales bajo un número específico, se depende de la ordenación, la búsqueda o el filtrado manual uno por uno.

En la captura de pantalla previa al procesamiento, se puede ver que los tres primeros dígitos están anotados a la izquierda del nombre del archivo. Por ejemplo, 101LON05417.txt y 101SYD26137.txt pertenecen a 101; 102LON48897.txt y 102NYC53821.txt pertenecen a 102; 103LON23328.txt y 103PAR08578.txt pertenecen a 103. Por supuesto, un humano puede reconocer el patrón, pero el problema es que el costo de la operación manual aumenta rápidamente al crecer la cantidad. Ahí radica el valor de usar software de oficina para la organización por lotes: dejar que el software ejecute acciones repetitivas según las reglas, mientras que el usuario solo necesita configurar la regla de clasificación una vez.
Vista previa del resultado: Carpetas de clasificación 101, 102, 103 generadas automáticamente después del procesamiento
Una vez completado el procesamiento, los archivos que estaban mezclados se clasificarán en las carpetas correspondientes según los tres dígitos iniciales de sus nombres. En el resultado del ejemplo, se puede ver que el software generó tres carpetas: 101, 102 y 103, que representan los tres valores de clasificación extraídos de los nombres de archivo.

Este resultado es muy intuitivo: en el futuro, para ver los archivos correspondientes a 101, solo hay que entrar en la carpeta 101; para ver 102 o 103, se puede ir directamente al directorio correspondiente. Para un repositorio que requiere mantenimiento a largo plazo, esta estructura de directorios es mucho más fácil de gestionar que una sola carpeta grande con muchos archivos amontonados.
Pasos de operación: Usar HeSoft Doc Batch Tool para clasificar archivos por expresión regular
Paso 1: Ir a "Organización de archivos", seleccionar "Clasificar archivos por nombre"
Después de abrir HeSoft Doc Batch Tool , seleccione Organización de archivos en la barra de funciones de la izquierda. En la página de organización de archivos, puede ver varias herramientas relacionadas con el archivado de archivos, como clasificar por nombre de archivo, clasificar por extensión, crear nuevas carpetas por lotes basadas en carpetas existentes, etc. La función utilizada en este artículo es la primera: Clasificar archivos por nombre.

El propósito de este paso es indicar al software que lo que vamos a hacer no es renombrar, ni convertir formatos, sino establecer una relación de clasificación basada en una parte del contenido del nombre del archivo. Tras seleccionar esta función, el software entrará en un flujo de procesamiento paso a paso, para posteriormente realizar la importación de archivos, la configuración de la regla de clasificación, la configuración de la ubicación de guardado y el inicio del procesamiento.
Paso 2: Añadir o importar desde carpeta los archivos que necesitan ser clasificados
Tras ingresar en la función "Clasificar archivos por nombre", en la parte superior de la interfaz se pueden ver botones como Añadir archivo, Importar archivos desde carpeta, Vaciar, Más. Si los archivos están dispersos, puede usar "Añadir archivo"; si los archivos ya están concentrados en un directorio, es más adecuado usar "Importar archivos desde carpeta".

Después de la importación, el software mostrará en una lista el número de secuencia, nombre, ruta, extensión, fecha de creación y fecha de modificación de los archivos pendientes de procesar. En la captura de pantalla se puede ver que la ruta del archivo está en el directorio D:\test, la extensión es txt y el número de registros es 20. A través de este paso, el usuario puede primero confirmar si los archivos importados son correctos, evitando añadir archivos que no deberían ser procesados a la tarea por lotes. Si se descubre que algún archivo no debe participar en el procesamiento, se puede eliminar según la columna de operaciones en la interfaz; si la importación es incorrecta, también se puede usar "Vaciar" en la parte superior para volver a seleccionar.
El resultado esperado de este paso es: todos los archivos que necesitan ser clasificados aparecen en la lista, y el patrón de sus nombres coincide con el objetivo de clasificación actual. Por ejemplo, este artículo busca clasificar por los tres primeros dígitos, por lo que los nombres de los archivos importados deben comenzar con tres dígitos como 101, 102, 103.
Paso 3: Seleccionar "Clasificar por expresión regular personalizada" en las opciones de procesamiento
Tras confirmar que la lista de archivos es correcta, haga clic en Siguiente en la parte inferior para ingresar a "Configurar opciones de procesamiento". Esta es la clave de la clasificación por lotes. La interfaz ofrece múltiples métodos de clasificación, incluyendo clasificar por el primer carácter, clasificar por el primer dígito, clasificar por la primera letra, clasificar por los últimos caracteres, clasificar por los primeros caracteres, clasificar por caracteres en una posición personalizada, y Clasificar por expresión regular personalizada.

En el ejemplo de este artículo, seleccionamos Clasificar por expresión regular personalizada, e introducimos en el campo de entrada de la expresión regular:
^\d{3}
El significado de esta expresión es: comenzando desde el inicio del nombre de archivo, coincidir con 3 dígitos consecutivos. Para 101LON05417.txt, el resultado coincidente es 101; para 102NYC53821.txt, el resultado es 102; para 103LON23328.txt, el resultado es 103. El software usará el contenido coincidente como el nombre de la carpeta de clasificación, logrando así el archivado por lotes según el prefijo del nombre de archivo.
En la parte inferior de la interfaz, también se ofrecen opciones de conversión de mayúsculas/minúsculas, incluyendo Predeterminado, Convertir a mayúsculas, y Convertir a minúsculas. Como el criterio de clasificación de este artículo son dígitos, mantener el valor predeterminado es suficiente. Si su criterio de clasificación son letras, por ejemplo, nombres de archivo que aparecen en diferentes formas de capitalización como abc, ABC, Abc, puede seleccionar si unificar o no las mayúsculas/minúsculas según lo necesite, para reducir la duplicación de carpetas de clasificación.
Paso 4: Configurar la ubicación de guardado e iniciar el procesamiento
Tras completar la configuración de la expresión regular, continúe haciendo clic en Siguiente para ingresar a "Configurar ubicación de guardado" en el flujo. Este paso se usa para determinar dónde se guardarán los archivos clasificados. Se recomienda elegir un directorio nuevo fácil de identificar, para facilitar la verificación de los resultados tras el procesamiento. Si se trata de material importante, también puede ejecutar una prueba primero en un directorio de prueba y, tras confirmar que la regla es correcta, procesar los archivos oficiales.
Tras configurar la ubicación de guardado, se ingresa al paso "Iniciar procesamiento". En este momento, el software, basándose en la lista de archivos importada previamente y la regla de expresión regular, creará automáticamente las carpetas de clasificación correspondientes y agrupará los archivos que coincidan con el mismo valor de clasificación. Una vez completado el procesamiento, podrá ver la estructura de carpetas similar a 101, 102, 103.
El resultado esperado de este paso es: sin necesidad de crear manualmente una nueva carpeta una por una, ni de arrastrar archivos individualmente, el software completará la organización por lotes según los resultados coincidentes en los nombres de archivo. Para una gran cantidad de archivos TXT, docx, xlsx, PDF, etc., esto puede reducir significativamente el trabajo repetitivo.
Explicación de la expresión regular: ¿Por qué usar ^\d{3}?
Muchos usuarios piensan que las "expresiones regulares" son complicadas, pero en realidad, en la organización de archivos por lotes, solo se necesita dominar unas pocas fórmulas de uso común. El ^\d{3} utilizado en este artículo es una regla de coincidencia de prefijo de nombre de archivo muy típica.
En ella, "^" indica que la coincidencia debe comenzar en la posición inicial del nombre del archivo. Sin este símbolo, la expresión podría buscar tres dígitos en cualquier parte del nombre del archivo; al añadir "^", solo coincidirá con el principio. Esto evita confundir un número posterior con el criterio de clasificación. "\d" representa cualquier dígito, equivalente a un número del 0 al 9. "{3}" significa que el dígito anterior aparece 3 veces consecutivas. Por lo tanto, la expresión completa es: coincidir con los tres dígitos al inicio del nombre del archivo.
Si los primeros cuatro caracteres de su nombre de archivo son un año o un número de serie, puede cambiar la regla a ^\d{4}; si los dos primeros son un código de región, puede cambiarla a ^\d{2}. Si el nombre del archivo comienza con letras, como ABC001.docx, puede considerar usar una sintaxis regular para coincidir con las letras iniciales. La regla específica a utilizar depende del patrón de sus nombres de archivo.
Preguntas frecuentes y precauciones
1. Si los nombres de archivo no tienen un patrón fijo, ¿se pueden clasificar por lotes?
Si los nombres de archivo carecen completamente de un patrón, es difícil para cualquier herramienta de procesamiento por lotes determinar con precisión en qué carpeta deben ir. Se recomienda observar primero si existe información estable en los nombres, como un número inicial, fecha, código de cliente, abreviatura de departamento o un separador fijo. Siempre que se pueda encontrar un patrón, se puede intentar extraerlo utilizando los métodos de clasificación existentes en el software o expresiones regulares personalizadas.
2. Si no son archivos TXT, ¿se pueden organizar de esta manera?
Sí se puede. El ejemplo de la captura de pantalla es con archivos txt, pero la base de la "clasificación por nombre de archivo" es el nombre en sí, no el contenido del archivo. Por lo tanto, documentos de Word doc, docx, hojas de cálculo de Excel xls, xlsx, presentaciones de PowerPoint ppt, pptx, PDFs, imágenes, audios, vídeos, etc., siempre que sus nombres de archivo sigan la regla, pueden organizarse por lotes usando un método similar.
3. ¿Qué sucede si la expresión regular se escribe incorrectamente?
Si la expresión no puede coincidir con el contenido deseado, el resultado de la clasificación puede no ser el esperado. Por lo tanto, se recomienda probar primero con unos pocos archivos. Por ejemplo, importar primero de 10 a 20 archivos de muestra, confirmar que se generan correctamente las carpetas 101, 102, 103 y luego procesar un volumen mayor. Para archivos importantes, también se recomienda hacer una copia de seguridad antes del procesamiento.
4. ¿A qué debo prestar atención cuando el criterio de clasificación contiene letras mayúsculas y minúsculas?
Si el valor de clasificación en el nombre del archivo contiene letras, las diferencias entre mayúsculas y minúsculas pueden resultar en la generación de carpetas diferentes. Por ejemplo, abc y ABC podrían considerarse clasificaciones distintas. Las opciones de procesamiento en la captura de pantalla ofrecen una configuración de conversión de mayúsculas/minúsculas; el usuario puede mantener el valor predeterminado, o unificar a mayúsculas o minúsculas según sea necesario, para que los resultados de clasificación sean más estandarizados.
Resumen: Deje que el software procese el trabajo repetitivo según las reglas, haciendo el archivado de archivos más eficiente
El núcleo de la organización de archivos por lotes no es hacer que el usuario haga más clics, sino delegar las acciones repetitivas, mecánicas y propensas a errores al software de oficina. En el ejemplo de este artículo, HeSoft Doc Batch Tool , a través de la función "Clasificar archivos por nombre" junto con la expresión regular personalizada ^\d{3}, logró extraer 101, 102, 103 del inicio del nombre de archivo y generar automáticamente las carpetas correspondientes para archivar.
Si sus nombres de archivo también contienen un código de cliente, número de proyecto, código de departamento, fecha o número de lote, se recomienda identificar primero el patrón de nomenclatura más estable y luego usar la función de clasificación por lotes para organizarlos. Para los usuarios que manejan frecuentemente archivos de oficina como TXT, docx, xlsx, PDF, este método puede reducir significativamente el tiempo de filtrado y arrastre manual, haciendo la gestión de materiales más estandarizada y facilitando también la búsqueda de archivos posteriormente.