Lorsque les noms de fichiers PDF sont simplement 1.pdf, 2.pdf, 3.pdf, la recherche et l'archivage ultérieurs deviennent très fastidieux. Cet article prend HeSoft Doc Batch Tool comme exemple pour expliquer comment accéder à la fonction « Renommer les fichiers PDF en utilisant le contenu du fichier », importer plusieurs fichiers PDF, et utiliser l'expression régulière \d{8} pour faire correspondre le numéro à 8 chiffres dans le corps du texte, afin de générer en masse des fichiers PDF nommés avec ce numéro, ce qui convient au classement des contrats, commandes, archives et numérisations.
Il est fréquent de rencontrer ce type de PDF au bureau : dans un dossier, tout semble bien rangé, mais les fichiers ne sont nommés que 1.pdf, 2.pdf, 3.pdf, 4.pdf. Ce n'est qu'au moment de l'archivage que l'on réalise que ces noms n'ont aucune signification métier. Pour savoir lequel correspond à un contrat ou à une commande, il faut ouvrir les PDF un par un. Si cela reste acceptable pour quelques fichiers, cela devient une tâche répétitive et fastidieuse pour des dizaines ou des centaines de documents.
Plus problématique encore, le renommage manuel est source d'erreurs. Par exemple, oublier un chiffre du numéro de contrat, attribuer le numéro du document A au nom du fichier B, ou coller un même numéro en double peuvent compromettre les recherches et l'archivage ultérieurs. Pour les documents bureautiques tels que les contrats, commandes, dossiers clients ou documents projet, un nom de fichier correct est crucial. Cet article présente une méthode plus efficace : utiliser un logiciel bureautique pour lire en lot le contenu des PDF, identifier les numéros via des expressions génériques/régulières, puis renommer automatiquement les fichiers PDF avec ces numéros.
Le logiciel utilisé pour cette démonstration est HeSoft Doc Batch Tool . Il se positionne comme un outil de traitement par lots pour les fichiers bureautiques, adapté à de grands volumes de PDF, Word, Excel, images, textes, etc., aidant les utilisateurs à réduire les tâches répétitives. Nous allons voir comment renommer des fichiers PDF par lot en utilisant leur contenu.
Scénarios applicables
Cette méthode est particulièrement adaptée si vos fichiers PDF présentent les caractéristiques suivantes :
- Le nom du fichier n'a pas de signification métier, comme 1.pdf, 2.pdf, scan1.pdf, download.pdf, etc.
- Le texte du PDF contient un numéro stable, par exemple un numéro de contrat, de commande, de dossier ou de client.
- Le format du numéro est relativement uniforme, par exemple une série continue de 8 chiffres.
- Vous devez traiter plusieurs PDF par lot, et non renommer juste un ou deux fichiers.
- Vous souhaitez que les noms de fichiers finaux facilitent la recherche, le tri, le partage et l'archivage.
Dans notre exemple, les PDF sont un ensemble de contrats. Chaque PDF contient un numéro à 8 chiffres correspondant à « Contract No. ». Notre objectif n'est pas d'ajouter un préfixe ou un suffixe, mais d'extraire ce numéro pour l'utiliser comme nouveau nom de fichier.
Cette méthode s'applique également à d'autres documents. Un bon de commande peut contenir un numéro à 8 chiffres, un rapport de projet un code projet, un formulaire d'approbation un numéro de document. Dès lors qu'un numéro est identifiable par une règle, il peut être utilisé pour le renommage. Pour les documents Word, cela implique souvent les formats doc, docx ; pour les tableaux Excel, les formats xls, xlsx. Cette démonstration portant sur les fichiers PDF, nous utilisons la fonctionnalité de renommage d'après le contenu.
Aperçu des résultats : de numéros séquentiels à des identifiants consultables
Avant traitement : des fichiers PDF avec de simples numéros
Le dossier avant traitement contient 4 fichiers PDF nommés 1.pdf, 2.pdf, 3.pdf, 4.pdf. Ce type de nommage n'indique que la quantité et un ordre approximatif, sans refléter le contenu des fichiers.

En ouvrant l'un de ces PDF, on constate que la première page contient le numéro de contrat. Dans la capture d'écran, le numéro « 10026877 » entouré en rouge est celui que nous souhaitons utiliser comme nom de fichier. Ainsi, bien que le fichier s'appelle 1.pdf, le document contient déjà un numéro bien plus pertinent.

Après traitement : chaque PDF est renommé selon son numéro
Après utilisation de la fonction de traitement par lots, les noms sont devenus 10026877.pdf, 20036655.pdf, 20100511.pdf, 33952100.pdf. Les nouveaux noms correspondent directement aux numéros dans le texte. Pour retrouver un contrat ou une commande, il suffit de rechercher le numéro.

Du point de vue de la gestion bureautique, ce nommage est plus standardisé. Il réduit le besoin d'ouvrir manuellement les fichiers, clarifie la structure des dossiers et facilite la transmission à des collègues, le téléversement vers un système ou l'archivage à long terme.
Procédure
Étape 1 : Choisir la fonction de renommage PDF par contenu dans la catégorie Nom de fichier
Après avoir ouvert HeSoft Doc Batch Tool , la navigation des catégories de fonctions se trouve à gauche. On voit que la catégorie « Nom de fichier » est sélectionnée et la zone principale affiche plusieurs fonctions de traitement par lots liées aux noms de fichiers.
Parmi ces fonctions, sélectionnez « 7. Renommer les PDFs avec le contenu du fichier ». La description indique qu'elle sert à utiliser un texte extrait du contenu comme nom de fichier. C'est exactement l'effet recherché : extraire le numéro du texte du PDF au lieu de le faire manuellement.

L'important ici est de choisir la bonne fonction. Si vous souhaitez simplement ajouter un préfixe, supprimer du texte ou remplacer des mots-clés, d'autres fonctions peuvent convenir ; mais pour lire le texte interne d'un PDF, vous devez choisir celle-ci.
Étape 2 : Ajouter les fichiers PDF et vérifier la liste de traitement
Dans la fonction, le haut de la page montre le nom de la tâche en cours et la barre de progression indique les phases : « Sélectionner les enregistrements à traiter, Définir les options, Définir l'emplacement de sauvegarde, Démarrer ». La première phase consiste à ajouter les PDF à traiter.
En haut à droite se trouvent les boutons « Ajouter des fichiers » et « Importer depuis un dossier ». Utilisez le premier pour un petit nombre de fichiers, le second pour un dossier entier. La capture montre une liste avec les 4 fichiers 1.pdf, 2.pdf, 3.pdf, 4.pdf, tous avec l'extension pdf.

La liste montre aussi le chemin, la date de création et de modification, ce qui permet de confirmer la source. Ici, ils sont dans D:\test, indiquant qu'il s'agit d'un test. Pour un traitement réel, vérifiez toujours le chemin pour éviter de modifier des fichiers dans un autre répertoire.
Vous pouvez supprimer des fichiers de la liste avec le bouton prévu à cet effet. Une fois les fichiers et leurs noms vérifiés, cliquez sur « Suivant ».
Étape 3 : Choisir la formule personnalisée et saisir l'expression
À la deuxième étape « Définir les options », il faut indiquer au logiciel quel texte extraire. Dans la zone « Zone de recherche », sélectionnez « Texte correspondant à une formule personnalisée ». Le logiciel cherchera alors le texte selon la règle définie.
Dans le champ « Expression régulière », saisissez « \d{8} ». Cela signifie qu'il faut rechercher une séquence de 8 chiffres consécutifs. Comme les numéros de contrat dans nos PDF sont exactement de 8 chiffres, le logiciel identifiera automatiquement 10026877, 20036655, etc.

On peut voir \d{8} comme une expression générique précise. Là où un caractère générique simple signifie souvent « n'importe quel caractère » ou « n'importe quelle longueur », une expression régulière permet de spécifier « chiffre » et « longueur ». Pour le renommage par lot, c'est mieux adapté à l'extraction de numéros avec un motif défini.
Sur la même page, l'option « Position » est réglée sur « Remplacer tout le nom ». Le numéro trouvé remplacera donc le nom principal du fichier. Pour 1.pdf, après avoir trouvé 10026877, le nom deviendra 10026877.pdf. Si vous vouliez conserver l'ancien nom et insérer le numéro à gauche ou à droite, vous choisiriez une autre option ; ici, le remplacement complet est le plus direct.
Étape 4 : Définir le dossier de sortie et exécuter le traitement
Après avoir saisi l'expression et la position, cliquez sur « Suivant ». La barre de progression indique qu'il faut ensuite définir l'emplacement de sauvegarde, puis « Démarrer ». Même si les captures ne montrent pas ces écrans, les étapes sont claires.
Pensez à votre stratégie de sauvegarde avant de lancer le traitement. Pour des fichiers importants, sauvegardez d'abord le résultat dans un nouveau dossier, vérifiez que tous les noms sont corrects, puis transférez-les vers le répertoire d'archivage final. Cela permet de conserver les originaux et de limiter les risques des opérations par lots.
Après avoir cliqué sur Démarrer, le logiciel lira le contenu de chaque PDF, cherchera le texte correspondant à \d{8} et l'utilisera pour renommer le fichier. Une fois terminé, vous trouverez les PDF renommés dans le dossier de sortie.
Conseils pour les expressions
Nous avons utilisé \d{8} car les numéros ont 8 chiffres. Adaptez la règle si vos numéros ont un format différent :
- Numéro à 6 chiffres : essayez \d{6}.
- Numéro à 10 chiffres : essayez \d{10}.
- Longueur variable : il faut concevoir une règle plus appropriée.
- Texte fixe autour du numéro : combinez-le avec le numéro pour une correspondance plus précise.
Attention : une règle trop simple peut capturer des éléments non pertinents. Si un PDF contient un numéro de contrat, une date, un téléphone, un code postal, tous avec 8 chiffres, \d{8} seul risque de ne pas distinguer lequel est le bon. Il est donc impératif de tester sur un échantillon avant le traitement par lot.
Questions fréquentes et points d'attention
1. Pourquoi ne pas simplement utiliser la fonction Rechercher/Remplacer ?
Parce que les noms de fichiers sont simplement 1.pdf, 2.pdf et ne contiennent pas le numéro. La fonction Rechercher/Remplacer modifie le nom existant, elle ne lit pas le contenu du PDF. Nous devons utiliser la fonction de renommage basée sur le contenu.
2. Est-ce que \d{8} pourrait aussi capturer une date ?
C'est possible. Si le PDF contient une date comme 20260603 et qu'elle est lue avant le numéro de contrat, cela pourrait poser problème. Testez d'abord quelques fichiers. Si plusieurs nombres à 8 chiffres existent, il faut une règle plus précise ou s'assurer que la position et le format du numéro sont suffisamment stables.
3. Peut-on importer tout un dossier en une fois ?
Oui. Le bouton « Importer depuis un dossier » est disponible pour charger tous les PDF d'un répertoire. C'est plus rapide que d'ajouter fichier par fichier pour de gros volumes.
4. L'extension du fichier change-t-elle après traitement ?
Non, le traitement renomme le PDF, l'extension reste .pdf. Les fichiers deviennent 10026877.pdf, 20036655.pdf, etc. Seul le nom principal est remplacé.
5. Cette méthode fonctionne-t-elle pour les PDF scannés ?
Si le PDF contient une couche de texte exploitable, oui. S'il ne s'agit que d'une image scannée sans texte, le logiciel ne pourra pas le lire. Avant de traiter de tels fichiers, ouvrez-en un pour voir si vous pouvez sélectionner ou copier le numéro. Sinon, une étape préalable d'OCR peut être nécessaire.
Résumé
Pour renommer en lot des PDF selon un numéro trouvé dans leur contenu, deux points sont cruciaux : choisir la fonction de renommage capable de lire le contenu, et définir la règle de correspondance correcte. La fonction « Renommer les PDFs avec le contenu du fichier » de HeSoft Doc Batch Tool permet d'extraire du texte avec une expression et de l'appliquer automatiquement au nom du fichier.
Pour nos PDF de contrat, il suffit d'importer les fichiers, de choisir l'option de formule personnalisée, de saisir \d{8} et de sélectionner le remplacement complet du nom pour transformer des noms temporaires comme 1.pdf en noms basés sur le numéro de contrat. Il est recommandé de tester la règle sur un petit nombre de fichiers avant de traiter tout le dossier, afin de gagner du temps tout en garantissant la précision de l'archivage.