Si les PDF de contrats sont enregistrés avec des numéros de séquence comme 1.pdf, 2.pdf, cela entraînera des difficultés pour la recherche et l'archivage ultérieurs. Cet article se concentre sur le scénario d'extraction des numéros de contrat et explique comment utiliser la fonction « Renommer les fichiers PDF en utilisant le contenu du fichier » dans HeSoft Doc Batch Tool , en utilisant des formules personnalisées pour faire correspondre le texte et l'expression régulière \d{8}, afin de lire par lots le numéro de contrat (Contract No.) dans le corps du PDF et de le remplacer comme nouveau nom de fichier PDF. Le tutoriel comprend un aperçu des effets, des étapes détaillées et des remarques, adapté aux scénarios de bureau tels que la gestion des contrats, l'archivage juridique et l'organisation de la documentation de projet.
La gestion électronique des documents contractuels redoute particulièrement les noms de fichiers non normalisés. De nombreux PDF de contrats, lors de la numérisation, du téléchargement ou de l'exportation, sont nommés 1.pdf, 2.pdf, 3.pdf, ou utilisent le nom par défaut du système. À court terme, cela ne semble pas poser de problème, mais lorsque le nombre de contrats augmente, retrouver un contrat spécifique nécessite d'ouvrir chaque PDF pour vérifier le numéro, ce qui fait perdre du temps et entraîne facilement des erreurs.
Si le corps du contrat contient déjà « Contract No. » ou « 合同编号 », il est plus logique d'utiliser directement ce numéro comme nom de fichier. Ainsi, chaque PDF du dossier correspond au numéro de référence métier, ce qui facilite grandement l'archivage, la recherche, le téléversement dans le système ou la comparaison avec un registre Excel.
Cet article prend l'exemple d'un PDF de contrat en capture d'écran pour montrer comment utiliser HeSoft Doc Batch Tool pour identifier, via une expression régulière, le numéro de contrat à 8 chiffres dans le corps du PDF et renommer plusieurs fichiers PDF par lot. Cette méthode est particulièrement adaptée aux postes juridiques, administratifs, de gestion de projet, d'achat, de finance, etc., qui nécessitent de gérer un grand nombre de PDF de contrats ou d'accords.
Cas d'usage : nommer les PDF de contrats, accords, commandes selon le numéro dans le corps du texte.
La méthode de cet article convient aux documents dont le corps du texte contient un numéro explicite. Par exemple, le « Contract No. » dans les contrats en anglais, le « 合同编号 » dans les contrats en chinois, le numéro de commande (PO), le numéro d'accord dans les contrats de service, le numéro de rapport dans les fichiers de rapport, etc. Tant que ces numéros peuvent être lus à partir du texte du PDF et que leur format est relativement uniforme, on peut utiliser des règles de correspondance pour les extraire par lot.
Dans l'exemple de la capture d'écran, le numéro de contrat est une suite continue de 8 chiffres, donc une expression régulière comme \d{8} peut être utilisée pour la correspondance. De nombreux utilisateurs appellent ce type de règle une expression de caractères génériques, car son rôle est de « rechercher du texte par motif ». Mais au vu de l'interface logicielle, le champ de saisie est clairement étiqueté « 正则表达式 », il faut donc remplir selon la syntaxe des expressions régulières lors du paramétrage réel.
Si vos documents sont des contrats Word, comme .docx, .doc, ou des registres Excel, des fichiers texte .txt, vous devez choisir le module fonctionnel correspondant. Cet exemple ne concerne que les fichiers PDF, et l'entrée de fonction est également « 使用文件内容重命名 PDF 文件 ».
Aperçu du résultat : le numéro de contrat devient le nom de fichier
Avant traitement : le dossier ne contient que des PDF numérotés par ordre.
Dans le dossier avant traitement, les 4 PDF sont nommés 1.pdf, 2.pdf, 3.pdf, 4.pdf. Avec ces seuls noms de fichiers, il est impossible de savoir lequel correspond à quel numéro de contrat, ni de localiser rapidement un contrat spécifique.

Après ouverture du PDF, le champ du numéro de contrat est visible en haut de la page. La flèche rouge sur la capture pointe vers « 10026877 », ce numéro se situe après « Contract No. ». Pour la gestion des contrats, ce numéro est plus important que le nom de fichier original et plus approprié comme nom de fichier d'archivage.

Après traitement : chaque PDF est nommé avec le numéro de contrat.
Après le traitement par lot, les noms de fichiers numérotés originaux sont remplacés par les numéros issus du corps du PDF. Le résultat affiché dans le dossier est 10026877.pdf, 20036655.pdf, 20100511.pdf, 33952100.pdf.

Cet effet est très intuitif : le nom de fichier est le numéro de contrat lui-même. Par la suite, si quelqu'un fournit le numéro de contrat 10026877, il suffit de le chercher dans le dossier pour trouver rapidement le PDF correspondant.
Procédure : extraire le numéro de contrat du contenu PDF et renommer par lot
Étape 1 : Ouvrir la classification des noms de fichiers
Après avoir lancé HeSoft Doc Batch Tool , observez d'abord la navigation fonctionnelle à gauche. La capture d'écran montre la classification « 文件名称 » en état sélectionné. Comme la tâche consiste à modifier des noms de fichiers PDF par lot, il faut entrer dans cette classification, et non dans d'autres comme les outils PDF ou l'organisation de fichiers.
Dans la liste des fonctions de nom de fichier, trouvez « 7、使用文件内容重命名 PDF 文件 ». La description sous cette fiche fonctionnelle indique « 批量将 PDF 文件内容中的某些文本作为该文件的文件名 ». On peut déduire de cette phrase qu'il s'agit exactement de la fonction pour extraire le numéro de contrat du corps du PDF et l'utiliser comme nouveau nom de fichier.

Après avoir cliqué sur cette fonction, le logiciel entre dans une interface de traitement guidé. L'avantage du flux guidé est que chaque étape a un objectif clair, ce qui est adapté pour vérifier point par point avant une tâche par lot et réduire les erreurs de manipulation.
Étape 2 : Importer les fichiers PDF des contrats
Après être entré dans l'interface fonctionnelle, la première étape est de « 选择需要处理的记录 ». En haut à droite de la page se trouvent les boutons « 添加文件 », « 从文件夹中导入文件 », « 清空 », « 更多 », etc. Pour un scénario d'archivage de contrats, il est généralement conseillé de placer d'abord les PDF à traiter dans un même dossier, puis d'utiliser « 从文件夹中导入文件 » pour éviter les oublis.
La capture d'écran montre 4 PDF importés, la liste affiche le nom du fichier, le chemin, l'extension, la date de création et la date de modification. Les noms de fichiers sont 1.pdf, 2.pdf, 3.pdf, 4.pdf, les extensions sont toutes pdf. Le bas indique un nombre d'enregistrements de 4.

La clé de cette étape est de confirmer les objets à traiter. Le renommage par lot affectera plusieurs fichiers simultanément, donc ne passez pas à l'étape suivante trop vite. Il est conseillé de vérifier si les chemins d'accès sont corrects et de confirmer qu'il n'y a pas de PDF non pertinent dans la liste. En cas d'erreur d'importation, utilisez l'opération de suppression dans la liste ou le bouton « 清空 » pour réimporter.
Étape 3 : Choisir le texte correspondant à la formule personnalisée
Après avoir confirmé l'exactitude de la liste de fichiers, cliquez sur « 下一步 » pour entrer dans « 设置处理选项 ». Dans « 查找区域 », l'interface offre plusieurs options. La capture d'écran montre la sélection « 自定义公式匹配到的文本 ».
Pourquoi ne pas choisir « 第一行文本 » ? Parce que le numéro de contrat n'est pas toujours sur la première ligne, et la première ligne peut être un titre, un blanc ou autre. Pourquoi ne pas choisir « 第一个条形码图片 » ? Parce que l'objectif ici est le texte numérique dans le corps du PDF, pas un code-barres. Ainsi, la correspondance par formule personnalisée est plus adaptée au besoin actuel.

Après avoir choisi cette option, le logiciel recherchera, dans le contenu PDF, le texte conforme à la règle d'expression régulière saisie ci-dessous, et utilisera le résultat pour le renommage ultérieur.
Étape 4 : Saisir l'expression pour identifier le numéro de contrat à 8 chiffres
Dans le champ de saisie « 正则表达式 », remplissez :
\d{8}
Cette règle signifie identifier une suite continue de 8 chiffres. Le numéro de contrat 10026877 dans la capture, et les résultats 20036655, 20100511, 33952100, sont tous conformes à cette règle. Par conséquent, le logiciel peut trouver le numéro correspondant dans chaque PDF.
Dans de nombreux contextes bureautiques, les utilisateurs disent « utiliser un caractère générique pour identifier le numéro ». Il faut distinguer ici : les caractères génériques désignent généralement des correspondances simples comme l'astérisque ou le point d'interrogation, tandis que les expressions régulières sont plus appropriées pour décrire des règles complexes comme le nombre de chiffres, les plages de lettres, les répétitions. L'interface HeSoft Doc Batch Tool utilise « 正则表达式 », il faut donc remplir selon la syntaxe des expressions régulières.
Si votre numéro de contrat n'est pas composé de 8 chiffres, vous ne pouvez pas copier cet exemple. Par exemple, si le numéro est HT20260001, la règle devra prendre en compte la combinaison de lettres et de chiffres ; si la longueur du numéro est variable, une écriture plus flexible sera nécessaire. Il est très important d'observer des échantillons de fichiers avant le traitement officiel.
Étape 5 : Remplacer tout le nom de fichier par le résultat de la correspondance
Dans la zone « 位置 », choisissez « 覆盖整个文件名 ». Cette option signifie que le numéro de contrat identifié remplacera la partie principale du nom de fichier original. Le fichier 1.pdf deviendra 10026877.pdf, le fichier 2.pdf deviendra le numéro de contrat correspondant .pdf.
L'interface offre aussi les options « 在文件名的左边 » et « 在文件名的右边 ». Si vous souhaitez conserver le nom de fichier original, vous pouvez ajouter le numéro à gauche ou à droite. Mais pour l'archivage des contrats, utiliser directement le numéro de contrat comme nom de fichier est plus concis et facilite la recherche et le tri.
Une fois le paramétrage terminé, cliquez sur « 下一步 » en bas de la page pour passer aux étapes suivantes.
Étape 6 : Définir l'emplacement de sauvegarde et lancer le traitement
La barre de progression en haut de la page montre les étapes suivantes : « 设置保存位置 » et « 开始处理 ». Avant l'exécution officielle du traitement par lot, il est conseillé de choisir un emplacement de sortie clair, par exemple créer un nouveau dossier « 已按合同编号命名 » pour sauvegarder les PDF traités.
L'avantage de cette approche est de conserver les fichiers originaux pour faciliter la comparaison et la vérification. Une fois le traitement terminé, décidez, selon le résultat, s'il faut remplacer le dossier original. Pour les documents importants comme les contrats, accords, documents juridiques, conserver les originaux est une habitude opérationnelle plus prudente.
Après avoir confirmé l'emplacement de sauvegarde, passez à l'étape de lancement du traitement. Une fois le traitement terminé, ouvrez le dossier de sortie pour vérifier si les noms de fichiers correspondent aux attentes. Selon le résultat de l'exemple, les 4 PDF deviendront chacun un nom de fichier avec le numéro à 8 chiffres correspondant.
Questions fréquentes et précautions
1. Que faire si l'expression régulière identifie un mauvais numéro ?
Si le PDF contient d'autres nombres à 8 chiffres en plus du numéro de contrat, \d{8} pourrait identifier un contenu incorrect. La solution est de rendre la règle plus spécifique, par exemple en recherchant près du texte « Contract No. », ou de vérifier d'abord s'il n'y a qu'un seul nombre à 8 chiffres dans le PDF. Tester quelques fichiers avant le traitement par lot permet d'éviter efficacement les erreurs à grande échelle.
2. Le numéro dans le PDF doit-il pouvoir être sélectionné ?
Généralement, si le numéro dans le corps du PDF peut être sélectionné et copié à la souris, il est plus probable qu'il puisse être lu par la fonction de correspondance de contenu. Si le PDF est un document scanné en image pure, le numéro n'est qu'une partie de l'image et pourrait ne pas être extractible par une règle textuelle. En cas de non-reconnaissance, vérifiez d'abord la couche de texte du PDF.
3. Le contenu du PDF est-il modifié après le traitement ?
L'objectif de l'opération décrite ici est de renommer le fichier, c'est-à-dire changer le nom du fichier, pas d'éditer le contenu du corps du PDF. Le nom de la fonction « 使用文件内容重命名 PDF 文件 » indique qu'elle utilise le texte du contenu comme nom de fichier, sans modifier le corps du contrat.
4. Peut-on traiter de nombreux PDF en une seule fois ?
Cette fonction est conçue pour le traitement par lot de fichiers, permettant d'importer plusieurs PDF à la fois. La quantité réelle traitée dépend de la taille des fichiers, de la complexité du contenu PDF et des performances de l'ordinateur. Pour les dossiers très importants ou très volumineux, il est recommandé de faire un test sur un petit lot avant de traiter tous les fichiers.
5. Comment vérifier les résultats après renommage ?
Il est conseillé de trier les fichiers par nom après le traitement, d'en vérifier quelques-uns au hasard en les ouvrant pour confirmer que le numéro du nom de fichier correspond à celui dans le corps du texte. S'il existe un registre Excel des contrats, on peut aussi comparer la liste des noms de fichiers avec les numéros du registre. Le traitement par lot améliore l'efficacité, mais une vérification nécessaire avant l'archivage final reste conseillée.
Résumé : Améliorer l'efficacité d'archivage des PDF de contrats avec un outil de traitement par lot
Nommer les PDF de contrats selon leur numéro est une étape très basique mais importante de la gestion documentaire. Le renommage manuel, bien que simple, devient très chronophage quand le nombre de fichiers augmente. Grâce à HeSoft Doc Batch Tool , il est possible, via la fonction « 使用文件内容重命名 PDF 文件 », d'extraire automatiquement le numéro « Contract No. » du corps du PDF et de générer des noms de fichiers normalisés par lot.
Cet exemple utilise \d{8} pour identifier un numéro de contrat à 8 chiffres, et choisit « 覆盖整个文件名 », transformant finalement les noms de fichiers sans signification comme 1.pdf, 2.pdf en noms de fichiers avec numéro comme 10026877.pdf. Pour les employés de bureau devant gérer un grand nombre de PDF de contrats, accords, commandes, rapports, cette méthode réduit les opérations répétitives et améliore la précision de l'archivage. Il est conseillé de préparer d'abord un petit échantillon pour tester la règle, et de traiter tout le dossier par lot après confirmation de l'exactitude.