Cet article explique comment traiter par lots plusieurs fichiers PDF à l'aide d'un logiciel de bureau, en prenant comme exemple la suppression des mois en anglais et des années à quatre chiffres dans un PDF. Le processus comprend l'accès à la fonction de recherche et remplacement de mots-clés PDF, l'importation de 1.pdf à 4.pdf, la sélection de la recherche floue de texte par formule, la saisie de règles telles que April|May et \d{4}, et le fait de laisser vide la liste de mots-clés après remplacement. Après traitement, les mois et années correspondants seront supprimés, ce qui convient aux utilisateurs ayant besoin de nettoyer par lots les dates, heures de rapport et champs sensibles dans les PDF.
Les dates, années et mois dans les PDF doivent souvent être supprimés avant publication. Par exemple, la couverture d'un rapport indique April 13, 2017, mais lors de l'envoi, on souhaite ne conserver qu'une partie des informations ; ou bien un lot de PDF historiques contient des années différentes qu'il faut uniformiser. Si l'on utilise un lecteur PDF ordinaire pour modifier fichier par fichier, non seulement les étapes sont nombreuses, mais il faut répéter la recherche, la suppression et la sauvegarde pour chaque fichier, ce qui nuit gravement à l'efficacité.
Une méthode plus adaptée au traitement par lots au bureau consiste à utiliser HeSoft Doc Batch Tool pour traiter plusieurs PDF comme un groupe de tâches. Cet article, en prenant comme exemple les fichiers 1.pdf, 2.pdf, 3.pdf, 4.pdf dans les captures d'écran, montre comment utiliser la fonction « Rechercher et remplacer des mots-clés dans un PDF », en recherchant du texte de manière floue via des formules, pour supprimer par lots les mois en anglais et les années à quatre chiffres dans les PDF. Cette méthode peut également être étendue à d'autres contenus similaires, comme les numéros de rapport, de version, de lot, etc.
Scénarios applicables : Suppression par lots des dates, années et mots-clés récurrents dans les PDF
Lorsque le contenu à supprimer dans un PDF présente une régularité, la correspondance floue est particulièrement utile. Les dates en sont un exemple typique : les mois peuvent varier, les années aussi, mais elles suivent toutes des règles descriptibles. Par exemple, April et May sont des mois en anglais, 2017, 2020, 2026 sont des nombres à quatre chiffres. Écrire chaque mot-clé fixe serait fastidieux, tandis que l'utilisation de règles floues permet de couvrir une catégorie de contenu en une seule fois.
Ce type d'opération convient aux scénarios suivants : suppression par lots de la date de publication sur les couvertures de rapports PDF ; nettoyage par lots des champs d'année dans les documents ; suppression d'un certain type de numéro dans les contrats PDF ; suppression des informations temporelles sensibles dans les fichiers externes ; nettoyage des dates d'anciennes versions dans le matériel de formation ou la documentation technique. Pour les utilisateurs qui ont besoin de traiter d'autres formats comme doc, docx, xls, xlsx, ils peuvent également choisir les outils correspondants selon les catégories du logiciel, mais cet article se concentre sur les fichiers PDF.
Il est important de souligner que la suppression par lots ne signifie pas vider brutalement la page. La méthode présentée ici repose sur la recherche et le remplacement de mots-clés, en supprimant uniquement le texte correspondant aux règles définies. Par exemple, entrer une règle pour les nombres à quatre chiffres fera correspondre les années à quatre chiffres ; entrer April|May fera correspondre April ou May.
Aperçu du résultat : Avant traitement, le PDF contient April et 2017
Avant traitement, le dossier contient 4 fichiers PDF, nommés respectivement 1.pdf, 2.pdf, 3.pdf, 4.pdf. Pour une tâche par lots, il est plus pratique de placer d'abord tous les fichiers cibles dans le même répertoire avant de les importer.

En ouvrant l'exemple de PDF, on peut voir que la zone de couverture contient une date : April 13, 2017. Dans la capture d'écran, les cadres rouges indiquent respectivement April et 2017, montrant que ces deux parties sont les cibles à supprimer cette fois-ci. Le nombre 13 au milieu n'est pas une cible de suppression et doit donc être conservé après le traitement.

S'il ne s'agissait que de traiter ce seul fichier, une suppression manuelle pourrait sembler faisable. Mais dans un environnement de bureau réel, il s'agit rarement d'un seul PDF, mais d'un lot de rapports, de contrats ou d'un dossier de documents. L'ouverture et la sauvegarde répétitives des fichiers sont les étapes les plus chronophages, c'est pourquoi il est préférable d'utiliser un outil de traitement par lots pour une exécution unifiée.
Aperçu du résultat : Après traitement, le mois et l'année dans la date ont été nettoyés
En consultant à nouveau le PDF après traitement, on peut voir que l'emplacement où se trouvait April ne contient plus de texte, et l'emplacement de 2017 a également été vidé, tandis que « 13, » au milieu est toujours conservé sur la page. Cela indique que les règles de recherche ont fonctionné et que l'étendue de la suppression est conforme aux attentes.

Cet effet montre également que la recherche et le remplacement par lots peuvent servir non seulement à remplacer du texte, mais aussi à le supprimer. L'essentiel est que le contenu après remplacement soit vide. L'interface indique déjà « Ne pas remplir signifie supprimer », donc lorsque la liste de remplacement de droite reste vide, le mot-clé trouvé sera supprimé.
Étape opérationnelle 1 : Ouvrir l'entrée de traitement par lots des mots-clés PDF
Après avoir lancé HeSoft Doc Batch Tool , cliquez sur « Outils PDF » dans la catégorie de gauche. L'interface principale liste plusieurs capacités de traitement par lots PDF. Cette fois-ci, sélectionnez « Rechercher et remplacer des mots-clés dans un PDF », c'est l'entrée pour rechercher et remplacer en bloc le contenu des mots-clés dans les fichiers PDF.

L'interface montre que ce logiciel est positionné comme un outil de traitement de documents par lots. Outre les outils PDF, la colonne de gauche propose également des outils Word, Excel, PowerPoint, Image, Vidéo, Audio, etc. Pour la tâche de suppression de dates PDF de cet article, il faut entrer dans la fonction de recherche et remplacement de mots-clés sous les outils PDF.
Étape opérationnelle 2 : Ajouter des fichiers PDF, créer la tâche de traitement par lots
Après être entré dans la fonction, le titre de la page est « Rechercher et remplacer des mots-clés dans un PDF ». Le processus est divisé en : sélection des enregistrements, paramétrage des options de traitement, paramétrage de l'emplacement de sauvegarde, et démarrage du traitement. La première étape consiste à ajouter les PDF à traiter dans la liste. On peut cliquer sur « Ajouter des fichiers » ou sur « Importer des fichiers depuis un dossier ».

Dans la capture d'écran, la liste des tâches contient déjà 4 fichiers : 1.pdf, 2.pdf, 3.pdf, 4.pdf, le chemin affiché est D:\test\1.pdf etc., l'extension est pdf. Le résumé en bas montre un nombre d'enregistrements de 4. Cette liste représente l'étendue des fichiers à traiter pour cette tâche par lots, et les règles définies ensuite s'appliqueront à ces PDF.
Après avoir confirmé que la liste des fichiers est correcte, cliquez sur « Suivant » en bas. Si vous constatez une erreur dans la sélection des fichiers, vous pouvez supprimer un enregistrement via la colonne d'opération, ou utiliser « Vider » pour réimporter. Pour les fichiers importants, il est conseillé de conserver une sauvegarde originale avant le traitement officiel.
Étape opérationnelle 3 : Définir les règles de recherche floue pour correspondre aux mois et années
Une fois dans « Paramétrer les options de traitement », trouvez « Définir les options de mots-clés ». Dans « Mode de recherche », sélectionnez « Utiliser une formule pour rechercher du texte de manière floue ». C'est le cœur de cette opération, car le contenu des dates à supprimer n'est pas forcément toujours identique.

Dans la « Liste des mots-clés à rechercher » à gauche, entrez les règles de correspondance. Dans la capture d'écran, la première ligne est April|May, indiquant la recherche de April ou May ; la deuxième ligne est \d{4}, indiquant la recherche de quatre chiffres consécutifs. Pour le nettoyage de dates, quatre chiffres peuvent généralement correspondre à une année, par exemple 2017.
La « Liste des mots-clés après remplacement » à droite reste vide. Un message en rouge sur l'interface indique « Ne pas remplir signifie supprimer », ce qui correspond exactement au paramétrage nécessaire pour supprimer des mots-clés par lots dans un PDF. Autrement dit, le logiciel remplacera les April, May et les nombres à quatre chiffres trouvés à gauche par un contenu vide.
Si votre PDF contient d'autres mois à supprimer, vous pouvez ajuster la règle en fonction de la situation réelle. S'il s'agit de supprimer d'autres formats de numéros, il faut également concevoir la règle de correspondance en fonction de la structure du numéro. Plus les règles sont définies avec précision, plus le résultat du traitement par lots est stable.
Étape opérationnelle 4 : Définir l'emplacement de sauvegarde et lancer le traitement
Après avoir défini le mode de recherche et la liste des mots-clés, cliquez sur « Suivant ». La barre de progression indique qu'il reste « Définir l'emplacement de sauvegarde » et « Démarrer le traitement ». Lors du traitement de fichiers par lots, l'emplacement de sauvegarde est très important. Il est recommandé de sortir les PDF traités dans un nouveau dossier pour faciliter la comparaison avec les fichiers originaux et éviter tout écrasement accidentel.
Une fois la phase de démarrage du traitement lancée, le logiciel traite séquentiellement les fichiers PDF selon la liste des tâches. Pour chaque PDF, il recherche le texte correspondant à April|May et \d{4}, et le remplace par du vide pour le supprimer. Une fois le traitement terminé, on peut ouvrir les fichiers de sortie pour vérifier les dates de couverture, les mots-clés dans le corps du texte, etc., afin de confirmer l'effet de la suppression.
Si l'on constate que certains nombres à quatre chiffres qui n'auraient pas dû être supprimés l'ont été, cela signifie que la portée de la règle est trop large et il faut revenir aux options de traitement pour l'ajuster. Si le traitement par lots est efficace, le test des règles est une étape cruciale pour garantir l'exactitude.
Questions fréquentes et points d'attention
1. Pourquoi choisir « Utiliser une formule pour rechercher du texte de manière floue » ? Parce que les dates, années et mois ne sont souvent pas complètement fixes. L'utilisation de la recherche floue permet de correspondre à un type de texte, plutôt qu'à une seule chaîne de caractères fixe.
2. Que signifie April|May ? Dans cet exemple, cela sert à correspondre à April ou May. Lors du traitement de plusieurs PDF, si les mois diffèrent d'un fichier à l'autre, cette méthode permet de réduire la saisie répétitive.
3. À quoi sert \d{4} pour la suppression ? Cela sert à correspondre à quatre chiffres, un usage courant étant la correspondance d'une année. Mais si le PDF contient d'autres numéros à quatre chiffres, ils peuvent également être affectés, d'où la nécessité de tester avec les fichiers réels.
4. Laisser la liste de remplacement vide est-il identique à saisir un espace ? Non. Laisser vide signifie supprimer ; saisir un espace pourrait remplacer par un caractère d'espacement. Selon les indications de l'interface, pour supprimer un mot-clé, il faut laisser la liste de droite vide.
5. Pourquoi certains textes PDF ne peuvent-ils pas être supprimés ? Il est possible que le contenu du PDF soit une image numérisée, ou que le texte ne dispose pas d'une couche de texte interrogeable. Essayez d'abord de sélectionner le texte dans un lecteur PDF ; si vous ne pouvez pas le sélectionner, cela indique qu'il ne s'agit probablement pas de texte ordinaire.
6. Que faut-il préparer avant le traitement par lots ? Il est conseillé de sauvegarder d'abord les fichiers originaux et de tester les règles avec 1 ou 2 échantillons. Après avoir confirmé que l'effet est correct, traitez le dossier complet.
Résumé : Pour supprimer les dates et années des PDF, les règles par lots sont plus fiables que l'opération manuelle
Cet article a montré comment utiliser HeSoft Doc Batch Tool pour supprimer par lots des mots-clés liés aux dates dans les PDF. L'ensemble du processus comprend : entrer dans les outils PDF, sélectionner « Rechercher et remplacer des mots-clés dans un PDF » ; importer plusieurs fichiers PDF ; dans les options de traitement, choisir « Utiliser une formule pour rechercher du texte de manière floue » ; entrer April|May et \d{4} ; laisser la liste des mots-clés après remplacement vide ; enfin, définir l'emplacement de sauvegarde et lancer le traitement.
L'avantage de cette méthode est qu'une seule configuration de règles peut être appliquée à plusieurs PDF, ce qui est particulièrement adapté au nettoyage par lots de dates, années, mois, numéros et champs sensibles. Pour les tâches répétitives de traitement de fichiers, la capacité de traitement par lots du logiciel bureautique permet un gain de temps significatif et réduit les oublis manuels. Il est conseillé de d'abord valider les règles avec un petit nombre de PDF, puis d'appliquer le même processus à l'ensemble du lot de fichiers, afin d'effectuer le nettoyage des mots-clés PDF de manière sûre et efficace.