Lorsque le contenu à supprimer de plusieurs PDF n'est pas un mot complètement fixe, mais un texte variable comme les mois en anglais, les années à 4 chiffres, les numéros de série, etc., vous pouvez utiliser des formules de correspondance floue pour le traitement par lots. Cet article, combiné avec la capture d'écran HeSoft Doc Batch Tool , montre comment accéder à l'outil PDF, sélectionner "Rechercher et remplacer des mots-clés dans le PDF", importer 1.pdf à 4.pdf, utiliser "Utiliser une formule pour rechercher du texte flou", remplir April|May et \d{4} dans la liste de recherche, et laisser la liste de remplacement vide pour supprimer les mots-clés correspondants. L'article explique également la comparaison des effets, les risques des règles et les suggestions de vérification avant le traitement par lots.
Dans la gestion des fichiers PDF, l'une des situations les plus gênantes est de devoir supprimer un contenu « récurrent mais non identique ». Par exemple, certains PDF contiennent « April », d'autres « May » ; certaines années sont 2017, d'autres 2020 ; certains préfixes de numéro sont identiques, mais les chiffres qui suivent diffèrent. Face à ce type de texte variable, si l'on se contente d'une recherche classique, il faut saisir différents mots-clés de manière répétée, ce qui rend le traitement très inefficace.
Cet article présente, à travers un cas pratique, comment utiliser la capacité de recherche et remplacement par lot PDF dans HeSoft Doc Batch Tool , associée à une correspondance floue par formule, pour supprimer par lot des mots-clés variables dans plusieurs PDF. L'exemple porte sur 4 fichiers PDF, sur la page desquels apparaît « April 13, 2017 ». L'objectif est de supprimer le mois et l'année : le mois peut être « April » ou « May », et l'année est une suite de 4 chiffres. Après traitement, le mois et l'année disparaissent, tandis que le chiffre du jour « 13, » est conservé.
Ce type d'opération convient parfaitement aux scénarios bureautiques tels que l'administration d'entreprise, les ressources humaines, la finance, le juridique ou la gestion de projet. Par exemple, nettoyer par lot les dates internes dans des rapports PDF externes, supprimer d'anciens identifiants annuels, ou retirer des numéros variables dans des modèles de contrat. Comparé à l'édition manuelle, l'avantage du traitement par lot est de définir les règles une seule fois et de les exécuter uniformément sur plusieurs fichiers, ce qui réduit à la fois le travail répétitif et le risque d'oublis.
Scénarios applicables : Supprimer du texte variable dans un PDF, pas seulement des mots fixes
Si vous n'avez besoin de supprimer qu'un seul mot-clé fixe, comme « Draft » ou « Usage interne », une recherche et un remplacement exacts classiques suffisent. Mais si vous devez supprimer une catégorie de texte, par exemple tous les mois en anglais, toutes les années à 4 chiffres, ou des numéros au format fixe, vous aurez besoin d'une méthode de correspondance floue plus flexible.
L'exemple de cet article est typique d'une suppression de texte variable. La date originale dans le PDF est « April 13, 2017 », où « April » peut varier selon le fichier, et « 2017 » peut aussi devenir une autre année. Énumérer manuellement toutes les dates complètes serait très fastidieux ; en utilisant une formule de recherche floue, on peut décrire « ce que l'on cherche » à l'aide de règles.
Les scénarios applicables courants incluent :
- Supprimer par lot les mois en anglais dans un PDF, par exemple April, May, etc.
- Supprimer par lot les années à 4 chiffres dans un PDF, par exemple 2017, 2024, 2026.
- Supprimer par lot le champ date d'un même modèle de PDF, tout en conservant le reste du contenu textuel.
- Nettoyer par lot les anciens numéros de projet, de version ou de lot dans un PDF.
- Traiter par lot les marquages uniformes dans les rapports, manuels et fichiers de notification.
Il faut souligner que plus la capacité de correspondance floue est forte, plus l'exigence de précision de la règle est élevée. Une règle trop large peut supprimer du contenu superflu ; une règle trop étroite risque d'omettre des éléments. Il est donc conseillé de d'abord valider l'effet sur un fichier échantillon avant l'opération réelle.
Aperçu du résultat : Comparaison avant/après traitement par lot
Avant traitement : 4 fichiers PDF nécessitent l'application de la même règle
Avant traitement, le dossier contient 4 PDF, nommés respectivement 1.pdf, 2.pdf, 3.pdf et 4.pdf. Ce sont les fichiers cibles de cette tâche par lot. Pour un logiciel bureautique comme HeSoft Doc Batch Tool , l'approche de traitement par lot ne consiste généralement pas à ouvrir les fichiers un par un, mais à d'abord ajouter tous les fichiers cibles à une même liste de tâches.

La capture d'écran du contenu PDF montre que la date « April 13, 2017 » est bien visible sur la page. Le cadre rouge met en évidence les éléments à supprimer, « April » et « 2017 ». Ces deux contenus sont représentatifs : l'un est un texte de type liste de candidats, l'autre un texte de type règle numérique.

Après traitement : Le contenu correspondant aux règles a été effacé
Dans le PDF traité, les emplacements où se trouvaient le mois et l'année sont devenus vides, mais le « 13, » du milieu n'a pas été supprimé. Cela montre que le logiciel n'a pas supprimé la date entière, mais a localisé et nettoyé le contenu selon les règles de mots-clés définies par l'utilisateur.

Ce type de résultat est important pour le nettoyage fin du contenu PDF. Souvent, l'utilisateur ne souhaite pas supprimer une page entière, ni une ligne entière, mais seulement une partie des champs variables. Utiliser la correspondance floue par formule puis remplacer par du vide permet d'atteindre cet objectif avec plus de précision.
Étapes d'opération : Supprimer par lot des mots-clés PDF avec la correspondance floue
Étape 1 : Ouvrir la catégorie Outils PDF
Après avoir lancé HeSoft Doc Batch Tool , l'interface de gauche propose plusieurs catégories de traitement de fichiers, incluant Nom de fichier, Nom de dossier, Organisation de fichiers, Outils Word, Outils Excel, Outils PowerPoint, Outils PDF, etc. Comme l'objet du traitement est ici un fichier PDF, cliquez sur « Outils PDF » à gauche.
Dans la liste des fonctions des Outils PDF, choisissez « Rechercher et remplacer des mots-clés dans le PDF ». La description indique qu'il s'agit de rechercher et remplacer par lot des mots-clés dans le contenu des fichiers PDF, ce qui correspond exactement au besoin de « rechercher puis supprimer » ici.

Le but de cette étape est d'accéder à la fonction par lot liée au traitement du contenu textuel des PDF. Une fois effectuée, le logiciel affiche une page de tâche par étapes, au lieu de laisser l'utilisateur ouvrir et éditer les PDF un par un.
Étape 2 : Importer les fichiers PDF à traiter
Après être entré dans la fonction, le haut de la page affiche que la tâche en cours est « Rechercher et remplacer des mots-clés dans le PDF ». La première étape est « Sélectionner les enregistrements à traiter ». En haut à droite, on voit les boutons d'action « Ajouter des fichiers », « Importer des fichiers depuis un dossier », « Vider », « Plus », etc.
Si le nombre de PDF est faible, on peut utiliser « Ajouter des fichiers » ; si les PDF sont déjà regroupés dans un même répertoire, utiliser « Importer des fichiers depuis un dossier » sera plus efficace. Dans l'exemple, 4 PDF ont été ajoutés à la liste, nommés 1.pdf, 2.pdf, 3.pdf, 4.pdf, avec l'extension pdf, et leurs chemins d'accès et dates sont affichés.

Le but de cette étape est de confirmer l'étendue des fichiers participant au traitement par lot. Le résultat attendu est que la liste ne contienne que les PDF à traiter, sans fichiers superflus. Avant de lancer le traitement, il est recommandé de vérifier le nombre de fiches et leurs chemins pour éviter de traiter d'autres PDF par erreur.
Étape 3 : Choisir d'utiliser la recherche floue de texte par formule
Une fois les fichiers confirmés, cliquez en bas sur « Étape suivante » pour accéder à « Configurer les options de traitement ». Dans « Mode de recherche », l'interface propose « Recherche exacte de texte » et « Utiliser la formule pour une recherche floue de texte ».
Ce cas pratique choisit « Utiliser la formule pour une recherche floue de texte ». La raison est que nous ne voulons pas supprimer un mot fixe unique, mais un texte ayant une régularité : le mois peut être « April » ou « May », l'année peut être n'importe quelle suite de 4 chiffres. Choisir la recherche exacte rendrait très difficile la couverture de ces variations en une seule fois.

Le but de cette étape est d'activer la capacité de recherche par caractères génériques ou formules. Le résultat attendu est que le logiciel fasse correspondre le contenu du PDF en fonction des règles saisies par la suite, au lieu de chercher uniquement un texte littéral strictement identique.
Étape 4 : Saisir les expressions de mots-clés à rechercher
Dans la « Liste des mots-clés à rechercher », l'exemple saisit deux lignes. La première est « April|May », la seconde est « \d{4} ». Ces deux règles correspondent respectivement aux deux cibles de suppression.
« April|May » peut être compris comme la recherche de « April » ou « May », pour gérer le cas où le mois en anglais diffère d'un PDF à l'autre. « \d{4} » peut être compris comme la recherche d'une suite de 4 chiffres consécutifs, pour supprimer l'année. Ainsi, même si les années diffèrent selon les PDF, tant qu'elles respectent la règle des 4 chiffres, elles peuvent être trouvées.
Si l'utilisateur souhaite supprimer autre chose dans ses propres fichiers, il peut remplacer les règles de l'exemple par les siennes. Par exemple, pour supprimer plus de mois, il faut étendre selon la situation réelle ; pour supprimer un numéro, il faut configurer une expression plus appropriée autour de son format. Il est déconseillé d'appliquer directement les règles sans comprendre le contenu du fichier, surtout pour les formulations comme « \d{4} » dont la portée de correspondance peut être plus large.
Étape 5 : La liste des mots-clés de remplacement reste vide
Sur la droite se trouve la « Liste des mots-clés de remplacement », avec l'indication « Ne pas remplir signifie supprimer ». Cette phrase est cruciale car elle indique que l'opération de suppression n'est pas un bouton séparé, mais qu'elle est réalisée en « remplaçant par du vide ».
Dans cet exemple, nous souhaitons que « April », « May » et les années à 4 chiffres disparaissent du PDF, donc nous ne saisissons aucun contenu de remplacement à droite. Lors de l'exécution, le logiciel remplacera le contenu correspondant à gauche par du vide, obtenant ainsi l'effet de suppression.
Le but de cette étape est de convertir la fonction de recherche et remplacement par lot en fonction de suppression par lot. Le résultat attendu est que les mots-clés correspondants ne soient plus affichés dans le PDF de sortie.
Étape 6 : Poursuivre la configuration de l'emplacement de sauvegarde, puis démarrer le traitement par lot
Après avoir configuré les mots-clés, cliquez sur « Étape suivante ». Le flux de la page montre que les suivantes sont « Définir l'emplacement de sauvegarde » et « Démarrer le traitement ». Bien que les captures d'écran ne montrent pas les options spécifiques de ces deux pages, les noms d'étape indiquent clairement que l'utilisateur doit d'abord spécifier où sauvegarder les fichiers PDF traités, puis lancer la tâche.
Il est ici conseillé de ne pas mélanger directement les résultats avec les fichiers originaux. Une approche plus sûre consiste à créer un nouveau dossier de sortie, par exemple « PDF après suppression mots-clés » ou « Résultats », et y enregistrer les fichiers traités. Cela facilite la comparaison entre les anciens et nouveaux fichiers et permet un retour rapide en arrière si la règle s'avère inadaptée.
Après le lancement, attendez que le logiciel termine la tâche par lot. Une fois fini, ouvrez et vérifiez au moins quelques PDF au hasard, en particulier les pages contenant les champs cibles, pour confirmer la suppression du mois et de l'année et la conservation du reste du contenu.
Questions fréquentes et points d'attention
1. Quelle est la différence entre la correspondance floue par formule et la recherche par mot-clé ordinaire ?
La recherche par mot-clé ordinaire convient au texte parfaitement identique, la correspondance floue par formule convient au texte variable ayant une régularité. Par exemple, « April » est un mot fixe, alors que « April|May » peut correspondre à deux mots ; « 2017 » est une année fixe, alors que « \d{4} » peut correspondre à n'importe quels 4 chiffres.
2. Remplacer par du vide peut-il affecter la mise en page du PDF ?
D'après le résultat de l'exemple, les emplacements supprimés laissent un blanc, le reste du contenu s'affiche toujours. La structure de mise en page des différents PDF peut varier, l'effet final doit être vérifié sur le fichier réel. Avant traitement par lot, il est conseillé de tester d'abord sur un PDF échantillon.
3. Comment éviter de supprimer par erreur des numéros ou autres chiffres ?
N'utilisez pas aveuglément des règles trop larges. Par exemple, « \d{4} » correspondra à toute suite de 4 chiffres consécutifs, pas seulement aux années. Si le PDF contient des numéros de rapport, de contrat, de montant, etc., ils pourraient aussi être trouvés. Vérifiez d'abord le contenu du fichier et si nécessaire, réduisez la portée de la règle.
4. Est-il nécessaire de cocher « Ignorer la casse » ?
L'option « Ignorer la casse » est visible sur les captures, mais l'exemple ne l'a pas cochée. Si la casse n'est pas uniforme dans le PDF, par exemple si « April » et « april » coexistent, cette option peut être utilisée selon le besoin. Le choix de la cocher ou non dépend de l'étendue de la correspondance souhaitée.
5. Pourquoi sauvegarder avant un traitement par lot ?
Le traitement par lot est efficace, mais si une règle est mal configurée, cela n'impacte pas un seul fichier, mais un ensemble de fichiers. Sauvegarder les PDF originaux ou exporter vers un nouveau répertoire est une pratique de base pour réduire les risques, particulièrement pour les documents importants comme les rapports officiels, les contrats ou les archives.
Résumé : Remplacer les actions répétitives par des règles pour un nettoyage PDF par lot plus efficace
Cet article a démontré un processus typique de suppression par lot de mots-clés dans un PDF : entrer dans les Outils PDF de HeSoft Doc Batch Tool , choisir « Rechercher et remplacer des mots-clés dans le PDF », importer plusieurs fichiers PDF, sélectionner « Utiliser la formule pour une recherche floue de texte », saisir « April|May » et « \d{4} » dans la liste de recherche, et laisser vide la liste des mots-clés de remplacement. Finalement, le logiciel supprime les mois et années correspondants.
La valeur de cette méthode réside dans le fait qu'elle ne demande pas à l'utilisateur d'ouvrir les PDF un par un, ni que le texte cible soit strictement identique dans chaque fichier. Tant que le contenu présente une régularité, il est possible d'utiliser des règles pour une correspondance par lot. Pour les scénarios bureautiques nécessitant la suppression par lot de texte variable dans des PDF, le nettoyage par lot de champs de date, ou le traitement par lot du contenu de multiples fichiers, cette approche permet un gain de temps significatif.
Si vous gérez de nombreux PDF, Word, docx, doc ou autres fichiers bureautiques, envisagez de confier les tâches de nettoyage hautement répétitives à un outil de traitement par lot. Pour une utilisation réelle, il est recommandé de tester d'abord les règles avec un petit nombre de fichiers, puis d'étendre l'exécution par lot à l'ensemble du dossier, ce qui améliore l'efficacité tout en garantissant la fiabilité des résultats.