Les fichiers PDF relativement sensibles contiennent des numéros de facture, des numéros de contrat ou des numéros de commande, etc. Ces numéros ont un format uniforme, mais leur contenu est parfois très sensible et ne doit pas être affiché à l'extérieur. Ils doivent être protégés lors du partage. Face à un grand nombre de fichiers PDF, chacun contenant de nombreux numéros à modifier ou à masquer avec des structures similaires et des formats fixes, si nous utilisons la méthode traditionnelle pour ouvrir les fichiers, rechercher et modifier manuellement, le processus est extrêmement fastidieux et prend beaucoup de temps, sans parler de la difficulté à garantir l'intégrité et la cohérence du traitement, et il est très facile d'omettre des éléments.
Existe-t-il donc un moyen de raccourcir notre temps de traitement, d'identifier avec précision tous les numéros conformes au format dans les fichiers PDF et de les remplacer ou de les masquer par lots ? Cet article vous présente une astuce rapide pour nous aider à traiter par lots toutes les informations de numéros ou de référence ayant le même format dans un document, améliorant considérablement l'efficacité et la précision du traitement des PDF. Découvrons-la ensemble !
Quand faut-il modifier ou masquer les numéros au même format dans un PDF, comme les numéros de téléphone portable, les numéros de suivi logistique, etc. ?
Protéger le contenu privé lors de la présentation
Si un PDF contient des informations sensibles telles que des numéros de suivi logistique, des numéros d'identité ou des numéros de téléphone portable, et que vous devez envoyer le fichier à un client ou le publier, vous devez masquer et remplacer ces informations pour éviter que d'autres ne voient un contenu non destiné à être affiché. Nous pouvons automatiquement identifier les numéros au même format et les remplacer ou les masquer pour protéger rapidement la vie privée.
Les fichiers de démonstration ne divulguent pas d'informations
Dans les fichiers PDF réels qui sont souvent présentés, les numéros, numéros de commande et numéros de suivi de colis peuvent être des données réelles. Les afficher directement serait très dangereux. Traiter automatiquement ces numéros selon un format unifié, par exemple en les masquant directement ou en les remplaçant par ******, permet au fichier d'être présenté normalement sans divulguer les informations réelles des clients et de l'entreprise.
Traitement des données sensibles pour l'archivage
Lorsqu'un même fichier PDF doit être partagé en interne au sein d'une équipe, transféré entre plusieurs services ou conservé à long terme, si les numéros qu'il contient sont sensibles ou sans rapport avec l'activité, il est nécessaire de les masquer uniformément. Nous pouvons automatiquement identifier et remplacer les données ayant le même format, ce qui évite les modifications manuelles et ne perturbe pas la mise en forme du document.
Aperçu de l'effet du remplacement par lot de plusieurs numéros dans un PDF par un autre contenu
Avant traitement :

Après traitement :

Méthode 1 : Utiliser HeSoft Doc Batch Tool pour masquer par lots les numéros de suivi logistique dans un PDF
Recommandation : ★★★★★
Avantages :
- Multifonctionnel, bons résultats de traitement, fonctionnement simple et facile à comprendre, accessible aux débutants, et prend en charge le traitement par lots.
- Les fichiers ne sont pas téléchargés, tout est traité sur l'ordinateur local, protégeant ainsi la vie privée de l'utilisateur.
Inconvénients :
- Ne peut être utilisé que sur un ordinateur.
Étapes :
1. Ouvrez 【 HeSoft Doc Batch Tool 】, sélectionnez 【Outil PDF】 - 【Rechercher et remplacer des mots-clés dans le PDF】.

2. Dans 【Ajouter un fichier】 ou 【Importer des fichiers depuis un dossier】, choisissez une méthode pour ajouter le PDF dont vous souhaitez remplacer ou masquer les mots-clés. Vous pouvez également faire glisser le fichier directement dans la zone ci-dessous pour l'ajouter, puis cliquez sur Suivant.

3. Dans l'interface des options de paramétrage, sélectionnez 【Recherche floue de texte par formule pratique】. Dans la liste des mots-clés à rechercher ci-dessous, entrez la formule pour une recherche floue (par exemple, pour rechercher un numéro de suivi logistique au format UPS, utilisez l'expression régulière suivante). Dans la liste des mots-clés de remplacement à droite, entrez le texte de remplacement souhaité, d'autres formules sont également possibles. Enfin, cliquez sur Suivant, puis sur Parcourir pour choisir l'emplacement de sauvegarde du nouveau fichier.

4. Une fois le traitement terminé, cliquez sur le chemin en rouge pour ouvrir le dossier. Ouvrez ensuite le PDF pour voir le contenu qui a été remplacé ou masqué avec succès.

Méthode 2 : Utiliser un éditeur PDF pour recouvrir les parties à masquer avec des annotations
Recommandation : ★★★☆☆
Avantages :
- Opération intuitive, sans avoir besoin d'apprendre des fonctions complexes.
- Presque tous les éditeurs PDF possèdent cette fonction.
Inconvénients :
- Opération manuelle une par une, efficacité très faible.
- Risque d'oubli, et ne peut pas traiter un grand nombre de fichiers.
Étapes :
1. Ouvrez le fichier PDF avec l'éditeur et trouvez la fonction d'annotation dans la barre d'outils.

2. Sélectionnez l'outil rectangle, faites glisser et dessinez sur le numéro à masquer jusqu'à ce qu'il soit couvert.

3. Enregistrez le fichier et répétez l'opération pour tous les numéros sur toutes les pages.
Méthode 3 : Convertir au format Word et utiliser la recherche floue pour remplacer
Recommandation : ★★★☆☆
Avantages :
- Remplacement véritablement complet du contenu textuel.
- Prend en charge la recherche et le remplacement par lots, adapté au traitement d'un grand nombre de numéros.
Inconvénients :
- La conversion de PDF complexes peut entraîner des caractères corrompus.
- Nécessite Office 2016 ou une version ultérieure.
Étapes :
1. Ouvrez le PDF avec Word, appuyez sur Ctrl + H pour ouvrir la fenêtre de remplacement.

2. Cochez d'abord l'option des caractères génériques, puis entrez la formule du numéro sous « Rechercher » et « ****** » sous « Remplacer par ».

3. Enfin, enregistrez sous un nouveau fichier PDF, puis passez au fichier suivant.
Méthode 4 : Utiliser la fonction de recherche et de remplacement d'Adobe Acrobat DC
Recommandation : ★★☆☆☆
Avantages :
- Plus efficace que le masquage manuel, résultat net.
- Peut traiter tous les numéros au même format.
Inconvénients :
- Inefficace pour les PDF numérisés, peut perturber la mise en page originale.
- Fonction de recherche non prise en charge par certains logiciels PDF.
Étapes :
1. Ouvrez le fichier PDF avec Adobe Acrobat DC, appuyez sur Ctrl + H pour rechercher. Saisissez les premiers chiffres du format commun du numéro de suivi logistique, les numéros correspondants apparaîtront automatiquement.

2. Cliquez successivement, puis modifiez.

3. Passez ensuite au suivant et remplacez un par un.
Méthode 5 : Utiliser la fonction de recherche et de remplacement d'Adobe Acrobat DC
Recommandation : ★★☆☆☆
Avantages :
- Règles de correspondance entièrement personnalisables.
- Peut traiter de très gros PDF, et permet d'exporter la liste des résultats.
Inconvénients :
- Nécessite l'apprentissage des bases de la programmation, courbe d'apprentissage importante.
- Ne peut pas modifier directement le fichier PDF.
Étapes :
1. Installez Python et la bibliothèque PyPDF2.
2. Créez un fichier de script :
import re
import PyPDF2
pdf_file = open('input.pdf', 'rb')
pdf_reader = PyPDF2.PdfReader(pdf_file)
# Match 11-digit mobile phone number
phone_pattern = r'1[3-9]\d{9}'
for page in pdf_reader.pages:
text = page.extract_text()
phones = re.findall(phone_pattern, text)
print(f"Numéro de téléphone trouvé : {phones}")
3. Exécutez pour afficher tous les numéros correspondants.