Lorsque plusieurs fichiers texte TXT contiennent un grand nombre de chiffres, de numéros, de valeurs statistiques ou de marqueurs temporaires, les ouvrir un par un pour les supprimer manuellement prend non seulement du temps, mais il est aussi facile d'en oublier. Cet article prend HeSoft Doc Batch Tool comme exemple pour montrer comment utiliser des caractères génériques et des expressions régulières pour rechercher en masse des mots-clés numériques dans le texte, et laisser le contenu de remplacement vide, afin de supprimer en une seule fois le contenu correspondant dans plusieurs fichiers TXT. L'article comprend une comparaison des effets avant et après traitement, les étapes complètes de l'opération et les précautions courantes, adapté aux scénarios de bureau nécessitant de nettoyer du texte en masse, d'organiser des données, de traiter des journaux ou de normaliser le contenu des documents.
Dans le cadre du travail quotidien, de l'organisation de documents, du nettoyage de contenu ou de l'archivage de données, on rencontre souvent ce type de problème : un dossier contient de nombreux fichiers texte TXT, et chaque fichier contient des chiffres, numéros, valeurs statistiques, numéros de version ou marqueurs temporaires que l'on ne souhaite pas conserver. Si le nombre de fichiers se limite à un ou deux, ouvrir manuellement l'éditeur de texte pour les supprimer un par un est acceptable ; mais lorsque le nombre de fichiers atteint des dizaines, des centaines, voire que le traitement doit être répété quotidiennement, la recherche et la suppression manuelles deviennent un travail répétitif très inefficace.
Ce que cet article cherche à résoudre, c'est le problème de « comment utiliser les caractères génériques et les expressions régulières pour supprimer en masse des mots-clés dans de nombreux fichiers texte ». Ici, nous prenons l'exemple du logiciel de bureau « HeSoft Doc Batch Tool » montré dans la capture d'écran, pour démontrer comment importer plusieurs fichiers TXT en une fois dans le logiciel, utiliser la fonction « Rechercher et remplacer des mots-clés dans le texte », employer l'expression régulière \d+ pour correspondre aux chiffres consécutifs dans le texte, et laisser vide la liste des mots-clés de remplacement, réalisant ainsi l'effet de suppression en masse des mots-clés numériques.
La valeur centrale de cette méthode réside dans le fait qu'il n'est pas nécessaire d'ouvrir les fichiers un par un, de chercher emplacement par emplacement, ni de supprimer manuellement chaque élément trouvé. Il suffit de configurer correctement les règles de recherche pour que le logiciel puisse traiter par lots de multiples fichiers texte, ce qui est particulièrement adapté aux scénarios tels que le nettoyage de documents bureautiques, l'anonymisation de données textuelles, la suppression en masse de numérotations, l'organisation de fichiers journaux et l'uniformisation du format de contenu.
Scénarios d'application : quels cas conviennent à la suppression en masse de mots-clés textuels avec des expressions régulières ?
L'utilisation d'expressions régulières pour supprimer en masse des mots-clés textuels s'applique aux scénarios où « le contenu à supprimer possède des règles communes, mais dont le contenu spécifique n'est pas totalement identique ». Par exemple, dans l'exemple de cet article, de nombreux chiffres apparaissent dans les fichiers texte, certains étant « 10 », d'autres « 30 », et aussi « 100 », « 26000 », etc. Si l'on utilise une recherche ordinaire, il faudrait entrer chaque nombre spécifique un par un ; tandis qu'avec l'expression régulière \d+, on peut correspondre à tous les chiffres consécutifs en une seule fois.
Les scénarios d'application courants incluent les catégories suivantes :
- Suppression en masse de chiffres dans des fichiers TXT : par exemple, les années, valeurs statistiques, numéros, valeurs de mesure, numéros de page dans un article qui ne sont plus nécessaires et doivent être nettoyés uniformément.
- Nettoyage en masse de mots-clés dynamiques dans le texte : par exemple, les numéros de commande, numéros de série, identifiants, codes temporaires dont le format est similaire mais dont la valeur spécifique diffère dans chaque fichier.
- Traitement par lots de documents en anglais ou en chinois : qu'il s'agisse de txt en anglais, en chinois, ou de contenu en texte brut exporté depuis le web, des journaux ou des systèmes, tant que ce sont des fichiers texte, l'approche de recherche et remplacement peut être utilisée pour le nettoyage par lots.
- Anonymisation ou normalisation de contenu par lots : avant de publier des documents, il est nécessaire de supprimer les numéros sensibles, les marqueurs internes, les données de test ou les informations numériques que l'on ne souhaite pas divulguer.
- Réduction des opérations bureautiques répétitives : lorsque plusieurs fichiers doivent subir la même règle de recherche et suppression, le traitement par lots avec un logiciel de bureau est plus stable et plus rapide que l'édition manuelle.
Il est important de noter que l'exemple de cet article se concentre principalement sur les fichiers texte TXT. Si votre flux de travail implique également des documents Word, comme les formats doc, docx, ou encore PDF, HTML, etc., vous devrez choisir la fonction appropriée selon le module d'outils correspondant dans le logiciel. Dans la capture d'écran, l'utilisateur se trouve actuellement dans les « Outils texte », c'est pourquoi cet article se concentre sur la recherche, le remplacement et la suppression en masse du contenu des fichiers texte.
Aperçu des résultats : Avant traitement, plusieurs fichiers TXT contiennent des chiffres à supprimer
D'après la liste de fichiers avant traitement, on peut voir que le dossier à traiter contient plusieurs fichiers txt, par exemple big_bang.txt, black_holes.txt, dark_energy.txt, dark_matter.txt, galaxies.txt. Ces fichiers appartiennent tous au même lot de documents textuels ; les ouvrir un par un pour vérifier et supprimer les chiffres prendrait énormément de temps.

En continuant et en ouvrant l'un d'eux, black_holes.txt, on peut voir que le corps du texte contient plusieurs chiffres, par exemple « 10 », « 30 », etc. Ces chiffres sont dispersés dans différentes phrases et peuvent également apparaître avec des valeurs différentes dans d'autres fichiers txt. Dans ce cas, l'utilisation d'expressions régulières pour la correspondance par lots est la plus appropriée, car ce que l'on souhaite réellement supprimer n'est pas un nombre fixe spécifique, mais toute cette catégorie de « tous les chiffres consécutifs ».

Si l'on utilise la méthode traditionnelle, il faudrait répéter les opérations de recherche, localisation, suppression et sauvegarde dans chaque fichier. Plus il y a de fichiers, plus il est facile d'omettre des suppressions, de faire des erreurs ou d'oublier de sauvegarder. Après avoir utilisé HeSoft Doc Batch Tool , on peut d'abord importer tous les fichiers TXT à traiter dans la liste, puis configurer uniformément les règles de recherche et de remplacement, et enfin exécuter le traitement par lots.
Aperçu des résultats : Après traitement, les mots-clés numériques ont été supprimés en masse
Une fois le traitement terminé, en rouvrant le même fichier black_holes.txt, on peut voir que les emplacements où se trouvaient les chiffres sont devenus vides, indiquant que le contenu numérique correspondant a été supprimé. Par exemple, les emplacements de nombres comme « about 3 kilometers », « with 10 times », « roughly 30 kilometers » dans le texte original ont été nettoyés, ne laissant que le reste du contenu textuel.

D'après le résultat, on peut voir que cette opération ne supprime pas un nombre spécifique unique, mais supprime uniformément tous les nombres correspondant à la règle via l'expression régulière. Pour la suppression en masse de mots-clés dans les fichiers texte, cette manière est plus flexible : si la prochaine fois il faut supprimer des adresses e-mail, des numéros de téléphone, le contenu entre parenthèses, ou le contenu entre des préfixes et suffixes spécifiques, on peut aussi ajuster l'expression régulière selon les règles réelles.
Bien entendu, la suppression par lots affecte directement le contenu du fichier, il est donc conseillé de préparer des fichiers de sauvegarde avant le traitement officiel, ou d'enregistrer les résultats dans un nouvel emplacement. Ainsi, même si la règle d'expression régulière n'est pas parfaitement précise, on peut revenir au fichier original pour un nouveau traitement, évitant des pertes de contenu irréversibles.
Étapes d'opération : Utiliser HeSoft Doc Batch Tool pour supprimer en masse les chiffres dans les fichiers TXT
Ci-dessous sont décrites les étapes complètes de l'opération selon l'ordre des captures d'écran. Cet article prend pour exemple la suppression de tous les chiffres dans le texte, avec l'expression de recherche \d+ et un contenu de remplacement laissé vide. Vous pouvez également, selon vos besoins réels, remplacer l'expression par d'autres caractères génériques ou règles d'expression régulière.
Étape 1 : Entrer dans les Outils texte, sélectionner « Rechercher et remplacer des mots-clés dans le texte »
Après avoir ouvert HeSoft Doc Batch Tool , sélectionnez « Outils texte » dans la barre de fonctionnalités à gauche. Sur la page des Outils texte, vous pouvez voir plusieurs fonctions de traitement par lots liées aux fichiers texte, telles que Texte vers Word, Texte vers PDF, Supprimer les espaces dans le texte, etc. La fonction requise pour cet article est la première : « Rechercher et remplacer des mots-clés dans le texte ».

Le but du choix de cette fonction est de permettre au logiciel de rechercher un contenu spécifié de manière uniforme dans plusieurs fichiers texte, et d'effectuer un remplacement selon les paramètres. Lorsque le contenu de remplacement est vide, cela équivaut à supprimer le contenu trouvé. Par conséquent, « Rechercher et remplacer » peut non seulement servir à modifier des mots ou remplacer des termes par lots, mais aussi à supprimer des mots-clés par lots.
Après être entré dans cette fonction, le logiciel affiche une interface de traitement étape par étape. Dans la capture d'écran, on peut voir que le processus est divisé en phases telles que « Sélectionner les enregistrements à traiter », « Configurer les options de traitement », « Définir l'emplacement de sauvegarde » et « Démarrer le traitement ». Cette conception orientée processus aide à réduire les oublis : on confirme d'abord les fichiers, puis les règles, avant d'exécuter le traitement.
Étape 2 : Ajouter des fichiers ou importer des fichiers TXT depuis un dossier
Après être entré dans la page de fonction, la première étape consiste à sélectionner les enregistrements à traiter. En haut à droite de la capture d'écran, des options d'opération telles que « Ajouter des fichiers », « Importer des fichiers depuis un dossier », « Vider », « Plus » sont fournies. Pour un petit nombre de fichiers, on peut utiliser « Ajouter des fichiers » ; si tous les fichiers TXT sont déjà rassemblés dans un dossier, on peut utiliser « Importer des fichiers depuis un dossier » pour ajouter tous les fichiers texte du dossier en une seule fois à la liste de traitement.

Dans l'exemple, le logiciel a importé 5 fichiers TXT, et la liste affiche des informations telles que le nom du fichier, le chemin, l'extension, la date de création, la date de modification. Les fichiers incluent big_bang.txt, black_holes.txt, dark_energy.txt, dark_matter.txt, galaxies.txt. Le résultat attendu de cette étape est que tous les fichiers texte dont on veut supprimer les mots-clés numériques apparaissent dans la liste, et que le nombre d'enregistrements soit correct.
Il est conseillé ici de vérifier deux points avant de cliquer sur « Suivant ». Premièrement, confirmer qu'aucun fichier non désiré n'a été ajouté à la liste ; deuxièmement, confirmer que l'extension des fichiers correspond aux attentes, par exemple, dans cet exemple, tous sont TXT. S'il y a des fichiers dans la liste que vous ne souhaitez pas traiter, vous pouvez les supprimer via l'icône de suppression dans la colonne des opérations. Une fois la confirmation effectuée, cliquez sur le bouton « Suivant » en bas pour accéder à la configuration des options de traitement.
Étape 3 : Choisir d'utiliser la recherche floue par formule
La deuxième étape consiste à configurer les options de mots-clés. Dans la capture d'écran, le « Mode de recherche » propose deux options : « Recherche de texte exacte » et « Utiliser la formule de recherche floue de texte ». Comme cet article vise à supprimer tous les nombres, et non un nombre spécifique, il convient de choisir « Utiliser la formule de recherche floue de texte ».

Cette option peut être comprise comme l'utilisation de caractères génériques ou d'expressions régulières pour la correspondance. La recherche exacte ordinaire convient pour chercher des termes totalement identiques, par exemple remplacer « black hole » dans tous les fichiers par une autre phrase fixe ; tandis que la recherche floue par formule est plus adaptée au traitement de contenu possédant des régularités, comme les chiffres, dates, numéros, adresses e-mail, etc.
La capture d'écran montre également l'option supplémentaire « Ignorer la casse des lettres ». Pour le scénario de suppression de nombres de cet article, la casse n'est pas pertinente, on peut ne pas la cocher. Si vous traitez des mots-clés en anglais, par exemple pour correspondre simultanément à « Word », « word », « WORD », vous pouvez alors envisager d'activer cette option selon vos besoins réels.
Étape 4 : Entrer l'expression régulière \d+ dans la liste des mots-clés à rechercher
Dans la « Liste des mots-clés à rechercher », entrez \d+. C'est une écriture d'expression régulière courante, où \d représente un caractère numérique et + signifie correspondre à un ou plusieurs chiffres consécutifs. Ainsi, \d+ peut correspondre à des nombres de différentes longueurs comme « 3 », « 10 », « 30 », « 100 », « 26000 ».
Cette étape est cruciale, car la précision de la suppression par lots dépend de la justesse de la règle de recherche. Si vous entrez seulement un nombre fixe, par exemple « 10 », le logiciel ne traitera que le « 10 » dans le texte ; en entrant \d+, tous les chiffres consécutifs deviendront des objets de correspondance. Pour la suppression en masse de mots-clés numériques dans les fichiers texte, cette règle est plus appropriée.
Si votre objectif n'est pas de supprimer des nombres mais d'autres types de contenu, vous pouvez également les remplacer par la règle correspondante. Par exemple, pour supprimer un terme fixe, entrez ce terme ; pour supprimer un numéro de format spécifique, vous devrez rédiger une expression basée sur la structure du numéro. Cet article ne détaille pas les écritures complexes d'expressions régulières, l'important est d'expliquer l'approche pour accomplir la suppression par lots via l'interface du logiciel.
Étape 5 : Laisser vide la liste des mots-clés après remplacement pour obtenir l'effet de suppression
Le côté droit de la capture d'écran montre la « Liste des mots-clés après remplacement », et l'interface indique « Ne pas remplir signifie supprimer ». Par conséquent, si l'objectif est de supprimer les chiffres correspondants, ne saisissez rien dans la colonne de droite et laissez-la vide.
La logique de cette étape est la suivante : le côté gauche définit « quoi chercher », le côté droit définit « remplacer par quoi ». Lorsque le côté droit est vide, le logiciel remplace le contenu correspondant par un caractère vide, ce qui revient à le supprimer. Cela permet de réaliser l'opération de suppression en masse des mots-clés numériques dans les fichiers TXT.
Une fois les paramètres définis, vous pouvez continuer en cliquant sur « Suivant ». Selon le flux de l'interface, les étapes suivantes mèneront à la configuration de l'emplacement de sauvegarde et à la phase de démarrage du traitement. Bien que les captures d'écran actuelles ne montrent pas les détails des pages suivantes, on peut raisonnablement déduire de la barre d'étapes en haut que le logiciel demandera à l'utilisateur de confirmer le mode de sauvegarde des résultats avant d'exécuter le traitement par lots.
Étape 6 : Définir l'emplacement de sauvegarde et démarrer le traitement
Après avoir terminé la configuration des règles de recherche et de remplacement, on entre dans la phase « Définir l'emplacement de sauvegarde ». Pour la sécurité des données, il est fortement recommandé d'enregistrer les fichiers traités dans un nouveau dossier, plutôt que d'écraser directement les fichiers originaux. Surtout lors de la suppression par lots avec des expressions régulières, si la portée de l'expression est trop large, cela pourrait supprimer plus de contenu que prévu. Sauvegarder dans un nouvel emplacement permet de conserver les fichiers originaux, facilitant la comparaison et la restauration.
Après avoir confirmé l'emplacement de sauvegarde, on passe à la phase « Démarrer le traitement ». Une fois l'exécution terminée, ouvrez les fichiers traités pour un contrôle par sondage. Il est conseillé de vérifier au moins un fichier au contenu typique, par exemple black_holes.txt dans cet article, pour confirmer que les chiffres ont été supprimés comme prévu et que le reste du texte est resté intact. Si le résultat correspond aux attentes, les fichiers traités peuvent alors être utilisés pour la publication, l'archivage ou l'analyse ultérieure.
Questions fréquentes et points d'attention
1. Que va supprimer \d+ ?
\d+ est généralement utilisé pour correspondre aux chiffres consécutifs. Autrement dit, peu importe que le nombre ait 1, 2 ou plusieurs chiffres, tant qu'ils apparaissent consécutivement, ils seront correspondus et supprimés. Par exemple, « 10 », « 30 », « 100 », « 26000 » font tous partie de la portée de correspondance. Après traitement, les emplacements de ces nombres deviendront vides.
2. Pourquoi reste-t-il des espaces après la suppression des nombres ?
D'après l'image de résultat après traitement, on peut voir qu'après la suppression des nombres, des espaces peuvent subsister à leur emplacement d'origine. C'est parce que le logiciel n'a supprimé que les nombres correspondant eux-mêmes ; les espaces, ponctuations ou autre texte entourant les nombres sont conservés. Si vous souhaitez nettoyer davantage les espaces superflus, vous pouvez combiner avec d'autres fonctions de traitement de texte du logiciel, ou adapter la règle d'expression régulière pour inclure les espaces adjacents dans la portée de correspondance, selon la situation réelle. Mais lorsqu'on n'est pas sûr de l'impact de la règle, il est déconseillé d'emblée d'écrire une règle trop agressive.
3. Peut-on supprimer seulement certains nombres spécifiques, et non tous les nombres ?
C'est possible. Si l'on veut uniquement supprimer un mot-clé fixe, on peut utiliser la recherche de texte exacte et entrer le contenu spécifique ; si l'on veut seulement supprimer des nombres d'un certain format, il faut alors ajuster l'expression régulière. Par exemple, supprimer seulement les nombres à trois chiffres, ou seulement les nombres suivis d'un préfixe spécifique, relèvent de conceptions de règles plus fines. L'objectif de l'exemple de cet article est de supprimer en masse tous les nombres consécutifs, d'où l'utilisation de \d+.
4. Faut-il faire une sauvegarde avant le traitement par lots ?
Il est conseillé de faire une sauvegarde. Le traitement de fichiers par lots est très efficace, mais cela signifie aussi qu'un seul paramétrage peut impacter plusieurs fichiers. Particulièrement lors de l'utilisation d'expressions régulières, une règle mal écrite peut entraîner des suppressions erronées. Par conséquent, avant le traitement officiel, il est préférable de copier le dossier original, ou de choisir un nouveau répertoire de sortie dans les paramètres de sauvegarde du logiciel.
5. Cette méthode est-elle adaptée aux documents Word doc, docx ?
Les captures d'écran de cet article montrent le scénario de recherche et remplacement par lots pour les fichiers TXT dans les Outils texte, ce qui est adapté au traitement des fichiers en texte brut comme les TXT. Pour traiter des documents Word, par exemple doc, docx, il faut entrer dans les modules d'outils liés à Word dans le logiciel, et se référer aux fonctions correspondantes. La structure du contenu des différents formats de fichiers est différente, on ne peut pas simplement assimiler le flux de traitement TXT au flux de traitement Word à l'identique.
Résumé : Utiliser un outil de traitement par lots pour transformer une suppression répétitive en une configuration unique
Supprimer en masse des mots-clés dans plusieurs fichiers texte revient essentiellement à confier les actions d'édition manuelle répétitives à un logiciel de bureau. Grâce à la fonction « Rechercher et remplacer des mots-clés dans le texte » de HeSoft Doc Batch Tool , on peut d'abord importer plusieurs fichiers TXT, puis choisir « Utiliser la recherche floue de texte », entrer \d+ pour correspondre à tous les nombres, et laisser le contenu de remplacement vide, réalisant ainsi la suppression en masse des mots-clés numériques.
Comparé à l'ouverture manuelle des fichiers un par un pour suppression, cette méthode est plus adaptée aux scénarios de bureau où le nombre de fichiers est important, les règles sont claires et le traitement doit être répété. Elle permet non seulement de gagner du temps, mais aussi de réduire le risque d'omissions ou d'incohérences dans les opérations. Il est conseillé, lors de l'utilisation réelle, de préparer d'abord des fichiers de test ou des copies de sauvegarde, de confirmer que l'effet de l'expression régulière est correct, puis d'exécuter le traitement sur l'ensemble du lot de fichiers texte. Ainsi, on peut à la fois tirer parti de l'efficacité du traitement par lots et garantir la sécurité et la contrôlabilité du contenu des fichiers.