Cet article explique comment utiliser HeSoft Doc Batch Tool pour supprimer en une seule fois les mots-clés correspondants dans plusieurs fichiers texte via des caractères génériques d'expression régulière. En prenant pour exemple la suppression de tous les chiffres dans des documents en anglais, nous montrons d'abord les multiples fichiers txt et leur contenu avant traitement, puis expliquons comment importer les fichiers, choisir la fonction Rechercher et remplacer, activer la recherche floue de texte basée sur une formule, saisir \d+ et laisser le champ de remplacement vide, afin de réaliser un nettoyage par lots des contenus répétitifs tels que les chiffres, les numéros et les valeurs statistiques, réduisant ainsi la charge de travail liée à l'ouverture et à la modification manuelle de chaque fichier.
Lors de l'organisation d'une grande quantité de documents textuels, on rencontre souvent un problème apparemment simple mais très chronophage : de nombreux fichiers TXT contiennent le même type de contenu indésirable, comme des chiffres, des numéros, des versions, des numéros de page, des mots-clés fixes, des marques régulières, etc. Ouvrir les fichiers un par un, puis utiliser l'éditeur pour rechercher, supprimer et enregistrer, implique non seulement de nombreuses opérations répétitives, mais il est aussi facile d'oublier des suppressions ou d'en faire par erreur. Cet article vise à résoudre ce type de problème de nettoyage de texte par lots : utiliser la capacité de recherche et de remplacement par lots d'un logiciel bureautique, associée à des caractères génériques ou des expressions régulières, pour supprimer en une seule fois des mots-clés dans de nombreux fichiers texte.
Ci-dessous, en prenant HeSoft Doc Batch Tool comme exemple, nous montrons comment supprimer tous les chiffres de plusieurs fichiers texte TXT. La règle de correspondance utilisée dans l'exemple est \d+, qui peut correspondre à des chiffres consécutifs ; laisser le contenu de remplacement vide signifie supprimer le contenu correspondant. Cette méthode convient également au traitement par lots de journaux, de matériaux, de textes collectés, de documents explicatifs et d'autres fichiers en texte brut.
Scénarios applicables : Quels contenus textuels sont adaptés à la suppression par lots avec des expressions régulières génériques
L'avantage des caractères génériques et des expressions régulières est qu'ils peuvent décrire une catégorie de contenu, au lieu de se limiter à un mot spécifique. Par exemple, si vous voulez supprimer tous les chiffres, saisir « 1, 2, 3… » un par un est manifestement irréaliste ; en utilisant \d+, vous pouvez faire correspondre en une seule fois des chiffres consécutifs comme « 10 », « 30 », « 100 », « 26000 ». Pour plusieurs fichiers texte, cette méthode de traitement est particulièrement efficace.
Les scénarios courants incluent : la suppression par lots des numéros dans les fichiers TXT ; le nettoyage par lots des numéros de page, des statistiques et des numéros d'ordre dans les articles ; la suppression par lots des horodatages ou des champs de format fixe dans les fichiers journaux ; la suppression par lots des mots-clés publicitaires dans les textes collectés ; le remplacement par lots des mots sensibles dans plusieurs fichiers texte ; le nettoyage par lots des marques répétitives dans le contenu de documents DOC, DOCX, TXT, etc. Les captures d'écran de cet article montrent du texte TXT, mais l'idée est utile pour de nombreux scénarios de nettoyage de documents.
Aperçu des résultats : Avant traitement, plusieurs fichiers TXT contiennent le contenu à supprimer
Avant traitement, le dossier contient plusieurs fichiers texte à nettoyer de manière unifiée, dont big_bang.txt, black_holes.txt, dark_energy.txt, dark_matter.txt, galaxies.txt. Lorsque le nombre de ces fichiers est élevé, le traitement manuel devient très inefficace.

En ouvrant l'un d'eux, black_holes.txt, on peut voir que le corps du texte contient de nombreux chiffres, par exemple « 10 », « 30 », etc. Ces chiffres peuvent être des données d'exemple, des statistiques ou des mots-clés que l'on ne souhaite pas conserver. S'il fallait ouvrir chaque fichier pour les supprimer manuellement, cela prendrait du temps et ne garantirait pas la cohérence des règles de traitement pour tous les fichiers.

Résultat après traitement : Les mots-clés numériques correspondants sont supprimés par lots
Après le traitement, en rouvrant le même fichier black_holes.txt, on peut voir que les emplacements où se trouvaient les chiffres ont été vidés. La zone en surbrillance verte dans la capture d'écran montre les espaces vides après suppression, par exemple « 10 fois » devient « fois », « 30 kilomètres » devient « kilomètres ». Cela indique que les chiffres correspondant à la règle générique régulière ont été remplacés par un contenu vide.

Il est important de noter qu'après la suppression des chiffres, les espaces, la ponctuation ou la sémantique du texte original peuvent nécessiter un second traitement en fonction des besoins métier réels. Par exemple, « environ 5 à 100 masses solaires » deviendra « environ à masses solaires » après suppression des chiffres. Si l'objectif est uniquement de supprimer les chiffres, ce résultat est conforme aux attentes ; s'il faut également supprimer les espaces superflus, une expression plus fine peut être conçue ou une autre étape de traitement des blancs peut être effectuée.
Procédure : Utiliser un logiciel bureautique pour supprimer par lots des mots-clés dans des fichiers TXT
Étape 1 : Accéder à l'outil texte, choisir Rechercher et remplacer des mots-clés dans le texte
Ouvrez HeSoft Doc Batch Tool . Dans la catégorie d'outils à gauche, sélectionnez « Outils texte », puis dans la liste des fonctions, trouvez et cliquez sur « Rechercher et remplacer des mots-clés dans le texte ». Cette fonction permet de rechercher par lots des mots-clés spécifiés dans le contenu des fichiers texte et de les remplacer par un nouveau texte ; lorsque le contenu de remplacement est vide, cela permet de supprimer les mots-clés par lots.

Le but de cette étape est d'entrer dans le flux de travail dédié à la recherche et au remplacement de contenu textuel. Contrairement à un éditeur standard qui ne peut traiter que le fichier unique ouvert, l'outil de traitement par lots permet d'ajouter plusieurs fichiers à la même tâche et d'exécuter les mêmes règles de manière unifiée, réduisant ainsi le travail répétitif.
Étape 2 : Ajouter ou importer les fichiers TXT à traiter
Après être entré dans la page de fonction, vous pouvez voir des boutons comme « Ajouter des fichiers », « Importer des fichiers d'un dossier », « Vider », « Plus » en haut de l'interface. Dans l'exemple, 5 fichiers TXT ont déjà été ajoutés à la liste de traitement, et le tableau affiche des informations telles que le nom du fichier, le chemin, l'extension, la date de création et la date de modification.

Si les fichiers à traiter sont concentrés dans le même répertoire, vous pouvez utiliser « Importer des fichiers d'un dossier » ; si vous ne traitez qu'un petit nombre de fichiers spécifiques, vous pouvez également utiliser « Ajouter des fichiers ». Après l'importation, il est conseillé de vérifier les noms et chemins des fichiers dans la liste pour confirmer qu'il n'y a pas d'omissions ni d'ajout erroné de fichiers non désirés. Une fois confirmé, cliquez sur « Suivant » en bas de la page.
Étape 3 : Choisir la recherche floue par formule, saisir la règle générique régulière
Arrivé sur la page « Définir les options de traitement », choisissez « Utiliser la recherche floue par formule » dans « Mode de recherche ». Dans la capture d'écran, cette option est sélectionnée. Ce mode est approprié pour utiliser des règles afin de faire correspondre une catégorie de texte, plutôt que de rechercher uniquement une chaîne fixe strictement identique.

Dans la « Liste des mots-clés à rechercher » à gauche, saisissez \d+. Où \d représente un caractère numérique, et + signifie correspondre à un ou plusieurs chiffres consécutifs. Par conséquent, il peut correspondre à des segments numériques comme « 5 », « 10 », « 100 », « 26000 ». Laissez la « Liste des mots-clés de remplacement » à droite vide. L'interface indique également « Laissez vide pour supprimer », donc ne rien saisir ici comme contenu de remplacement signifie supprimer directement les chiffres trouvés.
Si votre objectif n'est pas de supprimer des chiffres mais un mot fixe spécifique, vous pouvez également le saisir dans la liste des mots-clés à rechercher ; si vous souhaitez supprimer un certain type de contenu régulier, vous pouvez modifier l'expression en fonction de la règle. Avant l'opération réelle, il est recommandé de tester d'abord avec un petit nombre de fichiers pour confirmer que la portée de correspondance de l'expression est conforme aux attentes.
Étape 4 : Définir l'emplacement de sauvegarde et démarrer le traitement
Après avoir terminé les réglages des options de mots-clés, cliquez à nouveau sur « Suivant » pour entrer dans « Définir l'emplacement de sauvegarde ». Le flux de l'interface montre que les étapes suivantes incluent « Définir l'emplacement de sauvegarde » et « Démarrer le traitement ». Le choix de l'emplacement de sauvegarde est très important : si vous souhaitez conserver les fichiers originaux, il est conseillé de choisir un nouveau répertoire de sortie ; si vous êtes sûr de vouloir mettre à jour directement les fichiers sources, il est nécessaire de faire une sauvegarde au préalable pour éviter des difficultés de récupération en cas de suppression accidentelle.
Une fois l'emplacement de sauvegarde confirmé, passez à l'étape « Démarrer le traitement » pour exécuter la tâche par lots. Une fois le traitement terminé, ouvrez les fichiers résultats à l'emplacement de sortie pour une vérification ponctuelle, en vous concentrant sur la suppression effective des chiffres aux endroits prévus, et sur le maintien normal de l'encodage, des sauts de ligne et de la structure des paragraphes. Dans l'exemple, black_holes.txt ne contient plus les mots-clés numériques d'origine après traitement, ce qui indique que la règle de suppression par lots a pris effet.
Questions fréquentes et points d'attention
1. Pourquoi laisser le mot-clé de remplacement vide
L'objectif de cet exemple est de supprimer le contenu, pas de le remplacer par un autre texte. L'interface du logiciel indique « Laissez vide pour supprimer » pour la « Liste des mots-clés de remplacement » à droite, il suffit donc de la laisser vide. Si d'autres caractères sont saisis, le logiciel remplacera le contenu correspondant par ces caractères.
2. \d+ supprimera-t-il tous les chiffres
Dans les règles régulières courantes, \d+ correspond aux chiffres consécutifs, donc les années, quantités, numéros, distances, valeurs statistiques, etc., dans le texte peuvent tous être supprimés. Avant l'exécution, veuillez confirmer si tous ces chiffres doivent être supprimés. Si vous souhaitez uniquement supprimer des chiffres à des emplacements ou dans des formats spécifiques, vous devez utiliser des règles de correspondance plus précises.
3. Faut-il faire une sauvegarde avant le traitement par lots
Il est recommandé de faire une sauvegarde. L'efficacité du traitement par lots est élevée, mais si les règles sont mal définies, des résultats erronés peuvent être rapidement appliqués à plusieurs fichiers. Surtout lorsque l'opération de suppression est irréversible, il est préférable de copier d'abord les fichiers originaux, ou de sortir vers un nouveau répertoire, et de ne remplacer les fichiers officiels qu'après vérification.
4. Peut-on traiter des documents DOC, DOCX ou d'autres formats ?
Les captures d'écran de cet article illustrent des fichiers texte TXT. Pour les documents Word, DOCX, DOC et autres formats, vous devez choisir la fonction appropriée en fonction de l'outil documentaire correspondant ou de la plage prise en charge par le logiciel. Avant de traiter différents formats, il est conseillé de vérifier d'abord la description de la fonction et de tester avec un échantillon de document.
Résumé : Utiliser la recherche et le remplacement par lots pour réduire le travail répétitif de nettoyage de texte
Grâce à la fonction « Rechercher et remplacer des mots-clés dans le texte » de HeSoft Doc Batch Tool , vous pouvez transformer une tâche qui nécessitait auparavant d'ouvrir, rechercher et supprimer fichier par fichier, en une opération unique d'importation, de définition unifiée des règles et d'exécution par lots. Pour les utilisateurs qui doivent nettoyer des chiffres, des numéros, des mots-clés ou des textes réguliers dans un grand nombre de fichiers TXT, les expressions régulières génériques peuvent améliorer considérablement l'efficacité du traitement et garantir des normes de nettoyage cohérentes pour plusieurs fichiers.
Si vous êtes en train d'organiser un lot de documents textuels, il est conseillé de préparer d'abord quelques fichiers de test, de saisir les règles de correspondance en suivant les étapes de cet article et de laisser le contenu de remplacement vide. Une fois les résultats corrects confirmés, traitez le dossier complet. Cela permet de tirer parti de l'efficacité du logiciel bureautique par lots tout en réduisant le risque de suppression accidentelle.