Lorsque vous devez supprimer toutes les lignes correspondant à un certain motif dans plusieurs fichiers texte, l'édition manuelle est très inefficace. Cet article prend la suppression des annexes telles que l'Annexe A, l'Annexe B, etc., comme exemple, pour expliquer comment importer plusieurs fichiers txt dans HeSoft Doc Batch Tool , sélectionner la fonction de recherche et remplacement de ligne entière, utiliser Annex [A-Z] comme règle de correspondance régulière avec joker, et effectuer une suppression par lots en laissant la liste de remplacement vide, aidant ainsi les utilisateurs à nettoyer rapidement une grande quantité de données textuelles.
De nombreux documents bureautiques, après conversion, exportation ou consolidation, génèrent un grand nombre de fichiers texte TXT. Ces fichiers contiennent souvent des lignes superflues, telles que des instructions en annexe, des indications de table des matières, des marqueurs système, des en-têtes de tableau répétitifs ou des étiquettes de journal. Traiter un seul fichier n'est pas difficile, mais lorsque vous êtes confronté à plusieurs fichiers texte dans un dossier, les ouvrir un par un, rechercher, supprimer et enregistrer devient une tâche répétitive typique et inefficace.
La méthode présentée dans cet article consiste à utiliser des expressions régulières avec caractères génériques pour supprimer par lots toutes les lignes correspondantes dans plusieurs fichiers texte. Dans l'exemple, il s'agit de supprimer des lignes d'annexes comme Annexe A, Annexe B, Annexe C, Annexe D. Leur caractéristique commune est de commencer par Annexe, suivi d'une lettre majuscule. Par conséquent, on peut utiliser Annexe [A-Z] pour englober ce type de texte et laisser le logiciel bureautique effectuer le traitement par lots automatiquement.
L'outil utilisé dans cet article est « HeSoft Doc Batch Tool » comme le montre la capture d'écran. Il s'agit d'un logiciel de traitement de documents par lots orienté vers les scénarios bureautiques, adapté pour centraliser les tâches répétitives de traitement de fichiers. La procédure complète, de la visualisation du fichier original à la suppression par lots, est décrite ci-dessous en suivant l'ordre des captures d'écran réelles.
Scénarios applicables : lorsque vous devez supprimer « une ligne entière correspondant à un motif »
Dans le traitement de texte, supprimer quelques caractères fixes et supprimer une ligne entière sont deux besoins différents. Par exemple, si une ligne contient « Annexe A Normes relatives aux aliments et boissons - révisé 2020 », supprimer uniquement « Annexe A » laisserait le texte explicatif suivant dans le fichier, rendant le contenu final potentiellement incomplet. Ce qui est réellement nécessaire, c'est de supprimer la ligne entière contenant Annexe A.
La fonction « Rechercher et remplacer des lignes complètes dans des fichiers texte par mot-clé » de HeSoft Doc Batch Tool est précisément conçue pour ce besoin. Elle peut trouver les lignes cibles en fonction d'un mot-clé ou d'une expression, puis remplacer ou supprimer la ligne entière.
Les types de fichiers et les scénarios professionnels adaptés à cette méthode incluent :
- Nettoyer par lots les lignes d'annexe, de table des matières ou d'instructions dans plusieurs fichiers .txt ;
- Supprimer tous les enregistrements contenant un mot-clé spécifique dans les fichiers journaux ;
- Organiser les données textuelles exportées par le système, en supprimant les en-têtes de tableau ou les commentaires répétitifs ;
- Traiter de grandes listes de texte, en supprimant les lignes ayant un préfixe fixe ou une numérotation régulière ;
- Effectuer un nettoyage de texte par lots sans écrire de code ni exécuter de script.
Si vos fichiers sont des documents Word (docx, doc), des PDF ou des feuilles de calcul Excel, vous devez rechercher l'outil correspondant dans le logiciel. Les captures d'écran de cet article montrent le flux de traitement des fichiers TXT dans les outils texte, l'accent est donc mis sur la suppression par lots de lignes dans les fichiers texte.
Effet avant traitement : plusieurs fichiers TXT attendant un nettoyage unifié
Examinons d'abord l'état des fichiers avant traitement. La capture d'écran montre 5 fichiers texte dans le même dossier, nommés 1.txt, 2.txt, 3.txt, 4.txt, 5.txt. Ils font tous partie des objets à traiter par lots.

En ouvrant l'un des fichiers texte, on peut voir qu'il existe un ensemble de lignes d'Annexe dans le contenu du fichier. Les Annexes A, B, C et D entourées par les cadres rouges sont le contenu que cet article vise à supprimer. Ces lignes sont suivies de descriptions différentes, ce qui indique qu'il ne s'agit pas exactement du même texte fixe.

C'est précisément parce que les descriptions diffèrent d'une ligne à l'autre que l'approche « ligne complète contenant le mot-clé » est plus appropriée. Il suffit de faire correspondre la partie régulière de la ligne, c'est-à-dire Annexe suivi d'une lettre, pour que le logiciel puisse supprimer la ligne entière, sans qu'il soit nécessaire de saisir chaque ligne complète dans la liste de recherche.
Effet après traitement : toutes les lignes correspondant à la règle Annexe ont disparu
Une fois le traitement terminé, la capture d'écran des résultats montre que les lignes Annexe A à Annexe D d'origine ont été supprimées. Le fichier conserve le titre « Annexes » en haut, ainsi que la table des matières « Contents » et les entrées numérotées suivantes, ce qui indique que la cible de traitement était assez précise et que le contenu non pertinent n'a pas été supprimé.

L'avantage de ce type de traitement par lots réside dans la cohérence des résultats. Tant que plusieurs fichiers contiennent des lignes d'Annexe suivant le même motif, le logiciel traitera tous les fichiers importés selon la même règle, sans qu'il soit nécessaire de juger manuellement chaque cas. Pour l'organisation de grandes quantités de données textuelles, cela peut réduire considérablement le temps consacré aux opérations répétitives.
Procédure : utiliser HeSoft Doc Batch Tool pour effectuer la suppression par lots
Étape 1 : ouvrir la zone fonctionnelle des outils texte
Après avoir ouvert HeSoft Doc Batch Tool , la barre de navigation de gauche fournit des points d'entrée pour différents types de traitement de fichiers bureautiques, tels que les outils Word, les outils Excel, les outils PowerPoint, les outils PDF et les outils texte. Comme l'extension du fichier d'exemple est txt, allez dans « Outils texte ».
Dans la liste des outils texte, trouvez et sélectionnez « Rechercher et remplacer des lignes complètes dans des fichiers texte par mot-clé ». Dans la capture d'écran, cette fonction se trouve en 2ème position et comporte une indication : elle peut supprimer ou remplacer par lots des lignes entières contenant un certain mot-clé dans des fichiers texte.

Après avoir sélectionné cette fonction, vous entrez dans un flux de traitement de type assistant. L'assistant aide l'utilisateur à suivre les étapes dans l'ordre : importer les fichiers, définir les règles, définir l'emplacement de sauvegarde et lancer le traitement. Il est adapté aux utilisateurs bureautiques qui ne souhaitent pas écrire de scripts.
Étape 2 : ajouter ou importer plusieurs fichiers texte
À l'étape « Sélectionner les enregistrements à traiter », vous devez ajouter tous les fichiers txt à traiter dans la liste. Le coin supérieur droit de l'interface comporte des boutons d'action comme « Ajouter des fichiers », « Importer des fichiers depuis un dossier », « Vider », « Plus », etc. Dans l'exemple, les cinq fichiers 1.txt à 5.txt ont été importés.

Les informations affichées dans la liste incluent le numéro d'ordre, le nom, le chemin, l'extension, la date de création et la date de modification. Ces informations permettent de confirmer que les fichiers sont corrects. Par exemple, la colonne d'extension affiche txt et la colonne de chemin indique que les fichiers se trouvent dans le répertoire D:\test\. Après avoir confirmé qu'il n'y a ni omission ni ajout incorrect dans la liste des fichiers, cliquez sur « Suivant » en bas.
Pour les tâches de traitement par lots, la vérification de la liste de fichiers est très importante, car les règles suivantes s'appliqueront à tous les fichiers de la liste. Si des fichiers non pertinents sont inclus, ils seront également traités.
Étape 3 : définir le mode de recherche sur « Recherche floue par formule »
Après être entré dans « Définir les options de traitement », vous voyez d'abord le « Mode de recherche ». La capture d'écran montre deux options : « Recherche précise de texte » et « Recherche floue par formule ». Cette fois, nous voulons utiliser des expressions régulières avec caractères génériques pour faire correspondre un type de texte, donc sélectionnez « Recherche floue par formule ».

Ce choix détermine la flexibilité de la règle de recherche. Si vous ne recherchez qu'un texte fixe, utilisez la recherche précise ; pour faire correspondre des contenus variables comme Annexe A, Annexe B, Annexe C, la recherche floue par formule est nécessaire.
Étape 4 : saisir la règle de correspondance Annexe [A-Z]
Dans la « Liste des mots-clés à rechercher » à gauche, saisissez :
Annexe [A-Z]
Cette règle permet de faire correspondre le texte commençant par Annexe suivi d'une lettre majuscule. Dans l'exemple, Annexe A, Annexe B, Annexe C et Annexe D sont tous conformes à cette règle. Comme la fonction traite des lignes complètes, ces lignes contenant le contenu correspondant seront traitées comme un tout.
Voici une idée pratique : avant le traitement par lots, observez les caractéristiques communes des lignes cibles. Ne vous précipitez pas pour copier chaque ligne complète dans la liste de recherche, mais cherchez d'abord à dégager une régularité. Plus la régularité est claire, plus l'expression sera concise et plus sa valeur de réutilisation sera élevée.
Étape 5 : laisser la liste des mots-clés de remplacement vide
La zone de droite est la « Liste des mots-clés de remplacement », avec une indication à côté : « Laissez vide pour supprimer ». Par conséquent, si l'objectif est de supprimer toutes les lignes correspondantes, ne saisissez aucun texte de remplacement dans la zone de droite. La partie gauche est pour la recherche, la zone de droite laissée vide signifie la suppression.
Si vous remplissez le côté droit, le logiciel pourrait exécuter une logique de remplacement, en substituant les lignes trouvées par le texte que vous avez saisi. L'objectif de cet article étant de supprimer les lignes d'Annexe, il suffit de laisser le champ vide.
Étape 6 : poursuivre vers la définition de l'emplacement de sauvegarde et lancer le traitement
Après avoir défini la règle de recherche et de suppression, cliquez sur « Suivant » en bas. La barre de progression montre que les étapes suivantes sont « Définir l'emplacement de sauvegarde » et « Démarrer le traitement ». L'emplacement de sauvegarde détermine le répertoire de sortie des fichiers traités. Il est conseillé de séparer les résultats de sortie des fichiers originaux pour faciliter la comparaison avant/après traitement.
Une fois à l'étape de démarrage du traitement, le logiciel applique la règle de suppression à chaque fichier de la liste importée. Une fois le traitement terminé, ouvrez les fichiers de sortie pour une vérification ponctuelle afin de confirmer que les lignes Annexe A, Annexe B, etc., ont bien été supprimées et que le contenu du corps du texte et de la table des matières est conservé.
Questions fréquentes ou points d'attention
1. Plus la règle d'expression régulière avec caractères génériques est large, mieux c'est ?
Non. Plus la règle est large, plus la portée de correspondance est grande et plus le risque de suppression accidentelle est élevé. Par exemple, écrire seulement Annexe pourrait correspondre à toutes les lignes contenant ce mot, y compris les lignes de titre que vous pourriez vouloir conserver. L'utilisation de Annexe [A-Z] dans cet article est plus ciblée que l'utilisation d'Annexe seul.
2. Pourquoi le titre « Annexes » n'a-t-il pas été supprimé ?
L'expression de l'exemple est Annexe [A-Z], qui exige un espace et une lettre majuscule après Annexe. Or, « Annexes » ne correspond pas à cette règle, il a donc été conservé. Cela montre également qu'une expression bien conçue peut éviter de supprimer du contenu qui ne devrait pas l'être.
3. Est-il possible de tester d'abord sur un petit nombre de fichiers ?
C'est recommandé. Bien que le traitement par lots soit efficace, l'impact d'une erreur de règle est plus large. Vous pouvez d'abord importer 1 ou 2 fichiers échantillons pour tester et, après avoir confirmé que l'effet correspond aux attentes, importer le dossier complet pour un traitement par lots.
4. Comment vérifier les résultats après le traitement ?
Vous pouvez ouvrir quelques fichiers de sortie et comparer le contenu avant et après traitement. Dans l'exemple de cet article, le fichier contenait les lignes Annexe A à Annexe D avant traitement, ces lignes disparaissent après traitement, tandis que la table des matières « Contents » et les entrées numérotées suivantes sont conservées. Si ce résultat est conforme, cela signifie que la règle a été correctement définie.
Résumé : laissez le logiciel bureautique effectuer le nettoyage de texte par lots
Si plusieurs fichiers texte contiennent tous des lignes régulières à supprimer, le traitement manuel n'est pas la solution optimale. Avec HeSoft Doc Batch Tool , vous pouvez regrouper la séquence d'actions répétitives « ouvrir le fichier, rechercher le contenu, supprimer la ligne, enregistrer le fichier » en une seule tâche par lots.
Le paramétrage clé de l'exemple de cet article est le suivant : dans les outils texte, sélectionnez « Rechercher et remplacer des lignes complètes dans des fichiers texte par mot-clé », importez plusieurs fichiers txt, utilisez la « Recherche floue par formule », saisissez Annexe [A-Z] et laissez la liste des mots-clés de remplacement vide. Cela permet de supprimer par lots toutes les lignes complètes correspondant à la règle Annexe suivie d'une lettre.
Si vous organisez un grand nombre de fichiers TXT, de fichiers journaux ou de données textuelles exportées, il est conseillé d'analyser d'abord les caractéristiques communes du contenu à supprimer, puis d'utiliser des expressions régulières avec caractères génériques pour un traitement par lots. Cela peut réduire considérablement le travail répétitif, améliorer l'efficacité du nettoyage des fichiers et garantir la cohérence des résultats de traitement pour plusieurs fichiers.