Lorsque plusieurs fichiers texte TXT contiennent des lignes similaires telles que Annexe A, Annexe B, etc., il est très inefficace de les ouvrir un par un pour les supprimer manuellement. Cet article prend HeSoft Doc Batch Tool comme exemple pour expliquer comment utiliser la fonction de recherche et remplacement de ligne complète dans un outil de texte, importer plusieurs fichiers texte, utiliser une formule de recherche floue pour saisir le texte Annexe [A-Z], et laisser le contenu de remplacement vide, afin de supprimer en masse toutes les lignes correspondantes. Cette méthode convient pour nettoyer les tables des matières, annexes, journaux, textes exportés et autres contenus répétitifs, ce qui peut améliorer efficacement l'efficacité du traitement des fichiers bureautiques.
Dans le travail de bureau quotidien, de nombreux documents textuels n'existent pas sous forme de fichier unique, mais apparaissent par lots. Par exemple, les rapports TXT exportés depuis un système, le texte brut copié et organisé depuis des pages Web, les documents textuels convertis depuis des documents Word ou PDF, sont souvent dispersés dans plusieurs fichiers. Si ces fichiers contiennent tous un ensemble de lignes inutiles, comme des notes annexes commençant par Annexe A, Annexe B, Annexe C, la suppression manuelle une par une serait très fastidieuse.
Cet article se concentre sur un problème spécifique : comment utiliser des caractères génériques ou des règles d'expression régulière pour supprimer par lots toutes les lignes spécifiées dans de nombreux fichiers texte. Dans l'exemple, nous devons supprimer les lignes entières correspondant à Annexe [A-Z] dans plusieurs fichiers TXT. À l'aide d'un logiciel de bureau orienté traitement par lots comme HeSoft Doc Batch Tool , il suffit à l'utilisateur de configurer une règle de recherche une seule fois pour nettoyer uniformément plusieurs fichiers texte, évitant les opérations mécaniques répétées d'ouverture de fichier, de recherche de mots-clés, de suppression de lignes et de sauvegarde.
Scénario applicable : Supprimer des lignes de texte similaires par lots, au lieu de modifier fichier par fichier
Si les lignes de texte que vous rencontrez sont exactement identiques, une recherche par mot-clé ordinaire peut également effectuer la suppression ; mais très souvent, les lignes à supprimer ont seulement un format similaire, sans être parfaitement identiques. Par exemple, dans ce cas, plusieurs lignes de contenu commencent respectivement par Annexe A, Annexe B, Annexe C, Annexe D, suivies de descriptions différentes. Si la recherche se base uniquement sur un texte exact, il faut maintenir plusieurs mots-clés ; en utilisant des caractères génériques ou des expressions régulières, une seule règle peut correspondre à toute une catégorie de contenu.
Cette méthode est adaptée aux scénarios de bureau suivants : supprimer par lots des lignes d'annexe dans plusieurs fichiers TXT ; nettoyer par lots des lignes de chapitre inutiles dans une table des matières ; supprimer par lots des lignes entières contenant un certain type de numéro ou de niveau dans des journaux ; traiter par lots des lignes de description dans des fichiers d'exportation de données ; nettoyer par lots des fichiers texte convertis depuis docx, doc, PDF, HTML. Ses caractéristiques sont un grand nombre de fichiers, des règles relativement uniformes et une forte répétitivité du traitement manuel.
D'après la liste de fichiers avant traitement, on peut voir que le dossier d'exemple contient cinq fichiers texte : 1.txt, 2.txt, 3.txt, 4.txt, 5.txt. Ce type de fichiers se prête parfaitement à l'importation et au traitement unifié en une seule fois avec un outil de traitement par lots.

Aperçu de l'effet : Les lignes Annexe à supprimer sont situées avant le corps du texte, avant traitement
En ouvrant l'un des fichiers texte, on peut voir le titre Annexes au début du fichier, suivi de plusieurs lignes consécutives commençant par Annexe A, Annexe B, Annexe C, Annexe D. Ces lignes sont la cible à supprimer cette fois-ci. Le texte spécifique qui les suit n'est pas le même, mais elles partagent une structure de préfixe commune : « Annexe » suivi d'un espace puis d'une lettre majuscule.

C'est précisément là que les caractères génériques et les expressions régulières entrent en jeu. Nous n'avons pas besoin de saisir le contenu complet de chaque ligne individuellement, il suffit d'utiliser une règle pour exprimer cette structure commune. Comparée à la suppression manuelle, la correspondance par règle est plus adaptée aux fichiers par lots, car elle peut appliquer le même jugement à chaque fichier, rendant le résultat du traitement plus uniforme.
Effet après traitement : Les lignes entières de Annexe A à Annexe D disparaissent, le contenu de la table des matières est conservé
Une fois le traitement terminé, en consultant à nouveau le fichier texte de sortie, les lignes Annexe A, Annexe B, Annexe C, Annexe D précédemment marquées d'un cadre rouge ont été supprimées. Le contenu restant conserve, après le titre Annexes, la table des matières et les entrées suivantes, telles que Introduction, Key changes from A Regulations, Software specification, etc.

Il est important de noter ici que le résultat du traitement ne consiste pas à remplacer les caractères « Annexe A » par du vide, mais à supprimer la ligne entière contenant ce contenu correspondant. Par conséquent, il n'y aura pas de situation où seul le préfixe est supprimé, laissant la moitié de la phrase descriptive. Pour le nettoyage de texte, cette approche de traitement par ligne est plus propre et préserve plus facilement la structure du texte.
Étape opérationnelle 1 : Trouver la fonction de recherche et remplacement de ligne entière dans l'outil texte
Après avoir lancé HeSoft Doc Batch Tool , entrez d'abord dans l'outil Texte depuis la navigation de gauche. L'interface liste plusieurs fonctions de traitement par lots liées aux fichiers texte, telles que Rechercher et remplacer des mots-clés dans le texte, Supprimer les espaces dans le texte, Convertir le texte en Word, Convertir le texte en PDF, etc. L'objectif ici étant de supprimer des lignes entières contenant un motif spécifié, il convient de sélectionner « Rechercher et remplacer des lignes entières dans les fichiers texte selon les mots-clés ».

Il y a deux informations clés dans le nom de cette fonction : premièrement, « selon les mots-clés », ce qui indique que le logiciel localisera le contenu en fonction du texte ou de la règle que vous avez définis ; deuxièmement, « remplacer des lignes entières », ce qui signifie que l'objet traité après correspondance est la ligne entière, et non un mot isolé. Pour les utilisateurs qui ont besoin de supprimer toutes les lignes par lots, choisir la bonne fonction est plus important que les réglages ultérieurs. Si vous choisissez le remplacement par mot-clé ordinaire, il se peut que vous n'obteniez pas l'effet de suppression de la ligne entière.
Étape opérationnelle 2 : Importer par lots les fichiers TXT à traiter
Après être entré dans cette fonction, la page affiche un flux de travail par étapes. La première étape consiste à sélectionner les enregistrements à traiter. Dans la capture d'écran, le coin supérieur droit de l'interface propose des boutons comme Ajouter des fichiers, Importer des fichiers depuis le dossier, Vider, Plus. Le tableau ci-dessous montre les fichiers déjà importés, y compris 1.txt à 5.txt, tous avec l'extension txt, situés dans le chemin D:\test.

Si vos fichiers sont tous placés dans le même dossier, il est plus pratique d'utiliser l'importation depuis le dossier ; si vous souhaitez traiter seulement quelques-uns d'entre eux, vous pouvez utiliser Ajouter des fichiers pour la sélection. Une fois l'importation terminée, vous devez vérifier les noms, chemins et extensions dans le tableau pour confirmer qu'aucun fichier non pertinent n'a été ajouté à la tâche. Le bas du tableau indique un nombre d'enregistrements de 5, ce qui signifie que la tâche par lots actuelle traitera 5 fichiers texte.
Le but de cette étape est de délimiter précisément l'étendue du traitement. L'efficacité du traitement par lots vient du traitement de plusieurs fichiers à la fois, mais cela suppose que la liste de fichiers soit correcte. Il est conseillé de prendre quelques secondes pour vérifier la liste des tâches avant de commencer officiellement, surtout si d'autres fichiers TXT sont mélangés dans le dossier, afin de confirmer s'ils doivent tous être traités.
Étape opérationnelle 3 : Activer la recherche floue par formule et saisir Annexe [A-Z]
Une fois la liste de fichiers confirmée et correcte, cliquez sur Suivant pour accéder aux options de traitement. À ce stade, vous devez définir le mode de recherche et la liste de mots-clés. Dans la capture d'écran, l'option sélectionnée est « Utiliser la recherche floue de texte par formule », ce qui est adapté pour correspondre à une catégorie de textes similaires, plutôt qu'à un seul mot fixe.

Saisissez « Annexe [A-Z] » dans la liste des mots-clés à rechercher. D'après les résultats de l'exemple, on peut voir que cette règle sert à faire correspondre des textes comme Annexe A, Annexe B, Annexe C, Annexe D. Comme nous utilisons la fonction de recherche et remplacement de ligne entière, toute ligne entière contenant un contenu conforme à cette règle sera sélectionnée pour traitement.
Laissez la liste à droite « Mots-clés de remplacement » vide. L'invite de l'interface indique que ne pas remplir signifie supprimer, donc laisser vide ne signifie pas ignorer le traitement, mais plutôt supprimer la ligne entière correspondante. Si vous souhaitez remplacer ces lignes par un texte d'invite uniforme, vous pouvez également saisir le contenu de remplacement à droite ; mais l'objectif de cet article est de supprimer toutes les lignes correspondantes, il faut donc laisser ce champ vide.
Lors de la configuration de la règle, il faut prêter attention aux espaces et à la casse. Dans l'exemple, le texte est « Annexe » suivi d'un espace puis d'une lettre majuscule. Si vos fichiers utilisent « Annexe-A », « ANNEXE A » ou « annexe a », la règle devra peut-être être ajustée en conséquence. L'interface propose également une option « Ignorer la casse » ; son activation doit être décidée en fonction du contenu textuel réel.
Étape opérationnelle 4 : Définir l'emplacement de sortie et exécuter le traitement par lots
Après avoir terminé la configuration des mots-clés, cliquez à nouveau sur Suivant. Selon le flux en haut de la page, vous accéderez ensuite à la définition de l'emplacement de sauvegarde et au début du traitement. La suppression par lots de lignes de texte est une modification du contenu du fichier par lots ; il est conseillé de ne pas écraser directement le seul original, surtout lors de la première utilisation de la règle. Une approche plus prudente consiste à choisir un nouvel emplacement de sauvegarde, ou à copier au préalable le dossier comme sauvegarde.
Une fois la phase de démarrage du traitement lancée, le logiciel traitera les fichiers texte un par un selon la liste des tâches. Pour chaque fichier, il recherchera les lignes entières contenant le motif « Annexe [A-Z] », et supprimera la ligne si le contenu de remplacement est vide. Une fois le traitement terminé, ouvrez le fichier de sortie pour vérifier le résultat : les lignes Annexe cibles doivent avoir été supprimées, tandis que les autres lignes de la table des matières et le contenu du corps du texte ne correspondant pas doivent être conservés.
L'intérêt de cette étape est de concentrer des actions répétitives en une seule exécution. Qu'il s'agisse de 5 fichiers, 50 fichiers ou même plus de fichiers TXT, tant que la règle est cohérente, ils peuvent tous être traités via le même flux de travail. Comparé à l'édition manuelle, le traitement par lots permet non seulement de gagner du temps, mais aussi de maintenir plus facilement une norme de traitement cohérente.
Questions fréquentes et points d'attention
1. Quelle est la relation entre les caractères génériques, les expressions régulières et la recherche floue par formule ?
Dans ce type de traitement de texte par lots, l'utilisateur souhaite généralement utiliser une seule expression pour correspondre à un groupe de contenus similaires. Le mode de recherche dans la capture d'écran est « Utiliser la recherche floue de texte par formule », ce qui a pour effet pratique de rendre la règle de recherche plus flexible qu'une correspondance exacte ordinaire. Pour un contenu tel que Annexe A à Annexe Z, « Annexe [A-Z] » peut exprimer une plage de lettres majuscules.
2. Que se passe-t-il si la zone de remplacement n'est pas laissée vide ?
Si vous saisissez du contenu dans la liste des mots-clés de remplacement, le logiciel traitera les lignes correspondantes selon la logique de remplacement de ligne entière. C'est-à-dire que la ligne cible pourrait être remplacée par le nouveau texte que vous avez saisi, au lieu d'être supprimée. Cet article vise une suppression par lots, il est donc nécessaire de laisser la liste de droite vide.
3. Faut-il ouvrir et vérifier les fichiers un par un avant le traitement ?
Il n'est pas forcément nécessaire de vérifier tous les fichiers individuellement, mais il est conseillé de prélever au moins quelques fichiers représentatifs pour confirmer que le format du contenu à supprimer est cohérent. Si l'écriture varie considérablement entre les différents fichiers, il peut être nécessaire d'ajouter ou d'ajuster les règles de correspondance. Le traitement par lots repose sur la capacité de la règle à couvrir précisément le contenu cible.
4. Cette méthode est-elle applicable uniquement aux fichiers TXT ?
Cet article illustre le traitement par lots de fichiers TXT sous l'outil Texte. Pour les documents Word, docx, doc, PDF et autres formats, il est nécessaire de choisir l'outil correspondant en fonction du type de fichier ou de le convertir d'abord au format texte. Les fichiers en texte brut ont une structure simple et sont les mieux adaptés à cette méthode de recherche et de suppression par ligne.
5. Comment éviter les suppressions accidentelles ?
La clé pour éviter les suppressions accidentelles est de restreindre la portée de la correspondance. Il ne faut pas rédiger la règle de manière trop large, par exemple, écrire seulement « Annexe » pourrait supprimer toutes les lignes contenant ce mot, et pas seulement les entrées de type Annexe A à Annexe Z. Utiliser une règle plus explicite comme « Annexe [A-Z] » peut améliorer la précision de la correspondance. Avant le traitement officiel, il est préférable de tester d'abord avec un fichier échantillon.
Résumé : Utiliser le nettoyage par lots piloté par des règles pour rendre le traitement de texte plus efficace
La suppression par lots de lignes spécifiées dans plusieurs fichiers texte TXT ne se prête pas à une édition manuelle fichier par fichier. Tant que ces lignes partagent une mise en forme commune, il est possible d'utiliser la fonction « Rechercher et remplacer des lignes entières dans les fichiers texte selon les mots-clés » de HeSoft Doc Batch Tool , en effectuant le nettoyage en une seule fois grâce à la recherche floue de texte par formule et une règle comme « Annexe [A-Z] ».
L'ensemble du flux de travail peut se résumer ainsi : entrer dans l'outil Texte, sélectionner la fonction de recherche et remplacement de ligne entière, importer plusieurs fichiers TXT, configurer la règle de recherche floue, laisser le contenu de remplacement vide, définir l'emplacement de sauvegarde et lancer le traitement. Cette approche permet à la fois d'améliorer l'efficacité et de réduire le travail répétitif et les erreurs manuelles. Il est conseillé aux utilisateurs traitant fréquemment de nombreux fichiers texte, fichiers journaux, documents exportés ou contenus en texte brut convertis depuis Word ou PDF, d'intégrer cette méthode de traitement par lots dans leur flux d'outils de bureau quotidiens.