Cet article explique comment utiliser HeSoft Doc Batch Tool , Convertissez plusieurs fichiers de pages Web HTML et MHTML en texte brut du bloc-notes TXT à la fois. Convient pour l'archivage du contenu Web, le tri des données, l'extraction de texte, le nettoyage par lots des étiquettes Web et d'autres scènes. En sélectionnant la fonction "Convertir HTML en TXT", importer des fichiers ou des dossiers et définir l'emplacement d'enregistrement pour le traitement par lots, évitez d'ouvrir les pages Web une par une pour copier et coller, ce qui réduit considérablement les opérations répétées.
Nous rencontrons souvent un lot lors du tri des données, de l'archivage des pages Web, de l'analyse de contenu ou du nettoyage des données. Html,. mhtmlFichiers de page Web. Si vous ouvrez manuellement les pages Web une par une, copiez le contenu dans le bloc-notes et enregistrez-le en tant que. TxtNon seulement cela prend du temps, mais il est également facile de manquer des fichiers et de nommer la confusion. Le problème à résoudre dans cet article est de savoir comment convertir par lots de nombreux fichiers de pages Web HTML en texte brut du bloc-notes.
Voici un logiciel de bureau HeSoft Doc Batch Tool Par exemple, montrez comment utiliser la fonction «conversion HTML en TXT» pour convertir plusieurs fichiers Web en fichiers texte brut TXT à la fois, réduire la duplication du travail et améliorer l'efficacité du traitement des fichiers.
Scène applicable: ce qui convient au volume HTML en TXT
Conversion par lots de fichiers Web HTML en texte brut TXT, adaptée aux scénarios de traitement de bureau et de données courants suivants:
- Archivage des données Web:Convertissez les fichiers Web enregistrés en texte TXT plus léger pour une sauvegarde et une récupération à long terme.
- Extrait de contenu:Extraire le texte principal de la page HTML pour réduire les interférences de lecture et d'organisation des balises et des styles de page Web.
- Page Web d'historique de tri par lots:Par exemple, il existe de nombreux fichiers 1.html, 2.mhtml, 3.html et autres dans le dossier local, qui doivent être convertis en 1.txt, 2.txt, 3.txt.
- Prétraitement de l'analyse de texte:Après avoir converti des fichiers de page Web en texte brut, il est pratique de rechercher, de participe, de statistiques ou d'importer d'autres systèmes.
- Réduire le copier-coller manuellement:Évitez les opérations inefficaces d'ouverture, de sélection complète, de copie, de collage et d'enregistrement des pages Web une par une.
Aperçu de l'effet: fichier de page Web HTML avant le traitement et texte brut TXT après le traitement
Du point de vue de l'effet de traitement, le fichier avant la conversion est généralementFichier de page Web HTMLPar exemple:
- 1.html
- 2.mhtml
- 3.html
- 4.html
Ces fichiers sont généralement affichés avec l'icône du navigateur et ouverts sous forme de page Web après un double clic.

Une fois la conversion par lots terminée, le correspondant est généréFichier texte brut du bloc-notes TXTPar exemple:
- 1.txt
- 2.txt
- 3.txt
- 4.txt
En d'autres termes, les fichiers de page Web d'origine seront convertis par lots en format texte brut qui peut être ouvert dans le bloc-notes, ce qui est pratique pour la copie, la recherche, l'organisation et l'archivage.

Étapes de l'opération: utiliser HeSoft Doc Batch Tool Conversion par lots
Étape 1: Entrez dans la catégorie "Outils de texte", sélectionnez "Convertir HTML en TXT"
Ouvrir HeSoft Doc Batch Tool Après cela, sélectionnez dans la catégorie de fonction de gaucheOutils de texte. Dans la liste des outils de texte, recherchez et cliquez sur"Conversion HTML en TXT".
La description de cette fonction consiste à convertir les fichiers HTML au format de texte brut TXT par lots, ce qui correspond exactement aux exigences de «fichier de page Web en lot pour le texte du bloc-notes» à compléter dans cet article.

Opérations But:Accédez à la fonction de traitement par lots dédiée au HTML vers TXT.
Résultats attendus:Le logiciel entre dans la page de traitement "Conversion HTML à TXT", prêt à importer les fichiers de page Web qui doivent être convertis.
Étape 2: Ajouter un fichier de page Web HTML ou MHTML
Après être entré dans la page des fonctionnalités, vous pouvez voir en haut de l'interface"Ajouter des fichiers"Et"Importer des fichiers à partir d'un dossier"Deux entrées.
- Si le nombre de fichiers de la page Web est faible et dispersés à différents endroits, vous pouvez cliquer surAjouter un fichierSélectionnez manuellement le fichier HTML à traiter.
- Si tous les fichiers de la page Web sont placés dans le même dossier, vous pouvez cliquer surImporter des fichiers à partir d'un dossierPour importer les fichiers de ce dossier en une seule fois.
Les exemples de fichiers dans la capture d'écran incluent 1.html, 2.mhtml, 3.html, 4.html, indiquant que cette fonction convient à l'importation par lots de plusieurs fichiers de page Web pour une conversion unifiée.

Opérations But:Ajoutez les fichiers de pages Web qui doivent être convertis à la liste en attente.
Résultats attendus:Les enregistrements en attente apparaissent dans la liste des fichiers et des informations telles que le nom, le chemin, l'extension, l'heure de création et l'heure de modification sont affichées.
Étape 3: Vérifiez la liste des fichiers en attente
Une fois le fichier importé, le logiciel répertorie les enregistrements en cours de traitement dans le tableau. Vous pouvez vous concentrer sur les informations suivantes:
- Nom:Vérifiez que les fichiers html, mhtml doivent être convertis.
- Chemin:Vérifiez que l'emplacement de la source du fichier est correct.
- Extension:Vérifiez que le format de fichier de page Web est importé.
- Nombre d'enregistrements:La partie inférieure affiche la quantité agrégée. Par exemple, la capture d'écran montre que le nombre d'enregistrements est de 4.
Si un fichier est ajouté par erreur, vous pouvez le retirer de la liste à l'aide de l'opération de suppression située à droite de la ligne. L'interface fournit égalementFiltrerEtTriBouton pour faciliter la visualisation et l'organisation des enregistrements en attente lorsqu'il y a beaucoup de fichiers.
Opérations But:Confirmez le nombre de fichiers et la portée des fichiers avant la conversion formelle pour éviter les transferts manquants ou erronés.
Résultats attendus:La liste des fichiers en attente est exacte et prête à passer à l'étape suivante.
Étape 4: Cliquez sur "Suivant" pour définir l'emplacement de sauvegarde
Après avoir confirmé que la liste des fichiers est correcte, cliquez sur en bas de la page“Suivant”. À partir du flux de l'interface, vous pouvez voir que la deuxième étape est"Définir l'emplacement de sauvegarde".
Dans cette étape, vous devez sélectionner l'emplacement d'enregistrement du fichier TXT converti en fonction des besoins réels. Il est recommandé de définir le répertoire de sortie dans un dossier séparé, tel que "HTML to TXT Results", afin d'éviter de se mélanger avec le fichier de page Web d'origine et de rechercher plus clairement.
Opérations But:Détermine où le fichier TXT sort après la conversion par lots.
Résultats attendus:Le logiciel enregistre l'emplacement de sortie et est prêt à commencer la conversion par lots.
Étape 5: Démarrer le traitement, générer un fichier texte brut TXT
Après avoir défini l'emplacement de sauvegarde, entrez“Commencer à traiter”Lien. Après l'exécution du traitement, le logiciel convertira par lots les fichiers de pages Web HTML et MHTML en fichiers texte brut TXT dans l'ordre des fichiers de la liste.
Une fois la conversion terminée, vous pouvez voir les résultats dans le dossier de sortie défini. Habituellement, un fichier TXT correspondant au fichier d'origine est généré, par exemple, 1.html est converti en 1.txt et 2.mhtml en 2.txt.
Opérations But:Laissez le logiciel effectuer automatiquement la conversion du format par lots.
Résultats attendus:Plusieurs fichiers de page Web sont convertis en bloc par blocs-notes pour ouvrir. Txt fichier texte brut.
Questions fréquemment posées et considérations
1. Le style de page Web sera-t-il conservé après le transfert HTML vers TXT?
TXT est un format de texte brut, principalement utilisé pour enregistrer le contenu du texte, et ne convient pas pour conserver les styles de composition, les images, les styles CSS ou les mises en page complexes dans les pages Web. Si vous devez conserver les effets visuels de la page Web, vous devez envisager d'autres formats; si l'objectif est d'extraire le contenu du texte, TXT est plus léger et plus pratique.
2 .. Les fichiers mhtml peuvent-ils également être traités ensemble?
Comme vous pouvez le voir dans la liste des exemples, le fichier en attente contient2.mhtml. En fonctionnement réel, les fichiers de page Web HTML et MHTML qui doivent être convertis peuvent être importés dans la liste ensemble, puis traités de manière unifiée.
3. Besoin de sauvegarder le fichier d'origine avant la conversion?
Il est recommandé de conserver le fichier HTML d'origine et de sortir TXT dans un nouveau dossier. De cette manière, même si vous devez reconvertir ou afficher le contenu de la page Web d'origine, vous pouvez retourner le fichier d'origine à tout moment.
4. Comment éviter les erreurs d'importation quand il y a beaucoup de fichiers?
Peut prioriser les fichiers de la page Web qui doivent être convertis dans un dossier, puis utiliserImporter des fichiers à partir d'un dossier. Après l'importation, vérifiez le nom, le chemin, l'extension et le nombre d'enregistrements dans la liste.
5. À quoi conviennent les fichiers TXT convertis?
Les fichiers TXT peuvent être ouverts avec des outils de texte tels que le Bloc-notes et le Notepad, et il est également pratique pour la recherche en texte intégral, le copier-coller, le tri des données, les statistiques de texte ou l'importation dans d'autres systèmes de bureau.
Résumé: Convertir des fichiers de page Web par lots, réduire le copier-coller en double
La valeur fondamentale de la conversion par lots d'un grand nombre de fichiers de page Web HTML en texte brut du bloc-notes TXT est de réduire les opérations répétées. Utilisation HeSoft Doc Batch Tool Pour la fonction «Conversion HTML en TXT», il vous suffit de sélectionner la fonction, d'importer le fichier, de vérifier la liste, de définir l'emplacement de sauvegarde et de commencer le traitement, et vous pouvez effectuer la conversion de format de plusieurs fichiers de page Web à la fois.
Si vous triez un lot. HTML,. mhtml, si vous ne voulez pas ouvrir le contenu copié un par un, il est recommandé d'utiliser directement le processus de traitement par lots pour convertir les fichiers Web en un. Txt fichier texte brut, puis archiver, récupérer ou analyser ultérieurement.