El formato de datos estructurados puede preservar perfectamente las relaciones jerárquicas de los documentos, siendo adecuado para escenarios como servicios jurídicos empresariales, tecnología financiera y publicación digital con gestión de contenido estructurado. Además, XML puede identificar inteligentemente títulos, párrafos, tablas, etc., haciendo que la información clave como cláusulas contractuales, datos financieros y materiales documentales sea recuperable y analizable. A continuación se presenta cómo convertir por lotes una gran cantidad de archivos PDF al formato XML.
1. Escenarios de uso
Cuando los investigadores necesitan extraer datos de gráficos, referencias y otros elementos de documentos PDF, o separar automáticamente capítulos, notas e índices de archivos PDF, podemos convertirlos por lotes a formato XML. Su estructura de árbol conserva perfectamente la jerarquía del contenido y permite una gestión modular del mismo.
2. Vista previa del efecto
Antes del procesamiento:

Después del procesamiento:

3. Pasos de operación
Abra 【 HeSoft Doc Batch Tool 】 y seleccione 【Herramientas PDF】 - 【Convertir PDF a XML】.

【Añadir archivo】 permite seleccionar y añadir manualmente los documentos PDF que se desean convertir.
【Importar archivos desde carpeta】 importa todos los archivos en formato PDF de la carpeta seleccionada.
A continuación se muestran los archivos importados.

Una vez finalizado el procesamiento, haga clic en la ruta junto a la ubicación de guardado para ver los archivos convertidos.
