XML은 마크업 언어로서 데이터 교환 및 저장에 사용되며, 기계가 읽을 수 있고 사람도 읽을 수 있는, 데이터 구조와 내용을 정의하는 순수 텍스트 형식 파일입니다. 편집할 수 없는 PDF 파일에서 데이터를 추출하여 재사용하거나 비구조화된 PDF 콘텐츠를 기계가 읽을 수 있는 형식으로 변환해야 할 때, PDF 파일을 XML 형식으로 일괄 변환하여 이러한 요구를 충족할 수 있습니다.
1、사용 시나리오
재무제표, 고객 기록과 같은 구조화된 데이터가 포함된 PDF 파일이나 인보이스 형식의 PDF 파일을 ERP 시스템 또는 회계 소프트웨어로 가져와야 하는 경우가 많습니다. 이러한 파일을 XML 형식으로 일괄 변환하여 데이터를 추출하고 저장하면 추가 처리 및 보관이 용이해집니다.
2、효과 미리보기
처리 전:

처리 후:

3、조작 단계
【 HeSoft Doc Batch Tool 】를 열고 【PDF 도구】-【PDF를 XML로 변환】을 선택합니다.

【파일 추가】XML 형식으로 변환할 PDF 파일을 하나 또는 여러 개 추가합니다.
【폴더에서 파일 가져오기】선택한 폴더 내의 모든 PDF 파일을 가져옵니다.
아래에서 가져온 파일을 확인할 수 있습니다.

처리가 완료되면 저장 위치를 클릭하여 변환된 XML 파일을 확인합니다.
