PDF의 키워드가 항상 완전히 일치하지는 않습니다. 예를 들어 파일마다 월, 연도, 번호, 버전 번호가 서로 다를 수 있습니다. 이 문서에서는 HeSoft Doc Batch Tool 을(를) 사용하여 "수식을 이용한 퍼지 텍스트 찾기"로 불규칙한 키워드를 일괄 매칭하고, 여러 PDF의 대상 콘텐츠를 통일적으로 교체하는 방법을 설명합니다. 보고서, 계약서, 설명서, 아카이브 문서를 일괄 업데이트해야 하는 오피스 사용자에게 적합합니다.
PDF 텍스트를 일괄 교체할 때 가장 번거로운 점은 교체 작업 자체가 아니라 "찾으려는 내용이 완전히 동일하지 않다"는 점입니다. 예를 들어 여러 PDF 보고서에서 어떤 날짜는 April 13, 2017이고, 어떤 날짜는 May 13, 2019일 수 있습니다. 일부는 번호 접미사가 다르고, 일부는 버전 연도가 다릅니다. 일반적인 정확한 찾기를 사용하면 각각의 이전 내용에 대해 규칙을 따로 설정해야 하며, 파일이 많을수록 규칙이 복잡해집니다.
이러한 문제를 해결하기 위해 와일드카드나 수식을 사용하여 퍼지 매칭을 하는 것이 더 적합한 방법입니다. 본 문서는 " HeSoft Doc Batch Tool "의 조작 스크린샷을 바탕으로, PDF에서 불규칙한 키워드를 일괄 교체하는 방법을 소개합니다. 이 소프트웨어는 사무용 소프트웨어로, 파일 일괄 처리 작업에 중점을 두어 여러 PDF의 반복적인 찾기, 교체, 저장 작업을 통합하여 완료함으로써 기계적인 작업을 줄여줍니다.
적용 대상: 불규칙하지만 규칙성이 있는 PDF 키워드
이른바 "불규칙 키워드"란 전혀 규칙성이 없는 것이 아니라 부분적으로 변화하는 것입니다. 예를 들어 월은 April 혹은 May일 수 있고, 연도는 임의의 네 자리 숫자일 수 있으며, 번호는 고정 접두사와 숫자의 조합일 수 있고, 버전 번호는 V1, V2 혹은 V3일 수 있습니다. 이러한 내용들은 서로 다르지만 규칙으로 표현할 수 있습니다.
사무 환경에서는 이러한 유형의 일괄 교체 요구 사항이 매우 많습니다. PDF 보고서 날짜 일괄 업데이트, 계약서의 연도 통일하여 교체, 여러 PDF 설명서의 이전 버전 번호를 새 버전 번호로 변경, 프로젝트 자료의 배치 번호 교체, Word, docx, doc, Excel 또는 PowerPoint로 내보낸 PDF 파일 처리 등이 있습니다. PDF 내 텍스트를 인식할 수 있고 대상 텍스트에 규칙성이 있다면, 퍼지 찾기 및 교체 사용을 고려할 수 있습니다.
결과 미리보기: 처리 전 PDF 내용에 이전 키워드 존재
예시 폴더에는 1.pdf, 2.pdf, 3.pdf, 4.pdf 여러 개의 PDF가 있습니다. 일괄 작업의 첫 단계는 바로 수정하는 것이 아니라 먼저 처리할 파일 범위를 확인하여 관련 없는 파일이 작업에 포함되지 않도록 하는 것입니다.

처리 전의 PDF를 열면 페이지에 "April 13, 2017"이 있는 것을 볼 수 있습니다. 빨간색 상자는 교체해야 할 월과 연도를 표시합니다. 이들은 전형적인 불규칙 키워드입니다. 다른 파일에서는 월과 연도가 다를 수 있지만, 모두 동일한 유형의 내용입니다.

결과 미리보기: 처리 후 키워드가 통일되어 교체됨
일괄 처리가 완료되면 PDF의 해당 위치는 "August 13, 2026"으로 변경됩니다. 결과적으로 월과 연도는 교체되었지만 기존의 레이아웃과 다른 내용은 유지됩니다. PDF 페이지 형식을 유지해야 하는 사무 문서의 경우, 이러한 방식으로 PDF 내용에서 직접 찾아 교체하는 것이 실제 요구 사항에 더 부합합니다.

조작 단계 1: PDF 키워드 찾기 및 교체 진입점 열기
" HeSoft Doc Batch Tool "를 실행한 후, 왼쪽에서 "PDF 도구"를 선택합니다. 소프트웨어 인터페이스는 카드 형식으로 PDF 관련 기능을 보여줍니다. 스크린샷에 따르면 "PDF 키워드 찾기 및 교체"를 선택해야 합니다.

이 단계의 목적은 PDF 본문 내용 처리 기능으로 진입하는 것입니다. 본 문서에서 처리하는 것은 파일 이름이 아닌 PDF 파일 내부의 텍스트이므로, 파일 이름 관련 도구를 선택해서는 안 됩니다. 올바른 진입점으로 들어간 후에야 PDF 내용의 찾기 방식과 교체 목록을 설정할 수 있습니다.
조작 단계 2: PDF 파일 일괄 추가
기능 진입 후 페이지는 마법사 흐름으로 표시되며, 1단계는 "처리할 레코드 선택"입니다. 오른쪽 상단에는 "파일 추가", "폴더에서 파일 가져오기", "비우기", "더 보기" 등의 작업이 제공됩니다. 파일 수가 적다면 "파일 추가"를 사용할 수 있고, 한 디렉토리 내의 대량 PDF는 "폴더에서 파일 가져오기"를 권장합니다.

스크린샷 목록에는 4개의 PDF가 추가되었으며, 파일 경로는 D:\test\에 있고, 확장자는 모두 pdf입니다. 가져온 후 레코드 수, 파일 이름, 경로를 확인하여 이번에 처리할 PDF가 모두 추가되었는지 확인해야 합니다. 목록에 처리할 필요 없는 파일이 있다면 작업 열을 통해 삭제할 수 있습니다. 확인이 완료되면 하단의 "다음"을 클릭합니다.
조작 단계 3: 수식 퍼지 텍스트 찾기 사용 선택
"처리 옵션 설정"으로 들어간 후, 먼저 "찾기 방식"을 봅니다. 인터페이스에는 "텍스트 정확히 찾기"와 "수식 퍼지 텍스트 찾기 사용"이 있습니다. 교체할 키워드가 완전히 동일하다면 정확히 찾기를 선택할 수 있습니다. 하지만 본 문서의 주제는 불규칙 키워드이므로 "수식 퍼지 텍스트 찾기 사용"을 선택해야 합니다.

수식 퍼지 찾기를 선택하면 규칙을 사용하여 텍스트 집합을 표현할 수 있습니다. 스크린샷 예시에서 왼쪽 찾을 키워드 목록의 첫 번째 행은 "April|May"로, April 또는 May와 매칭됨을 나타냅니다. 두 번째 행은 "\d{4}"로, 네 자리 숫자와 매칭됨을 나타냅니다. 오른쪽 교체 후 키워드 목록의 첫 번째 행은 "August", 두 번째 행은 "2026"입니다.
이러한 설정 방식은 PDF 내 날짜를 일괄 처리하는 데 매우 적합합니다. 하나의 고정된 날짜만 찾는 것이 아니라 "월 유형 텍스트"와 "연도 유형 텍스트"를 각각 찾아 새로운 대상 값으로 교체합니다. 여러 파일, 여러 페이지의 PDF 일괄 수정 시 규칙 수를 크게 줄일 수 있습니다.
조작 단계 4: 목록 대응 관계 확인
찾기 및 교체 목록을 작성할 때 가장 중요한 것은 좌우 양측의 행 번호가 대응되는 것입니다. 왼쪽 첫 번째 행에서 매칭된 내용은 오른쪽 첫 번째 행을 사용하여 교체되고, 왼쪽 두 번째 행에서 매칭된 내용은 오른쪽 두 번째 행을 사용하여 교체됩니다. 스크린샷에서 월 규칙은 August에, 연도 규칙은 2026에 대응되므로 이는 올바른 설정입니다.
행 번호가 잘못되면 교체 결과가 예상과 다를 수 있습니다. 예를 들어 연도를 월로 교체하거나, 월을 연도로 교체할 수 있습니다. 계약, 재무, 보고서 보관과 관련된 PDF의 경우 작성 완료 후 잠시 멈춰 규칙을 확인한 후 다음 단계로 넘어가는 것이 좋습니다.
조작 단계 5: 출력 저장 및 일괄 처리 시작
설정 완료 후 "다음"을 클릭합니다. 인터페이스 상단에서 "저장 위치 설정" 및 "처리 시작" 단계가 있음을 볼 수 있습니다. 원본 파일을 직접 덮어쓰지 않고 새로운 출력 위치를 설정하는 것이 좋습니다. 이렇게 하면 원본 PDF를 보존할 수 있어 처리 후 비교가 용이하고, 규칙 설정이 적절하지 않을 경우 신속하게 되돌릴 수 있습니다.
"처리 시작" 페이지로 이동한 후 마법사에 따라 처리를 실행합니다. 소프트웨어는 목록의 PDF에 대해 찾기 교체 규칙을 개별적으로 적용합니다. 처리가 종료된 후 출력 파일을 열어 주요 페이지를 확인하고 교체 결과가 예상과 일치하는지 확인합니다. 작업 파일이 많은 경우, 다른 파일, 다른 페이지 번호를 무작위로 검사하여 규칙이 잘못 매칭되지 않았는지 확인합니다.
자주 묻는 질문 및 주의 사항
1. 퍼지 찾기가 마음대로 찾는 것과 같습니까? 아닙니다. 퍼지 찾기는 규칙에 의존하며, 규칙을 정확하게 작성할수록 결과가 더 신뢰할 수 있습니다. "\d{4}"와 같은 규칙은 네 자리 숫자를 매칭할 수 있지만, PDF에 네 자리 번호가 많다면 신중하게 사용해야 합니다.
2. 교체 전 백업을 권장하는 이유는 무엇입니까? 일괄 처리의 특징은 한 번에 여러 파일에 영향을 미친다는 것입니다. 잘못된 교체로 인한 재작업을 방지하기 위해 처리 전 원본 PDF를 복사하거나 출력 결과를 새 디렉토리에 저장하는 것이 좋습니다.
3. 여러 키워드를 동시에 교체할 수 있습니까? 스크린샷에서 볼 수 있듯이 찾기 목록과 교체 목록은 여러 행 입력을 지원하므로 여러 키워드 세트를 설정할 수 있습니다. 실제 사용 시 좌우 행 번호를 일치시키고 항목별로 확인해야 합니다.
4. PDF 내용을 선택할 수 없다면 어떻게 합니까? PDF가 스캔 이미지인 경우 텍스트가 실제 텍스트가 아닐 수 있습니다. 이때 일반적인 찾기 교체는 인식하지 못할 수 있습니다. 먼저 PDF를 열어 대상 텍스트를 선택하거나 복사해 보고, 인식 가능한 텍스트임을 확인한 후 일괄 처리하는 것이 좋습니다.
5. 교체 후 키워드가 비어 있으면 어떤 영향이 있습니까? 인터페이스에 "입력하지 않으면 삭제를 의미합니다"라고 표시되어 있습니다. 단순히 교체만 하려는 경우 오른쪽 해당 행을 비워 두지 마십시오. 특정 유형의 텍스트를 실제로 삭제하려는 경우에도 먼저 테스트 파일로 효과를 확인해야 합니다.
요약
여러 PDF의 키워드가 완전히 일치하지 않지만 명확한 규칙이 있을 때, 와일드카드나 수식 퍼지 매칭을 사용하는 것이 더 효율적인 처리 방법입니다. " HeSoft Doc Batch Tool "을 통해 사용자는 PDF 도구에서 "PDF 키워드 찾기 및 교체"를 선택하고, 파일을 일괄 가져오며, "수식 퍼지 텍스트 찾기 사용"을 활성화하고, 찾기 및 교체 규칙을 입력한 후, 마지막으로 처리 결과를 통합 출력할 수 있습니다.
이 방법은 날짜, 연도, 번호, 버전 번호 등 사무 문서에서 흔한 수정 작업에 적합합니다. PDF를 하나씩 열어 수동 편집하는 것에 비해 일괄 처리는 많은 시간을 절약하고 누락 수정 확률을 낮춥니다. 소량의 파일로 테스트를 시작하여 규칙이 정확한지 확인한 후 전체 PDF를 처리하면 더욱 안정적인 일괄 교체 효과를 얻을 수 있습니다.