여러 PDF의 날짜, 연도, 번호 등의 내용은 종종 같은 형식을 가지지만 완전히 동일하지는 않아 하나씩 찾아 바꾸는 것은 매우 비효율적입니다. 이 문서에서는 HeSoft Doc Batch Tool 을(를) 사용하여 여러 PDF 파일에 와일드카드 퍼지 찾기를 수행하고 일괄적으로 바꾸는 방법을 소개합니다. 예시를 통해 원본 PDF의 April 13, 2017이 August 13, 2026으로 업데이트된 것을 확인할 수 있으며, 이는 보고서 날짜, 계약 정보 및 문서 키워드를 통일적으로 수정해야 하는 사무 환경에 적합합니다.
많은 사람들이 PDF 보고서, 계약서, 설명서 또는 아카이브 자료를 정리할 때 비슷한 문제에 직면합니다. 파일 수는 많고 페이지 구조는 거의 동일하지만, 그 안의 특정 키워드를 일괄적으로 업데이트해야 한다는 점입니다. 예를 들어, 여러 PDF 보고서 표지에 날짜가 있고, 월은 April 또는 May이며, 연도는 서로 다른 네 자리 숫자일 수 있습니다. PDF 파일을 하나씩 열어 검색하고 교체하면 속도가 느릴 뿐만 아니라 특정 파일이나 페이지를 빠뜨리기 쉽습니다.
이 글에서는 구체적인 예시를 통해 오피스 소프트웨어 " HeSoft Doc Batch Tool "을(를) 사용하여 여러 PDF 파일의 키워드를 대량으로 퍼지 검색하고 교체하는 방법을 설명합니다. 여기서 핵심은 고정된 단어를 단순히 교체하는 것이 아니라, 와일드카드나 수식 규칙을 사용하여 "April 또는 May" 및 "네 자리 연도 숫자"와 같이 일정한 패턴을 가진 텍스트를 매칭하는 것입니다. 이 방법을 익히면 PDF 날짜 일괄 수정, PDF 번호 교체, PDF 버전 번호 업데이트 등 다양한 시나리오에 동일한 방식을 적용할 수 있습니다.
적용 시나리오: PDF 일괄 교체에 퍼지 검색이 필요한 이유
일반적인 찾아 바꾸기는 완전히 일치하는 텍스트를 처리하는 데 적합합니다. 예를 들어 모든 파일에 "이전 버전 설명"이라고 쓰여 있고 이를 "새 버전 설명"으로 바꾸려면, 정확히 찾아 바꾸기만 하면 됩니다. 하지만 실제 오피스 문서에서는 많은 대상 콘텐츠가 완전히 동일하지 않고 "형식은 같지만 값이 다른" 경우가 많습니다. 날짜의 월이 다르거나, 연도가 다르거나, 번호가 0001에서 9999까지 변할 수 있습니다.
와일드카드나 수식 기반 퍼지 검색이 없으면 각각의 경우에 대해 개별 규칙을 설정해야 합니다. 파일이 많을수록 규칙은 더 복잡해지고 수동 확인 비용도 높아집니다. 퍼지 검색을 사용하면 하나의 규칙으로 한 유형의 텍스트를 포괄할 수 있습니다. 예를 들어 "\d{4}"로 네 자리 연도 숫자를 매칭하고, "April|May"로 여러 선택 가능한 월을 매칭하는 방식입니다. 이렇게 하면 소프트웨어가 여러 PDF에서 규칙에 맞는 콘텐츠를 자동으로 찾아 일괄 교체할 수 있습니다.
이런 방법은 특히 행정 부서의 공지 파일 일괄 업데이트, 인사 부서의 템플릿 날짜 일괄 수정, 프로젝트 부서의 보고서 표지 업데이트, 법무 부서의 계약 버전 정보 교체, 자료 관리자의 PDF 아카이브 번호 일괄 수정 등의 시나리오에 적합합니다. 단일 PDF 편집기에 비해, 일괄 처리 도구는 많은 수의 반복적인 파일 작업에 더 적합합니다.
처리 전 상태: 폴더에 여러 개의 처리 대상 PDF 존재
예시에서 처리 대상 파일은 1.pdf, 2.pdf, 3.pdf, 4.pdf로 총 4개의 PDF 파일입니다. 이들은 동일한 위치에 저장되어 있어 일괄 처리 소프트웨어로 한 번에 가져오기에 적합합니다. 실제 업무에서는 파일 수가 4개보다 훨씬 많아 수십 건의 보고서, 수백 건의 계약 또는 전체 아카이브 자료 묶음일 수 있습니다.

PDF 중 하나를 열면 문서 표지의 날짜가 "April 13, 2017"인 것을 볼 수 있습니다. 빨간색 상자는 업데이트해야 할 부분, 즉 월 "April"과 연도 "2017"을 표시합니다. 이번 목표는 날짜 전체를 다시 쓰는 것이 아니라, 이 두 종류의 핵심 콘텐츠만 교체하여 날짜를 새 월과 연도로 만드는 것입니다.

이러한 부분 교체는 PDF 일괄 처리에서 매우 흔합니다. 예를 들어 날짜의 '일'은 유지하고 월과 연도만 업데이트하거나, 번호 접두사는 유지하고 숫자만 업데이트하거나, 고정된 문장 구조는 유지하고 부서명이나 버전 번호만 교체하는 경우입니다. 핵심은 소프트웨어가 어떤 콘텐츠를 변경하고 어떤 콘텐츠를 변경하지 말아야 하는지 정확하게 식별하도록 하는 것입니다.
처리 후 효과: 날짜 키워드가 일괄 업데이트됨
일괄 검색 및 바꾸기가 완료된 후, 처리된 PDF를 열면 날짜가 "August 13, 2026"으로 변경된 것을 확인할 수 있습니다. 월은 April에서 August로, 연도는 2017에서 2026으로 업데이트되었으며, 가운데 있는 "13,"은 잘못 수정되지 않았습니다.

이 결과는 퍼지 검색 규칙이 대상 텍스트를 정확하게 매칭하고, 설정에 따라 해당 콘텐츠로 교체했음을 보여줍니다. PDF 날짜를 대량으로 업데이트해야 하는 사용자에게 이 방법은 페이지를 일일이 검색하는 수고를 덜어주고 수동 복사 및 붙여넣기로 인한 오류를 줄여줍니다.
조작 단계 1: PDF 도구에서 찾아 바꾸기 진입점 열기
먼저 HeSoft Doc Batch Tool 을(를) 시작합니다. 소프트웨어 왼쪽에는 홈, 작업 흐름, 모든 도구, 파일 이름, 폴더 이름, 파일 정리, Word 도구, Excel 도구, PowerPoint 도구, PDF 도구 등의 진입점이 포함된 기능 분류가 있습니다. 이번에 수정할 대상은 PDF 페이지 콘텐츠이므로 왼쪽에서 "PDF 도구"를 선택합니다.
PDF 도구 페이지에서 "PDF에서 키워드 찾기 및 바꾸기" 기능을 찾습니다. 스크린샷에서 이 기능은 목록 첫 번째 항목에 있으며 "PDF 파일 콘텐츠에서 키워드를 대량으로 찾아 바꾸기"라는 설명이 있습니다. 이 기능을 클릭하면 전용 PDF 키워드 일괄 교체 프로세스로 진입합니다.

이 단계의 목적은 올바른 도구 모듈을 사용하는 것입니다. 동일한 오피스 일괄 처리 소프트웨어가 파일 이름 처리, Word/doc/docx 처리, Excel 표 처리, PPT 처리, PDF 처리 등 여러 작업을 동시에 지원할 수 있기 때문입니다. PDF 콘텐츠 찾아 바꾸기 모듈에 진입해야 이후 설정하는 키워드 규칙이 PDF 파일 내부 텍스트에 적용됩니다.
조작 단계 2: 여러 PDF 가져오기 및 파일 목록 확인
기능 진입 후 인터페이스는 단계별 프로세스로 표시됩니다. 현재 1단계 "처리할 레코드 선택"에 있습니다. 오른쪽 상단에는 "파일 추가" 및 "폴더에서 파일 가져오기" 두 가지 일반적인 가져오기 방식을 제공합니다. PDF 파일이 여러 위치에 분산되어 있다면 "파일 추가"를 사용하여 하나씩 선택할 수 있고, 모든 PDF가 동일한 폴더에 있다면 "폴더에서 파일 가져오기"를 사용하는 것이 더 편리합니다.
스크린샷에는 1.pdf, 2.pdf, 3.pdf, 4.pdf의 4개 레코드가 이미 가져와져 있습니다. 목록에는 이름, 경로, 확장자, 생성 시간, 수정 시간 등의 정보가 표시됩니다. 경로는 D:\test\1.pdf, D:\test\2.pdf, D:\test\3.pdf, D:\test\4.pdf로 표시되어, 이러한 파일들이 작업에 성공적으로 추가되었음을 나타냅니다.

다음 단계로 진행하기 전에 세 가지 사항을 확인하는 것이 좋습니다. 첫째, 레코드 수가 예상과 일치하는지, 둘째, 파일 확장자가 모두 pdf인지, 셋째, 수정할 필요 없는 파일이 실수로 추가되지는 않았는지입니다. 목록에 처리할 필요 없는 레코드가 있으면 작업 열을 통해 제거할 수 있습니다. 확인 후 하단의 "다음"을 클릭합니다.
조작 단계 3: 수식으로 텍스트 퍼지 검색 사용 선택
2단계에서 "처리 옵션 설정"으로 진입합니다. "키워드 옵션 설정" 영역에서 "검색 방식"을 볼 수 있습니다. 여기에는 두 가지 옵션이 있습니다: "정확한 텍스트 검색" 및 "수식을 사용한 퍼지 텍스트 검색". 대상이 고정된 문자열이면 정확한 검색을 선택하면 됩니다. 이 예시에서는 선택 가능한 월과 네 자리 연도를 매칭해야 하므로 "수식을 사용한 퍼지 텍스트 검색"을 선택합니다.

스크린샷 왼쪽의 "검색할 키워드 목록"에는 두 줄이 입력되었습니다: 첫 번째 줄 "April|May", 두 번째 줄 "\d{4}". 이는 두 개의 검색 규칙으로 이해할 수 있습니다. 첫 번째 규칙은 April 또는 May와 같은 월 텍스트를 매칭하는 데 사용되고, 두 번째 규칙은 네 자리 연도 숫자를 매칭하는 데 사용됩니다. 오른쪽 "교체 후 키워드 목록"에도 두 줄이 있습니다: 첫 번째 줄 "August", 두 번째 줄 "2026".
이렇게 설정하면 소프트웨어는 행별로 대응하여 교체를 실행합니다: April 또는 May를 찾으면 August로 교체하고, 네 자리 연도 숫자를 찾으면 2026으로 교체합니다. 날짜의 "13,"은 검색 규칙에 포함되지 않으므로 교체되지 않습니다. 이것이 바로 와일드카드나 수식 퍼지 검색의 장점입니다: 변화하는 콘텐츠를 커버하면서도 수정할 필요 없는 텍스트는 그대로 유지할 수 있습니다.
실제 필요가 번호 교체라면 유사한 방식을 사용할 수 있습니다. 예를 들어 대상 번호가 고정 접두사와 숫자인 경우, 숫자 부분을 퍼지 매칭 대상으로 삼을 수 있습니다. 여러 가능한 이전 단어를 교체하려면 "이전단어A|이전단어B"와 같은 방식으로 여러 대상 텍스트를 매칭할 수 있습니다. 실제 작성 방법은 소프트웨어 도움말과 사용자의 문서 콘텐츠를 기준으로 해야 합니다.
조작 단계 4: 출력 위치 설정 및 일괄 처리 실행
키워드 옵션 설정을 완료한 후 "다음"을 클릭합니다. 상단 프로세스에서 이후에 "저장 위치 설정"과 "처리 시작"이 더 있음을 알 수 있습니다. 저장 위치는 처리된 PDF를 어디에 출력할지 결정하는 데 사용되며, 처리 시작은 일괄 검색 및 바꾸기를 공식적으로 실행하는 단계입니다.
저장 위치 단계에서는 "처리 후" 또는 "교체 결과" 폴더와 같은 새로운 출력 디렉토리를 선택하는 것이 좋습니다. 이렇게 하면 원본 PDF를 보존할 수 있어 처리 후 비교 검사가 용이합니다. 원본 파일을 직접 덮어쓰면 규칙을 잘못 작성하거나 교체 범위가 예상을 벗어날 경우 복구 비용이 더 높아집니다.
처리를 시작하기 전에 파일 수와 검색 및 바꾸기 규칙을 다시 한번 확인합니다. 특히 퍼지 규칙을 사용할 때는 규칙이 지나치게 광범위하지 않은지 주의해야 합니다. 예를 들어 "\d{4}"는 네 자리 숫자를 모두 매칭하므로, 문서에 연도 외에 다른 네 자리 번호가 있다면 함께 매칭될 수 있습니다. 따라서 대량의 파일을 공식적으로 일괄 처리하기 전에 소량의 샘플로 테스트하여 대상 위치만 교체되는지 확인한 후 처리 범위를 확장하는 것이 좋습니다.
자주 묻는 질문 및 주의사항
1. "April|May"은(는) 무슨 뜻인가요? April 또는 May를 매칭한다는 의미입니다. 대상 텍스트에 여러 가능한 값이 있지만 모두 동일한 새 값으로 교체해야 하는 경우에 적합합니다.
2. "\d{4}"가 연도를 매칭할 수 있는 이유는 무엇인가요? 예시 규칙으로 보면 네 자리 숫자를 매칭하는 데 사용되므로 2017과 같은 연도를 매칭할 수 있습니다. 많은 연도가 네 자리 숫자이므로 이 방식은 연도 필드를 일괄 업데이트하는 데 적합합니다.
3. 2017만 교체하고 다른 네 자리 숫자는 교체하고 싶지 않다면 어떻게 하나요? 광범위한 네 자리 숫자 매칭 대신 더 정확한 검색 콘텐츠를 사용하는 것이 좋습니다. 규칙이 광범위할수록 커버 범위가 넓어지고, 규칙이 정확할수록 잘못된 교체 확률이 낮아집니다.
4. 교체 후 날짜 중간의 13이 변경되지 않은 이유는 무엇인가요? 검색 규칙에 월과 네 자리 연도만 포함되고 날짜 숫자 13은 포함되지 않았기 때문에, 소프트웨어는 매칭된 대상 부분만 교체합니다.
5. PDF 일괄 교체와 Word 일괄 교체의 차이점은 무엇인가요? Word, doc, docx는 일반적으로 텍스트 구조를 편집하기가 더 쉽습니다. PDF는 레이아웃 고정을 더 강조합니다. PDF 콘텐츠를 처리할 때는 사전에 백업하고 출력 효과를 확인하여 레이아웃과 교체 위치가 예상과 일치하는지 확인해야 합니다.
요약: 와일드카드로 PDF 일괄 교체 효율 향상
여러 PDF 파일에서 통일하여 수정해야 할 날짜, 연도, 번호 또는 키워드가 있는 경우, 가장 권장하지 않는 방법은 파일을 하나씩 열고, 하나씩 찾고, 하나씩 저장하는 것입니다. HeSoft Doc Batch Tool 을(를) 사용하면 여러 PDF를 동일한 작업에 추가하고 "PDF에서 키워드 찾기 및 바꾸기" 기능을 통해 집중 처리할 수 있습니다.
이 튜토리얼은 전형적인 PDF 날짜 일괄 수정 프로세스를 보여줍니다. 여러 PDF를 가져오고, 수식을 사용한 퍼지 텍스트 검색을 선택하고, 검색 규칙으로 "April|May" 및 "\d{4}"를 입력한 후, 이를 "August" 및 "2026"으로 교체합니다. 이 방법은 규칙적이지만 완전히 일치하지는 않는 텍스트를 처리할 수 있어, 오피스 시나리오에서의 일괄 파일 유지 관리에 특히 적합합니다. 공식적으로 처리하기 전에 소량의 PDF를 선택하여 시범 운영해 보고, 교체 효과를 확인한 후 모든 파일을 처리하는 것이 좋습니다.