PDF 키워드 일괄 삭제 실전: 수식을 이용한 퍼지 매칭으로 여러 파일의 가변 텍스트 제거


번역EnglishFrançaisDeutschEspañol日本語한국어업데이트 시간2026-06-11 09:43:38

성명: 웹사이트의 모든 이미지, 텍스트 및 비디오 콘텐츠는 참고용이며 최신, 정확, 적절하지 않을 수 있습니다. 이의가 있는 경우 실제 경험 효과를 기준으로 하십시오!

여러 PDF에서 삭제해야 할 내용이 완전히 고정된 단어가 아니라, 영문 월, 4자리 연도, 일련번호 등과 같은 가변 텍스트인 경우, 공식 퍼지 매칭을 이용하여 일괄 처리할 수 있습니다. 이 문서에서는 HeSoft Doc Batch Tool 스크린샷을 참고하여, PDF 도구에 접근한 후 "PDF에서 키워드 찾아 바꾸기"를 선택하고, 1.pdf부터 4.pdf를 불러온 뒤, "공식으로 퍼지 텍스트 찾기"를 사용하여 찾기 목록에 April|May와 \d{4}를 입력하고, 바꾸기 목록은 비워둠으로써 일치하는 키워드를 삭제하는 과정을 시연합니다. 또한 효과 비교, 규칙상의 위험 요소, 그리고 일괄 처리 전 점검 사항에 대해서도 설명합니다.

PDF 파일 관리에서 가장 까다로운 상황 중 하나는 삭제할 내용이 "규칙은 있지만 완전히 동일하지 않은" 경우입니다. 예를 들어 어떤 PDF에는 April이, 다른 PDF에는 May가 있을 수 있고, 연도가 2017인 것도, 2020인 것도 있으며, 번호 접두사는 같지만 뒤의 숫자가 다를 수 있습니다. 이런 가변 텍스트를 처리할 때 일반 검색만 사용하면 매번 다른 키워드를 입력해야 하므로 처리 효율이 매우 떨어집니다.

본문에서는 실제 사례를 통해 HeSoft Doc Batch Tool 의 PDF 일괄 찾기 및 바꾸기 기능과 수식 퍼지 매칭을 활용하여 여러 PDF의 가변 키워드를 일괄 삭제하는 방법을 소개합니다. 예제에는 4개의 PDF 파일이 있으며, PDF 페이지에 "April 13, 2017"이 표시됩니다. 이번 목표는 월과 연도를 삭제하는 것입니다. 월은 April 또는 May일 수 있고, 연도는 연속된 4자리 숫자입니다. 처리 후에는 월과 연도가 사라지고 날짜 숫자 "13,"은 그대로 유지됩니다.

이러한 작업은 기업 행정, 인사, 재무, 법무, 프로젝트 관리 등의 업무 환경에 매우 적합합니다. 예를 들어 외부용 PDF 보고서에서 내부 날짜를 일괄 삭제하거나, 오래된 연도 표기를 제거하거나, 계약 템플릿의 가변 번호를 삭제하는 경우 등이 있습니다. 수동 편집과 비교할 때, 파일 일괄 처리의 장점은 규칙을 한 번만 설정하면 여러 파일에 통일되게 적용되어 반복 작업을 줄이고 누락 처리 확률을 낮춘다는 점입니다.

적용 시나리오: PDF에서 고정 단어가 아닌 가변 텍스트 삭제

"초안" 또는 "내부용"과 같은 고정 키워드 하나만 삭제하면 되는 경우라면, 일반적인 정확한 찾기 및 바꾸기로 충분합니다. 하지만 모든 영어 월, 모든 4자리 연도, 고정 형식 번호와 같은 텍스트 유형을 삭제하려면 더 유연한 퍼지 매칭 방식을 사용해야 합니다.

본문의 예는 전형적인 가변 텍스트 삭제에 해당합니다. 원본 PDF의 날짜는 "April 13, 2017"인데, 여기서 "April"은 파일마다 바뀔 수 있고 "2017"도 다른 연도로 바뀔 수 있습니다. 모든 완전한 날짜를 수동으로 나열하는 것은 매우 번거로우므로, 수식 퍼지 검색을 사용하면 "무엇을 찾을지" 규칙으로 설명할 수 있습니다.

일반적인 적용 시나리오는 다음과 같습니다:

  • PDF에서 April, May 등의 영어 월을 일괄 삭제합니다.
  • PDF에서 2017, 2024, 2026 등의 4자리 연도를 일괄 삭제합니다.
  • 동일한 템플릿 PDF의 날짜 필드를 일괄 삭제하지만, 다른 본문 내용은 유지합니다.
  • 오래된 버전 PDF의 프로젝트 번호, 버전 번호, 배치 번호를 일괄 정리합니다.
  • 보고서, 설명서, 알림 파일의 통일된 표식을 일괄 처리합니다.

강조할 점은, 퍼지 매칭 능력이 강할수록 규칙의 정확성에 대한 요구도 높아진다는 것입니다. 규칙이 너무 광범위하게 작성되면 불필요한 내용까지 삭제될 수 있고, 너무 좁게 작성되면 삭제가 누락될 수 있습니다. 따라서 실제 작업 시에는 먼저 샘플 파일로 효과를 검증해야 합니다.

효과 미리 보기: 일괄 처리 전후 비교

처리 전: 4개의 PDF 파일에 동일한 규칙을 실행해야 함

처리 전 폴더에는 파일명이 각각 1.pdf, 2.pdf, 3.pdf, 4.pdf인 4개의 PDF가 있습니다. 이것들이 이번 일괄 처리 작업의 대상입니다. HeSoft Doc Batch Tool 와 같은 오피스 소프트웨어의 경우, 일괄 처리의 시작점은 일반적으로 파일을 하나씩 여는 것이 아니라 모든 대상 파일을 동일한 작업 목록에 추가하는 것입니다.

image-PDF 키워드 일괄 삭제,PDF 수식 퍼지 매칭,PDF 일괄 검색 및 바꾸기,PDF 가변 텍스트 삭제

PDF 내용 스크린샷에서 페이지에 눈에 띄는 날짜 내용 "April 13, 2017"이 있는 것을 볼 수 있습니다. 빨간색 상자는 삭제할 "April"과 "2017"을 표시합니다. 이 두 내용은 대표성을 띱니다. 하나는 후보 단어 유형 텍스트이고, 다른 하나는 숫자 규칙 유형 텍스트입니다.

image-PDF 키워드 일괄 삭제,PDF 수식 퍼지 매칭,PDF 일괄 검색 및 바꾸기,PDF 가변 텍스트 삭제

처리 후: 규칙과 일치하는 내용이 제거됨

처리 후 PDF에서 원래 월과 연도를 표시하던 위치는 빈칸이 되었지만, 중간의 "13,"은 삭제되지 않았습니다. 이는 소프트웨어가 날짜 전체를 통째로 삭제한 것이 아니라, 사용자가 설정한 키워드 규칙에 따라 위치를 찾아 정리했음을 보여줍니다.

image-PDF 키워드 일괄 삭제,PDF 수식 퍼지 매칭,PDF 일괄 검색 및 바꾸기,PDF 가변 텍스트 삭제

이러한 결과는 정밀한 PDF 내용 정리에 중요합니다. 사용자가 페이지 전체나 줄 전체를 삭제하려 하지 않고 일부 가변 필드만 삭제하려는 경우가 많습니다. 수식 퍼지 매칭 후 빈 값으로 바꾸기를 사용하면 이 목표를 더 정확하게 달성할 수 있습니다.

조작 단계: 수식 퍼지 매칭으로 PDF 키워드 일괄 삭제

단계 1: PDF 도구 분류 열기

HeSoft Doc Batch Tool 를 시작하면 인터페이스 왼쪽에 파일 이름, 폴더 이름, 파일 정리, Word 도구, Excel 도구, PowerPoint 도구, PDF 도구 등 여러 파일 처리 분류가 제공됩니다. 이번 처리 대상은 PDF 파일이므로 왼쪽의 "PDF 도구"를 클릭합니다.

PDF 도구 기능 목록에서 "PDF 에서 키워드 찾기 및 바꾸기"를 선택합니다. 이 기능에 대한 설명은 PDF 파일 내용의 키워드를 대량으로 찾아서 바꾸는 것으로, 이번 "찾은 후 삭제" 요구 사항에 적합합니다.

image-PDF 키워드 일괄 삭제,PDF 수식 퍼지 매칭,PDF 일괄 검색 및 바꾸기,PDF 가변 텍스트 삭제

본 단계의 목적은 PDF 텍스트 내용 처리와 관련된 일괄 기능으로 진입하는 것입니다. 완료되면 소프트웨어는 사용자가 PDF를 하나씩 열어 편집하게 하는 대신, 단계별 작업 페이지로 이동합니다.

단계 2: 처리할 PDF 파일 가져오기

기능 진입 후, 페이지 상단에 현재 작업이 "PDF 에서 키워드 찾기 및 바꾸기"임을 표시합니다. 첫 번째 단계는 "처리할 레코드 선택"입니다. 오른쪽 상단에서 "파일 추가", "폴더에서 파일 가져오기", "비우기", "더보기" 등의 조작 버튼을 볼 수 있습니다.

PDF 수량이 많지 않다면 "파일 추가"를 사용할 수 있고, PDF가 이미 동일한 디렉토리에 정리되어 있다면 "폴더에서 파일 가져오기"를 사용하는 것이 더 효율적입니다. 예시에서는 4개의 PDF가 목록에 추가되었으며, 파일명은 1.pdf, 2.pdf, 3.pdf, 4.pdf이고, 확장자는 모두 pdf이며, 해당 경로와 시간 정보가 표시됩니다.

image-PDF 키워드 일괄 삭제,PDF 수식 퍼지 매칭,PDF 일괄 검색 및 바꾸기,PDF 가변 텍스트 삭제

본 단계의 목적은 일괄 처리에 참여할 파일 범위를 확인하는 것입니다. 예상 결과는 목록에 처리해야 할 PDF만 포함되고 관련 없는 파일은 포함되지 않는 것입니다. 정식 처리 전에 레코드 수와 파일 경로를 확인하여 다른 PDF를 실수로 처리하는 것을 방지해야 합니다.

단계 3: 수식 퍼지 텍스트 검색 사용 선택

파일이 확인되면 하단의 "다음 단계"를 클릭하여 "처리 옵션 설정"으로 이동합니다. "찾는 방식"에서 인터페이스는 "정확한 텍스트 검색"과 "수식 퍼지 텍스트 검색 사용"을 제공합니다.

본 사례에서는 "수식 퍼지 텍스트 검색 사용"을 선택합니다. 그 이유는 삭제하려는 것이 단일 고정 단어가 아니라 규칙을 가진 텍스트이기 때문입니다. 즉, 월은 April 또는 May일 수 있고, 연도는 임의의 연속된 4자리 숫자일 수 있습니다. 정확한 검색을 선택하면 이러한 변화를 한 번에 커버하기 어렵습니다.

image-PDF 키워드 일괄 삭제,PDF 수식 퍼지 매칭,PDF 일괄 검색 및 바꾸기,PDF 가변 텍스트 삭제

본 단계의 목적은 와일드카드 방식 또는 수식화된 검색 기능을 활성화하는 것입니다. 예상 결과는 소프트웨어가 이후에 입력된 규칙에 따라 PDF 내용을 매칭하며, 완전히 일치하는 문자 그대로의 텍스트만 검색하지는 않는 것입니다.

단계 4: 검색할 키워드 표현식 입력

"검색할 키워드 목록"에 예시로 두 줄이 입력되었습니다. 첫 번째 줄은 "April|May"이고, 두 번째 줄은 "\d{4}"입니다. 이 두 규칙은 각각 두 종류의 삭제 대상에 대응합니다.

"April|May"는 April 또는 May를 매칭하는 것으로 이해할 수 있으며, PDF마다 다른 영어 월을 처리하는 데 사용됩니다. "\d{4}"는 연속된 4자리 숫자를 매칭하는 것으로 이해할 수 있으며, 연도를 삭제하는 데 사용됩니다. 이렇게 하면 PDF마다 연도가 달라도 4자리 숫자 규칙만 충족하면 검색할 수 있습니다.

사용자 본인의 파일에서 삭제해야 할 내용이 다른 것이라면, 예제 규칙을 자신의 규칙으로 대체할 수 있습니다. 예를 들어 더 많은 월을 삭제하려면 실제 상황에 맞게 확장해야 하고, 번호를 삭제하려면 번호 형식에 맞춰 더 적합한 표현식을 설정해야 합니다. 파일 내용을 이해하지 못한 상태에서 규칙을 직접 적용해서는 안 됩니다. 특히 "\d{4}"와 같이 매칭 범위가 넓을 수 있는 표기법은 주의해야 합니다.

단계 5: 바꾼 후 키워드 목록은 입력하지 않음

오른쪽은 "바꾼 후 키워드 목록"이며, 인터페이스에 "입력하지 않으면 삭제"라고 안내되어 있습니다. 이 문장은 매우 중요합니다. 삭제 작업이 별도의 버튼이 아니라 "빈 값으로 바꾸기"를 통해 구현됨을 설명하기 때문입니다.

이 예시에서는 PDF에서 April, May 및 4자리 연도가 사라지기를 원하므로 오른쪽에 아무런 대체 내용도 입력하지 않습니다. 소프트웨어는 실행 시 왼쪽에서 매칭된 내용을 공백으로 바꾸어 삭제 효과를 냅니다.

본 단계의 목적은 일괄 찾기 및 바꾸기 기능을 일괄 삭제 기능으로 전환하는 것입니다. 예상 결과는 출력 PDF에 매칭된 키워드가 더 이상 표시되지 않는 것입니다.

단계 6: 계속하여 저장 위치 설정 후 일괄 처리 시작

키워드 설정을 완료한 후 계속 "다음 단계"를 클릭합니다. 페이지 흐름에는 이후 "저장 위치 설정"과 "처리 시작"이 표시됩니다. 스크린샷에는 이 두 페이지의 구체적인 옵션이 나와 있지 않지만, 흐름 이름을 통해 사용자가 처리 후 PDF의 저장 위치를 먼저 지정한 다음 작업을 시작해야 함을 확인할 수 있습니다.

여기서 처리 결과와 원본 파일을 직접 섞지 않는 것이 좋습니다. 더 안전한 방법은 "PDF 키워드 삭제 후" 또는 "출력 결과"와 같은 새 출력 폴더를 만들어 처리된 파일을 저장하는 것입니다. 이렇게 하면 원본 파일과 새 파일을 쉽게 비교할 수 있고, 규칙이 부적합할 경우 빠르게 되돌릴 수도 있습니다.

처리가 시작되면 소프트웨어가 일괄 작업을 완료할 때까지 기다립니다. 완료 후 최소한 몇 개의 PDF를 열어 무작위로 검사하고, 특히 대상 필드가 포함된 페이지를 점검하여 월과 연도가 삭제되었는지, 다른 내용은 보존되었는지 확인합니다.

자주 묻는 질문 또는 주의사항

1. 수식 퍼지 매칭과 일반 키워드 검색의 차이점은 무엇인가요?

일반 키워드 검색은 완전히 일치하는 텍스트에 적합하고, 수식 퍼지 매칭은 규칙성을 가진 변화하는 텍스트에 적합합니다. 예를 들어 "April"은 고정 단어이고, "April|May"는 두 단어를 매칭할 수 있으며, "2017"은 고정 연도이고, "\d{4}"는 임의의 4자리 숫자를 매칭할 수 있습니다.

2. 빈 값으로 바꾸면 PDF 레이아웃에 영향을 미치나요?

예제 결과를 보면, 삭제된 위치는 공백으로 남고 다른 내용은 그대로 표시됩니다. PDF의 레이아웃 구조는 파일마다 다를 수 있으므로, 최종 효과는 실제 파일을 기준으로 해야 합니다. 일괄 처리 전에 먼저 샘플 PDF로 테스트하는 것이 좋습니다.

3. 실수로 번호나 다른 숫자를 삭제하지 않으려면 어떻게 해야 하나요?

무분별하게 너무 넓은 규칙을 사용하지 마십시오. 예를 들어 "\d{4}"는 모든 연속된 4자리 숫자를 매칭하므로 반드시 연도만 매칭하지는 않습니다. PDF에 보고서 번호, 계약 번호, 금액 등이 있다면 이것들도 검색될 수 있습니다. 먼저 파일 내용을 확인하고 필요시 규칙 범위를 좁혀야 합니다.

4. 알파벳 대/소문자 무시를 체크해야 하나요?

스크린샷에서 "알파벳 대/소문자 무시" 옵션을 볼 수 있지만, 예제에서는 체크하지 않았습니다. PDF 내에 대문자와 소문자가 통일되지 않은 경우, 예를 들어 April과 april이 동시에 존재한다면 실제 필요에 따라 이 옵션을 사용할 수 있습니다. 체크 여부는 사용자가 매칭하려는 범위에 따라 결정됩니다.

5. 일괄 처리 전에 왜 백업을 해야 하나요?

일괄 처리의 효율성은 높지만, 규칙이 잘못 설정되면 하나의 파일이 아닌 여러 파일에 영향을 줍니다. 원본 PDF를 백업하거나 새 디렉토리로 출력하는 것은 위험을 줄이는 기본적인 방법이며, 특히 공식 보고서, 계약, 보관 자료 등 중요한 파일일수록 더욱 그렇습니다.

요약: 규칙으로 반복 작업을 대체하여 PDF 일괄 정리를 더 효율적으로

본문은 전형적인 PDF 키워드 일괄 삭제 절차를 시연했습니다. HeSoft Doc Batch Tool 의 PDF 도구로 이동하여 "PDF 에서 키워드 찾기 및 바꾸기"를 선택하고, 여러 PDF 파일을 가져온 후 "수식 퍼지 텍스트 검색 사용"을 선택하고, 검색 목록에 "April|May"와 "\d{4}"를 입력한 다음 바꾼 후 키워드 목록을 비워둡니다. 최종적으로 소프트웨어는 매칭된 월과 연도를 삭제합니다.

이 방법의 가치는 사용자가 PDF를 하나씩 열 필요도 없고, 각 파일의 대상 텍스트가 완전히 동일할 필요도 없다는 점입니다. 내용에 규칙만 있다면 규칙을 사용하여 일괄 매칭할 수 있습니다. PDF에서 가변 텍스트를 일괄 삭제하거나, 날짜 필드를 일괄 정리하거나, 여러 파일 내용을 일괄 처리해야 하는 업무 환경에서 이 방식은 시간을 확실히 절약해 줍니다.

대량의 PDF, Word, docx, doc 또는 기타 오피스 파일을 처리하고 있다면, 반복성이 강한 정리 작업을 일괄 처리 도구에 맡기는 것을 고려해 보십시오. 실제 사용 시에는 먼저 소량의 파일로 규칙을 테스트한 다음 전체 폴더로 확장하여 일괄 실행하는 것이 좋습니다. 이렇게 하면 효율성을 높이는 동시에 처리 결과의 신뢰성도 확보할 수 있습니다.


키워드PDF 키워드 일괄 삭제 , PDF 수식 퍼지 매칭 , PDF 일괄 검색 및 바꾸기 , PDF 가변 텍스트 삭제
생성 시간2026-06-11 09:43:16

성명: 웹사이트의 모든 이미지, 텍스트 및 비디오 콘텐츠는 참고용이며 최신, 정확, 적절하지 않을 수 있습니다. 이의가 있는 경우 실제 경험 효과를 기준으로 하십시오!

관련 기사

더 많은 기사

원하는 기능이 없나요?

귀하의 필요 사항을 저희에게 피드백해 주시면, 평가 후 무료로 구현하겠습니다!