와일드카드를 사용하여 여러 PDF에서 날짜, 연도 등 모호한 키워드를 일괄 삭제하는 방법


번역EnglishFrançaisDeutschEspañol日本語한국어업데이트 시간2026-06-11 09:46:02

성명: 웹사이트의 모든 이미지, 텍스트 및 비디오 콘텐츠는 참고용이며 최신, 정확, 적절하지 않을 수 있습니다. 이의가 있는 경우 실제 경험 효과를 기준으로 하십시오!

여러 PDF 파일에서 삭제해야 할 날짜, 연도, 번호 또는 민감한 단어가 있을 때, 파일을 하나씩 열어 수동으로 찾아 삭제하는 것은 매우 시간이 많이 소요됩니다. 이 문서에서는 HeSoft Doc Batch Tool 을 예로 들어, "PDF에서 키워드 찾기 및 바꾸기" 기능을 사용하는 방법을 보여줍니다. 수식을 통해 텍스트를 퍼지 검색하여 여러 PDF에서 April, May 및 네 자리 연도 등의 내용을 일괄적으로 찾아 삭제합니다. 문서는 처리 전후의 효과와 소프트웨어 조작 인터페이스를 결합하여, PDF 추가, 와일드카드 규칙 설정, 빈 값으로 바꾸어 삭제, 계속 저장 및 처리하는 전체 과정을 설명하며, PDF 텍스트 내용을 일괄 정리해야 하는 사무 환경에 적합합니다.

일상 업무에서 PDF 파일은 계약, 보고서, 감사 자료, 공지 파일 또는 공개 문서를 보관하는 데 자주 사용됩니다. 이러한 PDF에 날짜의 월, 네 자리 연도, 고정 번호, 배치 번호, 프로젝트 코드 또는 일부 민감 정보 등 반복적으로 정리해야 할 텍스트가 있는 경우, 파일을 일일이 열어 수동으로 삭제하는 것은 매우 비효율적입니다. 특히 파일 수가 많고 각 PDF의 페이지 수도 많을 경우, 수동 검색은 시간이 많이 소요될 뿐만 아니라 삭제 누락이 발생하기 쉽습니다.

이 문서에서 해결하고자 하는 문제는 와일드카드 또는 수식 퍼지 매칭을 사용하여 여러 PDF 파일에서 키워드를 일괄 삭제하는 방법입니다. 여기서는 오피스 소프트웨어 " HeSoft Doc Batch Tool "를 예로 들어, 해당 PDF 도구의 "PDF에서 키워드 찾기 및 바꾸기" 기능을 통해 여러 PDF에서 규칙에 맞는 콘텐츠를 찾아내고 바꿀 내용을 비워 두어 일괄 삭제를 실현합니다. 예시에서 삭제해야 할 것은 PDF 표지 날짜의 영문 월과 네 자리 연도입니다. 예를 들어 "April 13, 2017"에서 "April"과 "2017"을 삭제하여 최종적으로 가운데 "13,"만 남깁니다.

적용 시나리오: 와일드카드 일괄 퍼지 삭제에 적합한 PDF 콘텐츠

와일드카드를 이용한 PDF 키워드 일괄 삭제는 일정한 규칙이 있지만 완전히 고정적이지 않은 텍스트 콘텐츠를 처리하는 데 적합합니다. 완전히 동일한 단어 하나만 삭제하는 것보다, 퍼지 검색은 '내용이 유사하지만 부분적으로 변화하는' 상황에 더 잘 대응합니다. 예를 들어 여러 PDF 중 어떤 날짜는 April 13, 2017이고, 어떤 것은 May 10, 2018일 수 있습니다. 완전한 날짜를 하나씩 입력하려면 많은 규칙을 작성해야 하지만, 수식 퍼지 검색을 사용하면 더 적은 규칙으로 한 부류의 콘텐츠를 매칭할 수 있습니다.

일반적인 적용 시나리오는 다음과 같습니다:

  • PDF에서 April, May 등 영문 월 이름을 일괄 삭제합니다.
  • PDF에서 2017, 2018, 2026 등 네 자리 연도를 일괄 삭제합니다.
  • 문서 내 프로젝트 번호, 보고서 번호, 계약 번호의 일부를 일괄 정리합니다.
  • PDF에 반복적으로 나타나는 민감어, 부서명, 연락처 정보 또는 버전 표시를 일괄 삭제합니다.
  • 스캔 후 텍스트 인식이 가능한 PDF 그룹을 일괄 처리하여 표시할 필요가 없는 텍스트 콘텐츠를 통일적으로 정리합니다.

유의할 점은, 이 문서에서 시연하는 것은 PDF 콘텐츠 내 텍스트 찾기 및 바꾸기입니다. PDF 페이지가 순수 이미지이고 인식 가능한 텍스트 레이어가 없다면, 일반 텍스트 찾기로는 이미지 속 텍스트를 매칭하지 못할 수 있습니다. 이러한 유형의 파일은 처리 전에 PDF가 텍스트 선택 및 복사를 지원하는지 먼저 확인하는 것이 좋습니다.

효과 미리보기: 처리 전 여러 PDF에 삭제해야 할 날짜 키워드 포함

이번 예시에서는 1.pdf, 2.pdf, 3.pdf, 4.pdf라는 이름의 PDF 파일 4개를 준비했습니다. 이들은 동일한 폴더에 위치하며, 소프트웨어에 한 번에 추가하여 일괄 처리해야 합니다. 사무직 종사자에게 이러한 대량 파일은 매우 흔합니다. 예를 들어 동일 배치 보고서, 동일 배치 보관 자료 또는 동일 배치 대외 발행 문서 등이 있습니다.

image-PDF 일괄 키워드 삭제,와일드카드로 PDF 텍스트 삭제,PDF 내용 일괄 검색 및 바꾸기

그중 하나의 PDF를 열어 보면, 표지 날짜 위치에 "April 13, 2017"이 포함되어 있습니다. 스크린샷에서는 처리해야 할 두 종류의 콘텐츠가 빨간색 상자로 표시되어 있습니다. 하나는 영문 월 "April"이고, 다른 하나는 네 자리 연도 "2017"입니다. 이 두 위치가 바로 이후 규칙을 통해 삭제할 대상입니다. 파일마다 April, May 등 다른 월이 존재하거나 다른 연도가 존재할 수 있으므로, 완전한 날짜를 하나씩 입력하는 대신 수식 퍼지 검색을 사용하는 것이 적합합니다.

image-PDF 일괄 키워드 삭제,와일드카드로 PDF 텍스트 삭제,PDF 내용 일괄 검색 및 바꾸기

처리 후 효과: PDF의 월과 연도가 일괄 삭제됨

처리가 완료된 후 PDF를 다시 열어 효과를 확인하면, 원래 "April 13, 2017" 위치가 변경되었음을 알 수 있습니다. 영문 월과 네 자리 연도가 삭제되고 가운데 "13,"만 남았습니다. 이는 퍼지 검색 규칙이 대상 텍스트를 매칭했으며, 바꾸기 키워드 목록이 비어 있기 때문에 소프트웨어가 '일치하는 콘텐츠 삭제' 효과를 실행했음을 의미합니다.

image-PDF 일괄 키워드 삭제,와일드카드로 PDF 텍스트 삭제,PDF 내용 일괄 검색 및 바꾸기

이 처리 방식의 장점은 각 PDF의 모든 페이지를 수동으로 검색할 필요가 없다는 점입니다. 규칙만 올바르게 설정하면 여러 PDF를 동일한 규칙 세트로 일괄 처리할 수 있어, 날짜, 연도, 번호, 키워드를 반복적으로 정리해야 하는 업무 작업에 적합합니다.

조작 단계: HeSoft Doc Batch Tool 를 사용하여 PDF 키워드 일괄 삭제

1단계: PDF 도구로 들어가 PDF에서 키워드 찾기 및 바꾸기 선택

" HeSoft Doc Batch Tool "를 연 후, 왼쪽 도구 분류에서 "PDF 도구"를 선택합니다. PDF 도구 목록에서 "PDF에서 키워드 찾기 및 바꾸기"를 찾습니다. 스크린샷에서 해당 기능의 설명이 "PDF 파일 콘텐츠에서 키워드 일괄 찾기 및 바꾸기"임을 확인할 수 있으며, 이것이 바로 본 문서에서 사용할 핵심 기능입니다.

image-PDF 일괄 키워드 삭제,와일드카드로 PDF 텍스트 삭제,PDF 내용 일괄 검색 및 바꾸기

이 단계의 조작 목적은 PDF 텍스트 찾기 및 바꾸기 전용의 일괄 처리 흐름으로 진입하는 것입니다. 일반 PDF 리더와 달리, 이러한 오피스 소프트웨어의 가치는 파일 일괄 처리에 있습니다. 규칙을 한 번만 설정하면 여러 PDF에 동시에 적용할 수 있어, 반복적인 열기, 검색, 편집 및 저장이라는 수동 작업을 줄여줍니다.

2단계: 처리할 여러 PDF 파일 추가

기능 페이지에 진입하면, 인터페이스 상단에 "파일 추가", "폴더에서 파일 가져오기", "비우기", "더보기" 등의 버튼을 볼 수 있습니다. 소량의 파일인 경우 "파일 추가"를 클릭하여 하나씩 선택할 수 있습니다. 여러 PDF가 모두 동일한 폴더에 있다면 "폴더에서 파일 가져오기"를 사용하는 것이 더 적합하며, 이를 통해 전체 PDF 배치를 한 번에 가져올 수 있습니다.

예시에는 이미 4개의 PDF 파일을 가져왔으며, 목록에는 번호, 이름, 경로, 확장자, 생성 시간, 수정 시간 등의 정보가 표시됩니다. 파일 경로가 각각 D드라이브 test 디렉터리 아래의 1.pdf, 2.pdf, 3.pdf, 4.pdf이고 확장자는 모두 pdf이며, 하단 총계 기록 수는 4임을 확인할 수 있습니다.

image-PDF 일괄 키워드 삭제,와일드카드로 PDF 텍스트 삭제,PDF 내용 일괄 검색 및 바꾸기

이 단계의 예상 결과는 일괄적으로 키워드를 삭제해야 할 모든 PDF가 목록에 나타났는지 확인하는 것입니다. 처리할 필요가 없는 파일이 가져와진 것을 발견하면 목록 오른쪽의 삭제 작업을 통해 제거할 수 있습니다. 파일을 잘못 가져왔다면 "비우기"를 사용한 후 다시 추가할 수도 있습니다. 확인 후 하단의 "다음 단계"를 클릭하여 처리 옵션 설정으로 넘어갑니다.

3단계: 수식 퍼지 검색 텍스트 선택 후 와일드카드 규칙 입력

"처리 옵션 설정"으로 들어가면 먼저 검색 방식을 설정해야 합니다. 스크린샷에서 검색 방식에는 "정확한 텍스트 검색"과 "수식 퍼지 검색 텍스트"가 포함되어 있음을 볼 수 있습니다. 본 문서에서 삭제하려는 것은 완전히 고정된 문자열이 아니라 월, 연도와 같이 규칙적으로 변화하는 콘텐츠이므로, "수식 퍼지 검색 텍스트"를 선택해야 합니다.

image-PDF 일괄 키워드 삭제,와일드카드로 PDF 텍스트 삭제,PDF 내용 일괄 검색 및 바꾸기

"찾을 키워드 목록"에는 예시로 두 가지 규칙이 입력되어 있습니다:

  • April|May: April 또는 May를 매칭하는 데 사용됩니다. 여기서 세로 막대는 "또는"의 관계를 나타내며, 하나의 규칙으로 여러 가능한 월 단어를 매칭하는 데 적합합니다.
  • \d{4}: 2017, 2026 등 네 자리 숫자를 매칭하는 데 사용됩니다. 연도와 같이 고정적으로 네 자리 숫자인 콘텐츠의 경우, 이 규칙이 연도를 하나씩 입력하는 것보다 훨씬 효율적입니다.

오른쪽은 "바꾼 후 키워드 목록"이며, 인터페이스에 "입력하지 않으면 삭제를 의미합니다"라고 안내되어 있습니다. 따라서 목표가 PDF에서 일치하는 콘텐츠를 일괄 삭제하는 것이라면, 오른쪽에 바꿀 텍스트를 입력해서는 안 됩니다. 즉, 왼쪽은 삭제할 콘텐츠를 찾아내는 역할을 하고 오른쪽은 비워 두면, 소프트웨어 처리 시 일치하는 텍스트가 삭제됩니다.

이 단계는 전체 흐름에서 가장 중요한 설정입니다. 규칙이 정확할수록 처리 결과가 예상에 부합합니다. April과 May만 삭제하려는 경우, 너무 광범위한 규칙을 작성하지 않도록 합니다. 연도만 삭제하려는 경우 \d{4}만 입력할 수 있습니다. 여러 범주의 텍스트를 동시에 삭제하려면 예시처럼 여러 규칙을 줄바꿈하여 입력하면 됩니다.

4단계: 다음 단계로 계속 진행하여 저장 위치 설정 및 처리 시작

키워드 규칙을 설정한 후 하단의 "다음 단계"를 클릭합니다. 인터페이스 흐름 상단에는 이후 "저장 위치 설정" 및 "처리 시작" 두 단계가 더 있음을 표시합니다. 소프트웨어 안내에 따라 처리된 파일의 저장 위치를 선택한 후, 처리 시작 단계로 들어가면 됩니다.

특히 와일드카드나 수식 퍼지 규칙을 처음 사용할 때는 원본 파일을 직접 덮어쓰지 않는 것이 좋습니다. 더 안전한 방법은 처리된 PDF를 새 폴더에 저장한 후, 몇 개의 파일을 먼저 무작위로 추출하여 삭제 효과가 올바른지 확인한 다음 원본 파일을 대체할지 결정하는 것입니다. 이렇게 하면 규칙 설정이 충분히 정확하지 않더라도 원본 PDF를 백업으로 보존할 수 있습니다.

처리가 완료되면 출력 폴더의 PDF를 열어 확인합니다. 예시 결과에는 "April"과 "2017"이 삭제되어 규칙이 성공적으로 적용되었음을 보여줍니다. 동일한 유형의 날짜 형식을 포함하는 다른 PDF도 동일한 규칙으로 일괄 처리됩니다.

와일드카드 규칙 설정 제안: 오삭제를 줄이는 방법

수식 퍼지 검색 텍스트를 사용할 때 가장 중요한 것은 매칭 범위를 제어하는 것입니다. \d{4}를 예로 들면, 이는 네 자리 숫자를 매칭합니다. 이는 연도를 삭제하는 데 매우 적합하지만, PDF에 보고서 번호, 페이지 번호, 프로젝트 번호 등 다른 네 자리 숫자가 있을 경우 함께 매칭될 수 있습니다. 따라서 공식적으로 일괄 처리하기 전에 문서의 텍스트 구조를 먼저 평가해야 합니다.

표지 날짜만 처리하고 문서에 네 자리 숫자가 많은 경우, 단독 \d{4} 규칙 사용은 신중해야 합니다. 먼저 소량의 파일로 테스트하여 다른 중요한 정보가 잘못 삭제되지 않는지 확인할 수 있습니다. 월 규칙도 마찬가지로, April|May는 이 두 영문 단어만 매칭합니다. June, July 등 다른 월도 삭제해야 한다면 해당 규칙을 계속 추가해야 합니다.

또한 인터페이스에는 "문자의 대소문자 무시" 옵션이 있습니다. PDF에 April, APRIL, april 등 대소문자 형태가 동시에 나타날 수 있다면, 실제 상황에 따라 체크할 수 있습니다. 대소문자 자체에 구분 의미가 있는 경우에는 임의로 체크하지 않는 것이 좋습니다.

자주 묻는 질문 및 주의사항

1. 바꾼 후 키워드 목록을 왜 비워 두나요?

이번 작업 목표가 다른 텍스트로 바꾸는 것이 아니라 삭제하는 것이기 때문입니다. 인터페이스에 이미 "입력하지 않으면 삭제를 의미합니다"라고 명시되어 있으므로, 오른쪽은 비워 두면 됩니다. 만약 오른쪽에 새 내용을 입력하면, 소프트웨어는 일치하는 키워드를 입력한 내용으로 바꾸게 되며 삭제하지 않습니다.

2. 왜 정확한 검색이 아닌 수식 퍼지 검색을 선택하나요?

정확한 검색은 모든 PDF에 고정적으로 나타나는 "내부 자료"와 같이 완전히 동일한 텍스트를 삭제하는 데 적합합니다. 수식 퍼지 검색은 다른 연도, 다른 월, 다른 번호 등 변화하는 규칙의 텍스트를 처리하는 데 적합합니다. 본 문서의 월과 연도는 모두 변경 가능성이 있으므로 수식 퍼지 검색을 사용하는 것이 더 효율적입니다.

3. 한 번에 수십 개 또는 수백 개의 PDF를 처리할 수 있나요?

기능 설계상 이 도구는 대량 파일 일괄 처리를 지향하며, 여러 PDF를 목록에 추가한 후 통합 처리를 지원합니다. 실제 처리 수량은 컴퓨터 성능, PDF 크기 및 페이지 수를 고려하여 조정하는 것이 좋습니다. 파일이 매우 많은 경우, 결과 확인 및 문제 파악을 용이하게 하기 위해 배치로 나누어 처리할 수 있습니다.

4. 처리 전에 원본 PDF를 백업해야 하나요?

백업을 권장합니다. 특히 \d{4}와 같이 범위가 넓은 규칙을 사용할 경우, 백업은 오삭제 후 복구가 어려운 상황을 방지할 수 있습니다. 처리 결과를 새 폴더에 저장한 후 수동으로 표본 검사하는 것을 더 권장합니다.

요약: 일괄 처리 도구로 반복적인 삭제 작업을 한 번의 설정으로 전환

PDF 키워드 일괄 삭제의 핵심 아이디어는 복잡하지 않습니다. 먼저 여러 PDF를 " HeSoft Doc Batch Tool "에 추가하고, "PDF에서 키워드 찾기 및 바꾸기"로 이동하여 "수식 퍼지 검색 텍스트"를 선택한 후, 왼쪽에 매칭할 와일드카드 또는 수식 규칙을 입력하고 오른쪽 바꾸기 콘텐츠는 비워 둡니다. 마지막으로 저장 위치를 설정하고 처리를 시작합니다.

PDF를 하나씩 열어 수동으로 찾아 삭제하는 것과 비교하여, 일괄 처리는 반복적인 노동을 현저히 줄일 수 있으며, 특히 대량의 보고서, 계약, 보관 파일 및 공개 문서를 처리하는 데 적합합니다. 대량의 PDF를 정식으로 처리하기 전에 먼저 몇 개의 샘플 문서로 규칙을 테스트하여 효과를 확인한 후 일괄 실행하는 것을 권장합니다. 이렇게 하면 효율성을 높이고 오삭제 위험을 줄일 수 있습니다.


키워드PDF 일괄 키워드 삭제 , 와일드카드로 PDF 텍스트 삭제 , PDF 내용 일괄 검색 및 바꾸기
생성 시간2026-06-11 09:45:40

성명: 웹사이트의 모든 이미지, 텍스트 및 비디오 콘텐츠는 참고용이며 최신, 정확, 적절하지 않을 수 있습니다. 이의가 있는 경우 실제 경험 효과를 기준으로 하십시오!

관련 기사

더 많은 기사

원하는 기능이 없나요?

귀하의 필요 사항을 저희에게 피드백해 주시면, 평가 후 무료로 구현하겠습니다!