여러 Word, docx 또는 doc 문서에 유사하지만 완전히 동일하지 않은 내용이 있는 경우, 파일을 하나씩 열어서 찾아 삭제하는 것은 매우 시간이 많이 소요됩니다. 본 문서에서는 영문 대문자 약어와 숫자를 일괄 삭제하는 것을 예시로, HeSoft Doc Batch Tool 의 "Word에서 키워드 찾기 및 바꾸기" 기능을 사용하여 정규 표현식으로 퍼지 매칭을 구현하고, 바꿀 내용을 비워 두어 일괄 삭제하는 방법을 소개합니다. 이는 템플릿, 자료, 계약서 및 강의 문서에서 중복된 식별자를 정리하는 데 적합합니다.
일상 업무에서는 한 폴더 안에 여러 Word 문서가 있고, 각 문서마다 유사한 번호, 영문 약어, 강좌 코드, 부서 약칭, 주석 표시 또는 템플릿 잔여 내용이 포함된 경우를 자주 접하게 됩니다. 이러한 내용이 완전히 동일하지는 않아 단순히 고정된 단어 하나로 찾아 삭제하기는 어렵습니다. 예를 들어 스크린샷 속 여러 docx 파일의 본문에는 BOT, ELA와 같은 세 글자 대문자 영문 약어뿐 아니라 60과 같은 숫자도 포함되어 있습니다. 파일을 하나씩 열어서 수동으로 검색, 삭제, 저장하면 시간이 많이 걸릴 뿐 아니라 삭제가 누락되기 쉽습니다.
이러한 문제는 일괄 처리 도구로 해결하는 것이 더 적합합니다. HeSoft Doc Batch Tool 은(는) 사무 환경을 위한 문서 일괄 처리 소프트웨어로, 핵심 가치는 반복 작업을 줄여 원래 수동으로 문서별로 처리해야 했던 Word, docx, doc 파일을 한 번에 가져와 규칙에 따라 통일되게 처리하는 것입니다. 본문에서는 스크린샷과 함께 'Word에서 키워드 찾기 및 바꾸기' 기능을 사용하여 정규 표현식으로 여러 Word 문서의 키워드를 일괄적으로 퍼지 삭제하는 방법을 시연합니다.
적용 시나리오: 정규 표현식으로 Word 키워드를 일괄 삭제해야 하는 경우
일반적인 찾기 및 바꾸기는 고정된 텍스트를 삭제하는 데 적합합니다. 예를 들어 모든 문서에서 "기밀"을 빈 값으로 바꾸는 것과 같습니다. 그러나 삭제하려는 대상이 하나의 고정된 단어가 아닌 한 종류의 내용이라면 정규 표현식을 사용해야 합니다. 정규 표현식은 패턴으로 텍스트를 일치시키므로 "형식은 같지만 구체적인 내용은 다른" 내용을 처리하는 데 특히 적합합니다.
예를 들어, 다음과 같은 시나리오에서 본문의 방법을 고려해 볼 수 있습니다:
- 여러 Word 문서에서 BOT, ELA, ABC 등과 같은 세 글자 대문자 영문 약어를 일괄 삭제합니다.
- docx 문서에서 숫자 번호, 강의 시간, 버전 번호 또는 임시 표시를 일괄 삭제합니다.
- 시스템에서 내보낸 Word 파일을 정리하여 템플릿의 코드, 약어, 플레이스홀더를 통일되게 제거합니다.
- 많은 계약서, 제안서, 보고서, 강의 자료를 처리할 때 공개할 필요가 없는 번호나 식별자를 삭제합니다.
- 여러 doc, docx 파일을 통일되게 정리하여 수동으로 파일별로 찾아서 발생하는 누락을 방지합니다.
본문 예제에서 사용된 규칙은 [A-Z]{3}과 \d+입니다. 여기서 [A-Z]{3}은 연속된 3개의 대문자 영문자를 일치시키는 것으로 이해할 수 있고, \d+는 연속된 하나 이상의 숫자를 일치시키는 것으로 이해할 수 있습니다. 이렇게 일치된 내용을 빈 값으로 바꾸면 일괄 삭제 목적을 달성할 수 있습니다.
효과 미리보기: 처리 전 여러 Word 문서에 삭제할 내용이 존재함
처리 전 파일 스크린샷에서 볼 수 있듯이, 현재 폴더에는 1.docx, 2.docx, 3.docx, 4.docx, 5.docx, 6.docx 등 여러 Word 문서가 있습니다. 이들 모두 동일한 정리 규칙을 실행해야 하므로, 하나씩 열어 처리하면 반복 작업이 매우 두드러집니다.

Word 문서 중 하나를 열면 본문에 삭제해야 할 내용이 있는 것을 볼 수 있습니다. 제목 위치에는 BOT와 같은 세 글자 대문자 약어가 나타나고, 본문에는 ELA, 60 등의 내용이 있습니다. 스크린샷의 빨간색 화살표는 이러한 처리해야 할 주요 위치를 가리킵니다.

이러한 내용의 특징은 일부는 대문자 영문 약어이고 일부는 숫자라는 점입니다. 서로 다른 문서에서 완전히 동일하지는 않을 수 있지만, 형식 규칙은 비교적 일관됩니다. 따라서 특정 단어 하나만 정확하게 찾는 것은 효율성이 낮습니다. 정규 표현식을 사용하여 퍼지 검색을 한 후 바꿀 내용을 비워 두어야 동일한 유형의 텍스트를 한 번에 처리할 수 있습니다.
효과 미리보기: 처리 후 키워드가 일괄 삭제됨
처리가 완료된 후 Word 문서를 열어 보면, 원래 제목에 있던 BOT가 삭제되었고 본문의 ELA, 60 등 일치된 내용도 제거된 것을 볼 수 있습니다. 문서의 주된 내용은 그대로 유지되며, 규칙에 부합하는 키워드만 정리되었습니다.

효과 측면에서 보면, 이는 단순히 특정 고정 단어 하나를 삭제하는 것이 아니라 규칙에 따라 한 유형의 텍스트를 삭제하는 것입니다. 예를 들어 세 글자 대문자가 식별되어 제거되고, 숫자 내용도 식별되어 제거됩니다. Word, docx 문서를 일괄 정리하는 데 있어 이 방식은 수동으로 파일별로 처리하는 것보다 더 안정적이며 대량의 파일을 처리할 때 더욱 적합합니다.
작업 단계 1: Word 도구로 들어가서 찾기 및 바꾸기 기능 선택하기
HeSoft Doc Batch Tool 을(를) 연 후, 왼쪽 도구 분류에서 "Word 도구"를 선택합니다. 오른쪽 기능 목록에서 "Word에서 키워드 찾기 및 바꾸기"를 찾습니다. 이 기능은 Word 파일 내용의 키워드를 일괄적으로 찾아 바꾸는 데 사용되며, 바꿀 내용을 비워 두어 삭제하는 데에도 사용할 수 있습니다.

이 기능을 선택하는 목적은 여러 Word 문서의 내용 처리를 파일별로 열지 않고 하나의 작업으로 집중시키기 위함입니다. 파일 수가 많은 경우, 이 단계는 반복적인 클릭, 복사 붙여넣기 및 저장 작업을 눈에 띄게 줄일 수 있습니다.
본 예제에서는 여러 docx 파일의 영문 약어 및 숫자 내용을 처리해야 하므로, "Word에서 키워드 찾기 및 바꾸기" 기능으로 진입한 후 처리할 파일 가져오기를 시작할 수 있습니다.
작업 단계 2: 처리해야 할 Word, docx 파일 추가하기
기능 페이지에 들어가면 소프트웨어는 처리 마법사를 표시합니다. 첫 번째 단계는 "처리할 레코드 선택"입니다. 페이지 오른쪽 상단에서 "파일 추가" 및 "폴더에서 파일 가져오기" 버튼을 볼 수 있습니다. 파일 수가 적으면 "파일 추가"를 클릭하여 수동으로 선택하고, 같은 폴더에 많은 Word 문서가 있으면 "폴더에서 파일 가져오기"를 사용하는 것이 더 편리합니다.

스크린샷에는 6개의 docx 파일이 이미 가져와져 있으며, 목록에는 일련번호, 이름, 경로, 확장자, 생성 시간, 수정 시간 등의 정보가 표시됩니다. 이 목록을 통해 1.docx부터 6.docx까지 처리할 파일이 모두 작업에 추가되었는지 확인할 수 있습니다.
이 단계의 예상 결과는: 일괄적으로 키워드를 삭제해야 하는 모든 Word 문서가 목록에 나타나는 것입니다. 처리할 필요가 없는 파일을 가져온 경우 목록의 작업 열을 통해 제거할 수 있으며, 파일이 불완전하면 계속 추가하거나 폴더에서 가져옵니다. 확인이 완료되면 하단의 "다음"을 클릭하여 처리 규칙 설정으로 이동합니다.
작업 단계 3: 수식을 사용하여 텍스트 퍼지 검색 선택하기
"처리 옵션 설정" 페이지로 이동한 후, 먼저 검색 방식을 설정해야 합니다. 스크린샷에서 볼 수 있듯이, 검색 방식에는 "텍스트 정확히 찾기"와 "수식을 사용하여 텍스트 퍼지 검색"이 있습니다. 본 예제에서는 정규 표현식을 사용하여 한 유형의 내용을 삭제해야 하므로 "수식을 사용하여 텍스트 퍼지 검색"을 선택해야 합니다.

"수식을 사용하여 텍스트 퍼지 검색"을 선택하는 목적은 소프트웨어가 고정된 문자열만 일치시키는 것이 아니라 규칙에 따라 내용을 일치시키도록 하는 것입니다. 예를 들어 문서에 BOT, ELA, ABC, XYZ 등 서로 다른 약어가 나타날 수 있는데, 일일이 입력하면 매우 번거롭지만 [A-Z]{3}을 사용하면 연속된 세 개의 대문자 영문자를 일치시켜 퍼지 삭제를 실현할 수 있습니다.
스크린샷의 왼쪽 "찾을 키워드 목록"에는 이미 두 개의 규칙이 입력되어 있습니다:
- [A-Z]{3}: 연속된 3개의 대문자 영문자를 일치시키는 데 사용됩니다.
- \d+: 연속된 하나 이상의 숫자를 일치시키는 데 사용됩니다.
이 두 가지 규칙은 이번 일괄 삭제의 핵심입니다. 소프트웨어는 가져온 여러 Word 문서에서 이러한 규칙에 부합하는 내용을 찾아 오른쪽의 바꾸기 목록에 따라 바꾸기를 실행합니다.
작업 단계 4: 바꿀 내용을 비워 두어 일괄 삭제 구현하기
동일한 설정 페이지 오른쪽에서 "바꾼 후의 키워드 목록"을 볼 수 있습니다. 스크린샷에는 "입력하지 않으면 삭제를 의미합니다"라고 안내되어 있습니다. 이는 어떤 검색 규칙에 해당하는 바꿀 내용이 비어 있으면, 소프트웨어가 일치된 내용을 새 텍스트로 바꾸는 것이 아니라 삭제한다는 것을 의미합니다.
따라서 본 예제에서 [A-Z]{3}과 \d+에 일치된 내용을 삭제하려면 오른쪽에 바꿀 텍스트를 입력할 필요가 없습니다. 비워 두기만 하면 됩니다. 이렇게 처리하면 문서의 세 글자 대문자 영문 약어와 연속된 숫자가 제거됩니다.
주의할 점은, 정규 표현식의 일치 범위는 규칙 자체에 따라 달라진다는 것입니다. [A-Z]{3}은 연속된 세 개의 대문자를 일치시키므로 문서에 다른 세 글자 대문자 약어가 있으면 함께 삭제될 수 있으며, \d+는 연속된 숫자를 일치시키므로 본문에 삭제하고 싶지 않은 숫자가 있으면 규칙을 미리 조정해야 합니다. 일괄 처리 전에 먼저 소수의 파일로 효과를 테스트한 후에 전체 파일을 처리하는 것이 좋습니다.
작업 단계 5: 저장 위치 설정 및 처리 시작하기
검색 규칙과 바꿀 내용 설정을 완료한 후 "다음"을 클릭합니다. 페이지 마법사에 따라 이후 단계는 "저장 위치 설정"과 "처리 시작"으로 진행됩니다. 마법사 흐름에서 볼 수 있듯이, 소프트웨어는 사용자가 출력 위치를 먼저 확인한 후 일괄 처리 작업을 실행하도록 합니다.
이 단계의 운영 목적은 원본 파일을 직접 덮어써서 복구할 수 없게 되는 것을 피하기 위함입니다. 실제 사무 환경에서는 처리된 파일을 별도의 출력 폴더에 저장하거나, 처리 전에 원본 Word 문서를 백업하는 것이 좋습니다. 이렇게 하면 정규 표현식 규칙이 너무 광범위하게 설정되어도 원본 파일로 되돌아가 다시 조정할 수 있습니다.
처리 시작을 클릭하면 소프트웨어는 앞서 가져온 파일 목록에 따라 Word 문서를 하나씩 처리합니다. 수동 작업과 비교할 때, 일괄 처리의 장점은 규칙이 통일되고, 속도가 더 빠르며, 결과 재검토가 더 쉽다는 점입니다. 수십 개, 수백 개의 docx 파일의 경우 효율성 향상이 더욱 두드러집니다.
자주 묻는 질문 및 주의 사항
1. 왜 "수식을 사용하여 텍스트 퍼지 검색"을 선택해야 하나요?
본문에서 삭제하려는 것은 하나의 고정된 키워드가 아니라 규칙에 맞는 한 종류의 내용이기 때문입니다. 예를 들어 BOT와 ELA는 구체적인 문자가 다르지만 모두 세 글자 대문자 약어에 속하므로 [A-Z]{3}을 사용하여 통일되게 일치시킬 수 있습니다.
2. 바꿀 내용을 비워 두는 것과 공백을 입력하는 것이 같나요?
다릅니다. 스크린샷에 "입력하지 않으면 삭제를 의미합니다"라고 안내되어 있습니다. 즉, 오른쪽 바꾸기 목록에 내용을 입력하지 않으면 일치된 텍스트가 삭제됩니다. 공백을 입력하면 일반적으로 텍스트가 공백으로 대체되어 문서에 불필요한 공백이 남을 수 있습니다.
3. [A-Z]{3}이 다른 내용을 실수로 삭제할 수 있나요?
가능성은 있습니다. 연속된 세 개의 대문자 영문자를 일치시키므로, 이러한 유형의 약어가 모두 삭제되어야 하는 경우에만 적합합니다. 특정 범위의 약어만 삭제하려면 규칙을 더 좁히거나 샘플 문서로 먼저 테스트해야 합니다.
4. \d+가 모든 숫자를 삭제하나요?
\d+는 연속된 숫자를 일치시키는 데 사용됩니다. 본문에 일반적으로 입력된 숫자는 대개 일치됩니다. 문서에 날짜, 번호, 금액, 페이지 번호 또는 기타 보존해야 할 숫자가 있다면 신중하게 사용해야 하며, 많은 내용을 한 번에 삭제하지 않도록 주의해야 합니다.
5. doc과 docx 모두 이렇게 처리할 수 있나요?
스크린샷 예제에서는 docx 파일을 처리했습니다. Word 문서 일괄 찾기 및 바꾸기 시나리오에서는 일반적으로 docx, doc 등의 형식이 필요합니다. 실제 작업 시에는 소프트웨어 가져오기 목록에서 인식하고 처리할 수 있는 파일을 기준으로 해야 합니다.
요약: 사무용 소프트웨어로 Word를 일괄 처리하여 반복적인 삭제 작업 줄이기
여러 Word 문서에서 퍼지 키워드를 일괄 삭제하는 핵심은 두 가지입니다. 첫째, 일괄 처리를 지원하는 사무용 소프트웨어를 사용하여 파일을 통일되게 가져옵니다. 둘째, 정규 표현식을 사용하여 삭제할 텍스트의 규칙을 기술합니다. 본문 예제에서는 HeSoft Doc Batch Tool 의 "Word에서 키워드 찾기 및 바꾸기" 기능을 통해 "수식을 사용하여 텍스트 퍼지 검색"을 선택하고, [A-Z]{3}과 \d+를 입력한 후 바꿀 내용을 비워 두어 세 글자 대문자 약어와 숫자 내용을 일괄 삭제할 수 있었습니다.
만약 현재 대량의 docx, doc 또는 Word 문서를 처리하고 있다면, 계속해서 파일별로 열어 수동으로 삭제하는 것은 권장하지 않습니다. 더 효율적인 방법은 먼저 처리할 파일을 정리하고 원본 문서를 백업한 후, 일괄 찾기 및 바꾸기 기능을 사용하여 규칙을 설정하고 통일되게 실행하는 것입니다. 이렇게 하면 반복적인 노동을 줄일 수 있을 뿐만 아니라 문서 정리 과정을 더욱 통제 가능하게 만들 수 있습니다.