여러 개의 TXT 텍스트 파일에 숫자, 번호, 통계값 또는 임시 표시가 많이 포함된 경우, 파일을 하나씩 열어 수동으로 삭제하는 것은 시간이 오래 걸릴 뿐만 아니라 삭제 누락이 발생하기 쉽습니다. 이 문서에서는 HeSoft Doc Batch Tool 을 예시로, 와일드카드/정규식을 사용하여 텍스트 내의 숫자 키워드를 일괄 검색하고 대체 내용을 비워두는 방법을 안내합니다. 이를 통해 여러 txt 파일에서 일치하는 내용을 한 번에 삭제할 수 있습니다. 문서에는 처리 전후 비교, 전체 작업 단계 및 주요 주의사항이 포함되어 있으며, 텍스트 일괄 정리, 자료 정돈, 로그 처리 또는 문서 내용 규격화가 필요한 사무 작업 환경에 적합합니다.
일상적인 사무 작업, 자료 정리, 콘텐츠 정제 또는 데이터 아카이빙 과정에서 다음과 같은 문제를 자주 접하게 됩니다. 하나의 폴더 안에 여러 개의 TXT 텍스트 파일이 있고, 각 파일에는 더 이상 보존할 필요 없는 숫자, 일련번호, 통계값, 버전 번호 또는 임시 마크가 포함되어 있습니다. 파일이 한두 개뿐이라면 수동으로 텍스트 편집기를 열어 하나씩 삭제하는 것도 감당할 수 있지만, 파일 수가 수십 개, 수백 개로 늘어나거나 매일 반복 처리해야 한다면 수동으로 찾아서 삭제하는 작업은 매우 비효율적인 반복 노동이 됩니다.
이 글에서 해결하고자 하는 것은 "와일드카드 정규 표현식을 사용하여 여러 텍스트 파일에서 키워드를 일괄 삭제하는 방법" 같은 유형의 문제입니다. 여기서는 스크린샷에 있는 사무용 소프트웨어 " HeSoft Doc Batch Tool "를 예로 들어, 여러 txt 텍스트 파일을 소프트웨어에 한 번에 가져오는 방법을 시연합니다. "텍스트에서 키워드 찾기 및 바꾸기" 기능을 사용하고, 정규 표현식 \d+ 를 활용하여 텍스트 내의 연속된 숫자를 매칭시킵니다. 그리고 바꿀 키워드 목록을 비워둠으로써 숫자 키워드를 일괄 삭제하는 효과를 얻습니다.
이 방법의 핵심 가치는 파일을 하나씩 열 필요 없고, 일일이 검색할 필요 없으며, 찾은 내용을 수동으로 하나하나 삭제할 필요 없다는 데 있습니다. 찾기 규칙만 제대로 설정하면, 소프트웨어가 여러 텍스트 파일을 일괄 처리할 수 있습니다. 이는 특히 사무 문서 정리, 텍스트 데이터 비식별화, 번호 일괄 제거, 로그 내용 정리, 콘텐츠 형식 통일과 같은 시나리오에 적합합니다.
적용 시나리오: 정규 표현식으로 텍스트 키워드를 일괄 삭제하기 적합한 경우
정규 표현식을 사용하여 텍스트 키워드를 일괄 삭제하는 것은 "삭제하려는 내용에 공통된 규칙이 있지만 구체적인 내용은 완전히 동일하지 않은" 시나리오에 적합합니다. 예를 들어 이 글의 예시에서, 텍스트 파일 안에는 많은 숫자가 나타납니다. 어떤 것은 "10", 어떤 것은 "30", 또 "100"이나 "26000" 등도 있습니다. 일반 찾기만 사용한다면 구체적인 숫자를 하나하나 입력해야 하지만, 정규 표현식 \d+를 사용하면 모든 연속된 숫자를 한 번에 매칭할 수 있습니다.
일반적인 적용 시나리오는 다음과 같습니다.
- TXT 파일에서 숫자 일괄 삭제: 예를 들어 기사 속 연도, 통계 수치, 번호, 측정값, 페이지 번호 등을 더 이상 보존할 필요 없이 일괄 삭제해야 할 경우입니다.
- 텍스트 내 동적 키워드 일괄 삭제: 예를 들어 주문 번호, 일련번호, ID, 임시 코드 등 내용 형식은 비슷하지만 각 파일의 구체적인 값이 다른 경우입니다.
- 영문 또는 중문 자료 일괄 처리: 영문 txt, 중문 txt, 혹은 웹페이지, 로그, 시스템에서 추출한 일반 텍스트 내용이든, 텍스트 파일이기만 하면 찾기 및 바꾸기 방식을 이용해 일괄 삭제할 수 있습니다.
- 일괄 비식별화 또는 콘텐츠 표준화: 자료를 공개하기 전에 민감한 번호, 내부 표시, 테스트 데이터 또는 공개하고 싶지 않은 숫자 정보를 삭제해야 할 경우입니다.
- 반복적인 사무 작업 줄이기: 여러 파일에 동일한 찾기 및 삭제 규칙을 적용해야 할 때, 사무용 소프트웨어로 일괄 처리하는 것이 수동 편집보다 더 안정적이고 시간을 절약해 줍니다.
주의할 점은, 이 글의 예시는 주로 TXT 텍스트 파일을 중심으로 전개된다는 것입니다. 만약 업무 흐름에 Word 문서, 예를 들어 doc, docx, 또는 PDF, HTML 등의 형식이 포함된다면, 소프트웨어에서 해당하는 도구 모듈에 따라 적절한 기능을 선택해야 합니다. 스크린샷에서 현재 진입한 것은 "텍스트 도구"이므로, 이 글에서는 텍스트 파일 내용의 일괄 찾기, 바꾸기 및 삭제에 중점을 둡니다.
효과 미리보기: 처리 전 여러 TXT 파일에 삭제해야 할 숫자가 포함됨
처리 전의 파일 목록을 보면, 처리 대상 폴더 안에 big_bang.txt, black_holes.txt, dark_energy.txt, dark_matter.txt, galaxies.txt 등 여러 개의 txt 파일이 있음을 알 수 있습니다. 이 파일들은 모두 같은 그룹의 텍스트 자료입니다. 만약 파일을 하나씩 열어 확인하며 숫자를 삭제한다면 매우 많은 시간이 소요될 것입니다.

이 중 black_holes.txt 파일을 열어보면, 본문에 "10", "30" 등 여러 숫자가 포함되어 있음을 알 수 있습니다. 이 숫자들은 서로 다른 문장 속에 분산되어 있으며, 다른 txt 파일에서도 다른 값으로 나타날 가능성이 있습니다. 이런 경우 정규 표현식을 사용하여 일괄 매칭하는 것이 가장 적합합니다. 우리가 실제로 삭제하려는 것은 특정 고정된 숫자가 아니라 "모든 연속된 숫자"라는 범주의 내용이기 때문입니다.

만약 전통적인 방식을 사용한다면, 각 파일에서 찾기, 위치 확인, 삭제, 저장 등의 작업을 반복적으로 실행해야 합니다. 파일이 많을수록, 삭제 누락이나 실수로 인한 잘못된 삭제, 혹은 저장 잊음과 같은 문제가 발생하기 쉽습니다. HeSoft Doc Batch Tool 를 사용하면, 먼저 처리해야 할 모든 txt 파일을 목록으로 가져온 후, 찾기 규칙과 바꾸기 규칙을 통일적으로 설정하고 마지막으로 일괄 실행할 수 있습니다.
효과 미리보기: 처리 후 숫자 키워드가 일괄 삭제됨
처리가 완료된 후, 동일한 black_holes.txt 파일을 다시 열어 보면 원래 숫자가 있던 자리가 공백으로 바뀌어, 매칭된 숫자 내용이 삭제되었음을 확인할 수 있습니다. 예를 들어 원문의 "about 3 kilometers", "with 10 times", "roughly 30 kilometers" 등의 숫자 위치가 정리되어 다른 텍스트 내용만 남습니다.

결과를 통해 이번 작업이 특정 지정 숫자 하나만 삭제한 것이 아니라, 정규 표현식을 통해 규칙에 맞는 모든 숫자를 통일적으로 삭제했음을 알 수 있습니다. 텍스트 파일에서 키워드를 일괄 삭제하는 데 있어 이 방식은 더 유연합니다. 다음에 이메일 주소, 휴대폰 번호, 괄호 안 내용, 특정 접두사와 접미사 사이의 내용을 삭제해야 한다면, 실제 규칙에 따라 정규 표현식을 조정하면 됩니다.
물론, 일괄 삭제는 파일 내용에 직접적인 영향을 미치므로, 정식 처리 전에 먼저 백업 파일을 준비하거나 처리 결과를 새 위치에 저장하는 것이 좋습니다. 이렇게 하면 정규식 규칙을 정확하게 작성하지 못했더라도 원본 파일로 돌아가 다시 처리할 수 있어, 되돌릴 수 없는 내용 손실을 피할 수 있습니다.
조작 단계: HeSoft Doc Batch Tool 를 사용하여 TXT 내 숫자 일괄 삭제
아래에서는 스크린샷 순서에 따라 전체 조작 과정을 설명합니다. 이 글에서는 텍스트 내 모든 숫자 삭제를 예로 들며, 찾기 표현식으로 \d+를 사용하고 바꿀 내용은 비워둡니다. 실제 필요에 따라 표현식을 다른 와일드카드나 정규식 규칙으로 변경할 수 있습니다.
1단계: 텍스트 도구 진입, "텍스트에서 키워드 찾기 및 바꾸기" 선택
HeSoft Doc Batch Tool 를 연 후, 왼쪽 기능 모음에서 "텍스트 도구"를 선택합니다. 텍스트 도구 페이지에서는 텍스트를 Word로 변환, 텍스트를 PDF로 변환, 텍스트 내 공백 삭제 등 텍스트 파일과 관련된 여러 일괄 처리 기능을 볼 수 있습니다. 이 글에서 사용해야 할 것은 첫 번째 기능인 "텍스트에서 키워드 찾기 및 바꾸기"입니다.

해당 기능에 들어가면 소프트웨어는 단계별 처리 인터페이스로 전환됩니다. 스크린샷에서 "처리할 레코드 선택", "처리 옵션 설정", "저장 위치 설정", "처리 시작" 등의 단계로 나뉘어 있는 것을 볼 수 있습니다. 이러한 흐름 기반 설계는 누락을 줄여줍니다. 먼저 파일을 확인하고, 규칙을 확인한 다음, 마지막에 처리를 실행합니다.
2단계: 파일 추가 또는 폴더에서 TXT 파일 가져오기
기능 페이지에 진입한 후 첫 번째 단계는 처리할 레코드를 선택하는 것입니다. 스크린샷의 오른쪽 상단에는 "파일 추가", "폴더에서 파일 가져오기", "비우기", "더 보기" 등의 작업 진입점이 제공됩니다. 소량의 파일은 "파일 추가"를 사용하고, 하나의 폴더에 모든 txt 파일이 모여 있다면 "폴더에서 파일 가져오기"를 사용하여 폴더 내의 텍스트 파일들을 한 번에 처리 목록에 추가할 수 있습니다.

예시에서, 소프트웨어는 이미 5개의 txt 파일을 가져왔으며, 목록에는 파일 이름, 경로, 확장자, 생성 시간, 수정 시간 등의 정보가 표시됩니다. 파일은 big_bang.txt, black_holes.txt, dark_energy.txt, dark_matter.txt, galaxies.txt 입니다. 이 단계의 예상 결과는 숫자 키워드를 일괄 삭제해야 하는 모든 텍스트 파일이 목록에 나타나고 레코드 수가 정확한 것입니다.
여기서 "다음"을 클릭하기 전에 두 가지를 확인하는 것이 좋습니다. 첫째, 처리할 필요 없는 파일이 목록에 추가되지 않았는지 확인합니다. 둘째, 파일 확장자가 예상과 일치하는지 확인합니다. 예를 들어 본 예시에서는 모두 txt입니다. 목록에 처리하고 싶지 않은 파일이 있다면, 작업 열의 삭제 아이콘을 통해 제거할 수 있습니다. 확인이 끝나면 화면 하단의 "다음"을 클릭하여 처리 옵션 설정으로 넘어갑니다.
3단계: 수식을 사용하여 텍스트 퍼지 검색 선택
두 번째 단계는 키워드 옵션을 설정하는 것입니다. 스크린샷에서 "찾기 방식"은 "정확한 텍스트 찾기"와 "수식을 사용하여 퍼지 텍스트 찾기" 두 가지 옵션을 제공합니다. 이 글에서 삭제하려는 것은 특정 고정된 숫자가 아니라 모든 숫자이므로 "수식을 사용하여 퍼지 텍스트 찾기"를 선택해야 합니다.

이 옵션은 와일드카드나 정규 표현식을 사용하여 매칭하는 것을 의미하는 것으로 이해할 수 있습니다. 일반적인 정확한 찾기는 완전히 일치하는 단어를 찾는 데 적합합니다. 예를 들어 모든 파일의 "black hole"을 다른 고정된 구문으로 바꾸는 경우입니다. 반면 수식 퍼지 찾기는 숫자, 날짜, 번호, 이메일 등 규칙성을 가진 내용을 처리하는 데 더 적합합니다.
스크린샷에는 "문자의 대소문자 무시" 추가 옵션도 보입니다. 이 글의 숫자 삭제 시나리오에서는 대소문자가 중요하지 않으므로 선택하지 않아도 됩니다. 만약 "Word", "word", "WORD"를 동시에 매칭시키는 등 영문 키워드를 처리해야 한다면, 실제 필요에 따라 이 옵션을 활성화할지 고려할 수 있습니다.
4단계: 찾을 키워드 목록에 정규 표현식 \d+ 입력
"찾을 키워드 목록"에 \d+를 입력합니다. 이는 일반적인 정규 표현식 작성법으로, \d는 숫자 문자를, +는 하나 이상 연속되는 숫자를 매칭시킵니다. 따라서 \d+는 "3", "10", "30", "100", "26000" 등 길이가 다른 숫자를 매칭할 수 있습니다.
이 단계는 매우 중요합니다. 일괄 삭제의 정확성이 찾기 규칙의 정확성에 달려 있기 때문입니다. 만약 "10"과 같은 특정 고정 숫자만 입력하면, 소프트웨어는 텍스트 내의 "10"만 처리합니다. 그러나 \d+를 입력하면 모든 연속 숫자가 매칭 대상이 됩니다. 텍스트 파일에서 숫자 키워드를 일괄 삭제하려는 경우, 이 규칙이 더 적합합니다.
만약 목표가 숫자 삭제가 아닌 다른 유형의 내용 삭제라면, 대응하는 규칙으로 교체할 수 있습니다. 예를 들어 고정된 단어를 삭제하려면 해당 단어를 입력합니다. 특정 형식의 번호를 삭제하려면 번호 구조에 따라 표현식을 작성해야 합니다. 이 글에서는 복잡한 정규식 작성법까지는 다루지 않으며, 소프트웨어 인터페이스를 통해 일괄 삭제를 완료하는 기본 개념을 설명하는 데 중점을 둡니다.
5단계: 바꿀 키워드 목록을 비워서 삭제 효과 구현
스크린샷 오른쪽은 "바꿀 키워드 목록"이며, 인터페이스에는 "입력하지 않으면 삭제를 의미합니다"라고 안내되어 있습니다. 따라서 매칭된 숫자를 삭제하는 것이 목표라면, 오른쪽에 아무 내용도 입력하지 말고 빈 상태로 유지해야 합니다.
이 단계의 논리는 다음과 같습니다. 왼쪽은 "무엇을 찾을지"를 정의하고, 오른쪽은 "무엇으로 바꿀지"를 정의합니다. 오른쪽이 비어 있으면, 소프트웨어는 왼쪽에서 매칭된 내용을 빈 문자열로 바꾸는데, 이는 곧 삭제입니다. 이렇게 하면 TXT 파일에서 숫자 키워드를 일괄 삭제하는 작업을 완료할 수 있습니다.
설정을 완료한 후 "다음"을 계속 클릭합니다. 인터페이스 흐름에 따라, 이후 저장 위치 설정과 처리 시작 단계로 넘어갑니다. 현재 스크린샷에는 후속 페이지 세부 정보가 나와 있지 않지만, 상단의 단계 표시줄을 통해 소프트웨어가 사용자에게 처리 결과 저장 방식을 확인하도록 요청한 후 일괄 처리를 실행할 것이라고 합리적으로 판단할 수 있습니다.
6단계: 저장 위치 설정 및 처리 시작
찾기 및 바꾸기 규칙 설정을 완료한 후 "저장 위치 설정" 단계로 진입합니다. 데이터 안전을 위해, 처리된 파일을 원본 파일에 직접 덮어쓰기보다는 새 폴더에 저장하는 것을 우선적으로 권장합니다. 특히 정규 표현식을 사용하여 일괄 삭제할 때, 표현식 범위를 너무 넓게 설정하면 예상보다 많은 내용이 삭제될 수 있습니다. 새 위치에 저장하면 원본 파일이 보존되어 대조 및 롤백이 용이합니다.
저장 위치를 확인한 후 "처리 시작" 단계로 진입합니다. 실행이 완료되면 처리된 파일을 열어 샘플 검사를 할 수 있습니다. 최소한 하나의 대표적인 내용이 담긴 파일(예: 본문의 black_holes.txt)을 확인하여 숫자가 예상대로 삭제되었는지, 다른 텍스트는 그대로 유지되었는지 점검하는 것이 좋습니다. 결과가 예상과 일치한다면, 처리된 파일을 후속 게시, 아카이빙 또는 분석에 사용합니다.
자주 묻는 질문 및 주의사항
1. \d+는 어떤 내용을 삭제하나요?
\d+는 일반적으로 연속된 숫자를 매칭하는 데 사용됩니다. 즉, 숫자가 한 자리, 두 자리 또는 여러 자리이든 연속적으로 나타나기만 하면 매칭되어 삭제됩니다. 예를 들어 "10", "30", "100", "26000"은 모두 매칭 범위에 속합니다. 처리 후에는 해당 숫자 위치가 공백이 됩니다.
2. 숫자를 삭제한 후 왜 공백이 남나요?
처리 후 효과 이미지에서 볼 수 있듯이, 숫자가 삭제된 후 원래 숫자 위치에 공백이 남을 수 있습니다. 이는 소프트웨어가 매칭된 숫자 자체만 삭제하고, 숫자 앞뒤의 공백, 구두점 또는 기타 텍스트는 그대로 유지하기 때문입니다. 불필요한 공백을 추가로 정리하려면 소프트웨어 내 다른 텍스트 처리 기능을 함께 사용하거나, 정규식 규칙에서 실제 상황에 따라 인접 공백도 매칭 범위에 포함시킬 수 있습니다. 단, 규칙의 영향 범위가 확실하지 않을 때는 처음부터 너무 공격적으로 작성하지 않는 것이 좋습니다.
3. 모든 숫자가 아닌 특정 숫자만 삭제할 수 있나요?
가능합니다. 고정된 키워드만 삭제하려면 정확한 텍스트 찾기를 사용하여 구체적인 내용을 입력하면 됩니다. 특정 형식의 숫자만 삭제하려면 정규 표현식을 조정해야 합니다. 예를 들어 세 자리 숫자만 삭제하거나 특정 접두사 뒤의 숫자만 삭제하는 것은 더 세분화된 규칙 설계에 속합니다. 이 글의 예시 목표는 연속된 모든 숫자를 일괄 삭제하는 것이므로 \d+를 사용합니다.
4. 일괄 처리 전에 백업이 필요한가요?
백업을 권장합니다. 일괄 처리는 파일 처리 효율이 높지만, 한 번의 설정이 여러 파일에 영향을 미칠 수 있다는 의미이기도 합니다. 특히 정규 표현식을 사용할 때 규칙을 잘못 작성하면 잘못된 삭제로 이어질 수 있습니다. 따라서 정식 처리 전에 원본 폴더 복사본을 만들어 두거나, 소프트웨어에서 저장 위치를 설정할 때 새 출력 디렉터리를 선택하는 것이 좋습니다.
5. 이 방법은 Word 문서(doc, docx)에 적합한가요?
이 글의 스크린샷은 텍스트 도구의 TXT 일괄 찾기 및 바꾸기 시나리오를 보여주며, txt와 같은 일반 텍스트 파일 처리에 적합합니다. Word 문서(예: doc, docx)를 처리하려면 소프트웨어 내 Word 관련 도구 모듈로 이동하여 해당 기능을 따라야 합니다. 파일 형식마다 콘텐츠 구조가 다르므로 TXT 처리 과정을 Word 처리 과정과 동일하게 간주해서는 안 됩니다.
총정리: 일괄 처리 도구로 반복적인 삭제 작업을 일회성 설정으로 전환
여러 텍스트 파일에서 키워드를 일괄 삭제하는 것은, 본질적으로 반복 작업인 수동 편집 동작을 사무용 소프트웨어에 맡기는 것입니다. HeSoft Doc Batch Tool 의 "텍스트에서 키워드 찾기 및 바꾸기" 기능을 통해, 먼저 여러 개의 txt 파일을 가져온 후 "수식을 사용하여 퍼지 텍스트 찾기"를 선택하고, \d+를 입력하여 모든 숫자를 매칭시킨 뒤, 바꿀 내용을 비워둠으로써 숫자 키워드를 일괄 삭제할 수 있습니다.
파일을 하나씩 열어 수동으로 삭제하는 것과 비교하면, 이 방식은 파일 수가 많고 규칙이 명확하며 반복 처리가 필요한 사무 현장에 더 적합합니다. 시간을 절약할 뿐만 아니라 삭제 누락이나 작업 불일치의 위험도 줄여줍니다. 실제 사용 시에는 먼저 테스트 파일이나 백업 파일을 준비하여 정규 표현식의 효과가 올바른지 확인한 후, 전체 텍스트 파일 그룹에 대해 처리를 실행하는 것을 권장합니다. 이렇게 하면 일괄 처리의 효율성이라는 장점을 살리면서도 파일 내용의 안전성을 통제할 수 있습니다.