여러 텍스트 파일에서 특정 패턴에 맞는 모든 줄을 삭제해야 할 때 수동 편집은 매우 비효율적입니다. 이 문서에서는 Annex A, Annex B 등의 부록 줄을 삭제하는 예를 들어, HeSoft Doc Batch Tool 에서 여러 txt 파일을 가져오고, 전체 줄 찾기 및 바꾸기 기능을 선택하고, Annex [A-Z]를 와일드카드 정규식 일치 규칙으로 사용하고, 바꾸기 목록을 비워 두어 일괄 삭제를 완료하는 방법을 설명하여, 사용자가 대량의 텍스트 자료를 빠르게 정리할 수 있도록 도와줍니다.
많은 사무 자료가 변환, 내보내기 또는 집계된 후에 대량의 TXT 텍스트 파일이 생성됩니다. 이러한 파일에는 부록 설명, 목차 안내, 시스템 표시, 반복되는 헤더 또는 로그 태그와 같이 불필요한 행이 종종 섞여 있습니다. 개별 파일 처리는 어렵지 않지만, 하나의 폴더에 있는 여러 텍스트 파일을 하나씩 열고, 찾고, 삭제하고, 저장하는 것은 전형적인 비효율적 반복 작업이 됩니다.
이 글에서 소개할 방법은 와일드카드 정규 표현식을 사용하여 여러 텍스트 파일에서 일치하는 모든 행을 일괄 삭제하는 것입니다. 예시에서 삭제할 내용은 Annex A, Annex B, Annex C, Annex D와 같은 부록 행입니다. 이들의 공통점은 Annex로 시작하고 뒤에 대문자가 따라온다는 것입니다. 따라서 Annex [A-Z]로 이러한 텍스트 유형을 일반화하여 사무용 소프트웨어가 자동으로 일괄 처리하도록 할 수 있습니다.
본문에서 사용된 도구는 스크린샷에 표시된 " HeSoft Doc Batch Tool "입니다. 사무 환경을 위한 문서 일괄 처리 소프트웨어로, 반복적인 파일 처리 작업을 한곳에 모아 완료하는 데 적합합니다. 아래에서는 실제 스크린샷 순서대로 원본 파일 확인부터 일괄 삭제 완료까지의 전체 과정을 설명합니다.
적용 시나리오: "규칙성 있는 한 줄 전체"를 삭제해야 할 때
텍스트 처리에서 몇 개의 고정된 문자를 삭제하는 것과 한 줄 전체를 삭제하는 것은 다른 요구사항입니다. 예를 들어 어떤 행의 내용이 "Annex A Food and drink standards - revised 2020"이라면, "Annex A"만 삭제할 경우 뒤의 설명 텍스트가 파일에 남아 내용이 불완전해질 수 있습니다. 진정 필요한 것은 Annex A를 포함한 줄 전체를 삭제하는 것입니다.
HeSoft Doc Batch Tool 의 "키워드 기반 텍스트 파일 완전한 행 찾기 및 바꾸기" 기능은 바로 이러한 요구에 맞춰져 있습니다. 키워드 또는 표현식을 기반으로 대상 행을 찾은 다음, 해당 행 전체를 바꾸거나 삭제할 수 있습니다.
본문의 방법을 사용하기에 적합한 파일 유형 및 업무 시나리오는 다음과 같습니다:
- 여러 .txt 파일에서 부록 행, 목차 행, 설명 행 일괄 정리;
- 로그 파일에서 특정 키워드를 포함하는 모든 기록 행 삭제;
- 시스템에서 내보낸 텍스트 데이터를 정리하여 반복적인 헤더나 주석 제거;
- 대량의 텍스트 목록을 처리하여 고정된 접두사 또는 번호 규칙이 있는 행 삭제;
- 코드를 작성하거나 스크립트를 실행하지 않고 일괄 텍스트 정리 완료.
파일이 docx, doc와 같은 Word 문서이거나 PDF, Excel 표인 경우, 소프트웨어에서 해당 유형의 도구를 찾아야 합니다. 본문 스크린샷은 텍스트 도구의 TXT 파일 처리 과정을 보여주므로, 텍스트 파일의 행 일괄 삭제에 중점을 둡니다.
처리 전 상태: 여러 TXT 파일의 일괄 정리 대기
먼저 처리 전 파일 상태를 확인합니다. 스크린샷에는 동일한 폴더 내에 1.txt, 2.txt, 3.txt, 4.txt, 5.txt라는 이름의 텍스트 파일 5개가 있습니다. 이들은 모두 일괄 처리 대상입니다.

텍스트 파일 중 하나를 열어보면 파일 내용에 Annex 행 그룹이 존재하는 것을 볼 수 있습니다. 빨간색 상자로 표시된 Annex A, Annex B, Annex C, Annex D가 본문에서 삭제할 내용입니다. 이 행들 뒤에는 각기 다른 설명이 붙어 있어, 완전히 동일한 고정 텍스트가 아님을 알 수 있습니다.

각 행 뒤의 설명이 다르기 때문에 "키워드를 포함하는 완전한 행" 처리 방식이 더 적합합니다. Annex와 문자라는 규칙 부분만 일치시키면 소프트웨어가 줄 전체를 삭제하므로, 모든 전체 행을 찾기 목록에 완전하게 입력할 필요가 없습니다.
처리 후 효과: 모든 Annex 규칙 일치 행이 사라짐
처리가 완료되면 결과 스크린샷에서 Annex A부터 Annex D까지의 행이 삭제된 것을 확인할 수 있습니다. 파일은 상단의 "Annexes" 제목을 유지하고 있으며, 후속 Contents 목차 및 번호 항목도 유지하여 처리 목표가 비교적 정확했으며 관련 없는 내용까지 함께 삭제하지 않았음을 보여줍니다.

이러한 일괄 처리의 장점은 결과의 일관성에 있습니다. 여러 파일에 동일한 규칙의 Annex 행이 존재하는 한, 소프트웨어는 동일한 규칙으로 가져온 모든 파일을 처리하므로 사람이 개별적으로 판단할 필요가 없습니다. 대량의 텍스트 자료 정리에 있어 이는 반복 작업 시간을 현저히 줄여줍니다.
작업 단계: HeSoft Doc Batch Tool 으로 일괄 삭제 완료하기
1단계: 텍스트 도구 기능 영역 열기
HeSoft Doc Batch Tool 을 열면 왼쪽 탐색 모음에서 Word 도구, Excel 도구, PowerPoint 도구, PDF 도구, 텍스트 도구 등 다양한 유형의 사무 파일 처리 입구를 제공합니다. 예시 파일의 확장자가 txt이므로 "텍스트 도구"로 들어갑니다.
텍스트 도구 목록에서 "키워드 기반 텍스트 파일 완전한 행 찾기 및 바꾸기"를 찾아 선택합니다. 스크린샷에서 이 기능은 두 번째 항목에 있으며, 텍스트 파일에서 특정 키워드를 포함하는 줄 전체를 일괄 삭제하거나 새 텍스트로 바꿀 수 있다는 안내가 있습니다.

해당 기능을 선택하면 마법사 스타일 처리 과정으로 들어갑니다. 마법사 과정은 사용자가 순서대로 파일 가져오기, 규칙 설정, 저장 위치 설정, 처리 시작을 완료하도록 도와주므로 스크립트 작성을 원하지 않는 사무 사용자에게 적합합니다.
2단계: 여러 텍스트 파일 추가 또는 가져오기
"처리할 레코드 선택" 단계에서 처리할 모든 txt 파일을 목록에 추가해야 합니다. 인터페이스 오른쪽 상단에는 "파일 추가", "폴더에서 파일 가져오기", "비우기", "더 보기" 등의 작업 입구가 있습니다. 예시에서는 1.txt부터 5.txt까지 다섯 개의 파일을 이미 가져왔습니다.

목록에 표시되는 정보에는 일련번호, 이름, 경로, 확장자, 만든 날짜 및 수정한 날짜가 포함됩니다. 이 정보를 통해 파일이 올바른지 확인할 수 있습니다. 예를 들어, 확장자 열에는 txt로 표시되고 경로 열에는 파일이 D:\test\ 디렉터리에 있음을 보여줍니다. 파일 목록에 누락이나 실수로 추가된 파일이 없는지 확인한 후 하단의 "다음"을 클릭합니다.
일괄 처리 작업에서는 파일 목록 검사가 매우 중요합니다. 후속 규칙이 목록의 모든 파일에 적용되므로, 관련 없는 파일을 목록에 추가하면 함께 처리됩니다.
3단계: 찾기 방식을 "수식 퍼지 텍스트 찾기"로 설정
"처리 옵션 설정"에 들어가면 먼저 "찾기 방식"이 보입니다. 스크린샷에는 "정밀 텍스트 찾기"와 "수식 퍼지 텍스트 찾기" 두 가지 옵션이 있습니다. 이번에는 와일드카드 정규 표현식을 사용하여 텍스트 유형을 일치시킬 것이므로 "수식 퍼지 텍스트 찾기"를 선택합니다.

이 선택은 찾기 규칙의 유연성을 결정합니다. 고정된 텍스트만 찾는다면 정밀 찾기를 사용할 수 있고, Annex A, Annex B, Annex C와 같이 변화하는 내용을 일치시키려면 수식 퍼지 찾기가 필요합니다.
4단계: 일치 규칙 Annex [A-Z] 입력
왼쪽 "찾을 키워드 목록"에 다음을 입력합니다:
Annex [A-Z]
이 규칙은 Annex 뒤에 대문자가 하나 오는 텍스트와 일치할 수 있습니다. 예시의 Annex A, Annex B, Annex C, Annex D는 모두 이 규칙에 부합합니다. 기능이 완전한 행을 처리하므로, 이러한 일치 내용을 포함하는 행이 전체적으로 처리됩니다.
여기에는 실용적인 아이디어가 있습니다. 일괄 처리 전에 먼저 대상 행의 공통 특징을 관찰하는 것입니다. 각 행을 찾기 목록에 완전하게 복사하기보다 먼저 규칙을 정제하는 것이 좋습니다. 규칙이 명확할수록 표현식이 간결해지고 후속 재사용 가치도 높아집니다.
5단계: 바꿀 키워드 목록을 비워 두기
오른쪽 영역은 "바꿀 키워드 목록"이며, 옆에 "입력하지 않으면 삭제를 의미합니다"라는 안내가 있습니다. 따라서 목적이 일치하는 모든 행을 삭제하는 것이라면 오른쪽에 어떤 대체 텍스트도 입력하지 말아야 합니다. 왼쪽은 찾기를 담당하고, 오른쪽을 비워두면 삭제를 의미합니다.
오른쪽에 내용을 입력하면 소프트웨어가 바꾸기 로직을 실행하여 일치하는 행을 입력한 텍스트로 대체할 수 있습니다. 본문의 목표는 Annex 행을 삭제하는 것이므로 비워 두면 됩니다.
6단계: 저장 위치 설정 및 처리 시작 계속 진행
찾기 및 삭제 규칙을 설정한 후 하단의 "다음"을 클릭합니다. 과정 표시줄에서 이어서 "저장 위치 설정"과 "처리 시작"이 있음을 볼 수 있습니다. 저장 위치는 처리된 파일의 출력 위치를 결정하는 데 사용됩니다. 처리 전후 차이를 비교하기 쉽도록 출력 결과를 원본 파일과 분리하여 저장하는 것이 좋습니다.
처리 시작 단계에 들어가면 소프트웨어가 가져온 목록의 파일을 하나씩 삭제 규칙에 따라 실행합니다. 처리가 끝나면 출력 파일을 열어 무작위로 검사하여 Annex A, Annex B 등의 행이 삭제되었고 본문 및 목차 내용이 여전히 유지되는지 확인합니다.
자주 묻는 질문 또는 주의사항
1. 와일드카드 정규 규칙은 넓게 작성할수록 좋은가요?
아닙니다. 규칙이 넓을수록 일치 범위도 커지고 실수로 삭제할 위험도 높아집니다. 예를 들어 Annex만 작성하면 유지하고 싶은 제목 행을 포함하여 Annex가 포함된 모든 행과 일치할 수 있습니다. 본문에서 Annex [A-Z]를 사용한 것은 Annex만 쓰는 것보다 더 목표 지향적입니다.
2. 왜 Annexes 제목은 삭제되지 않았나요?
예시 표현식은 Annex [A-Z]로, Annex 뒤에 공백과 대문자 하나가 오는 것을 요구합니다. 하지만 "Annexes"는 이 규칙에 부합하지 않아 유지되었습니다. 이는 표현식을 합리적으로 설계하면 삭제해서는 안 될 내용을 피할 수 있음을 보여줍니다.
3. 먼저 소량의 파일로 테스트할 수 있나요?
그렇게 하는 것이 좋습니다. 일괄 처리는 효율적이지만 규칙이 잘못되면 영향 범위도 더 커집니다. 먼저 1~2개의 샘플 파일을 가져와 테스트하여 처리 후 결과가 예상에 부합하는지 확인한 다음, 전체 폴더를 가져와 일괄 처리를 수행할 수 있습니다.
4. 처리 후 결과를 어떻게 확인하나요?
여러 출력 파일을 열어 처리 전후 내용을 비교할 수 있습니다. 본문 예시에서는 처리 전 파일에 Annex A부터 Annex D 행이 있었고, 처리 후에는 이 행들이 사라졌으며 Contents 및 후속 번호 목차가 유지되었습니다. 이 결과에 부합한다면 규칙 설정이 올바르다는 의미입니다.
요약: 사무용 소프트웨어로 일괄 텍스트 정리 완료
여러 텍스트 파일에 삭제해야 할 규칙성 있는 행이 존재하는 경우 수동 처리가 최적의 방안은 아닙니다. HeSoft Doc Batch Tool 을 통해 "파일 열기, 내용 찾기, 줄 전체 삭제하기, 파일 저장하기"라는 일련의 반복 동작을 하나의 일괄 작업으로 통합할 수 있습니다.
본문 예시의 핵심 설정은 다음과 같습니다: 텍스트 도구에서 "키워드 기반 텍스트 파일 완전한 행 찾기 및 바꾸기"를 선택하고, 여러 txt 파일을 가져온 후 "수식 퍼지 텍스트 찾기"를 사용하여, Annex [A-Z]를 입력하고, 바꿀 키워드 목록은 비워 둡니다. 이렇게 하면 Annex 문자 규칙과 일치하는 모든 완전한 행을 일괄 삭제할 수 있습니다.
대량의 TXT 파일, 로그 파일 또는 내보낸 텍스트를 정리하고 있다면, 먼저 삭제할 내용의 공통 규칙을 분석한 후 와일드카드 정규 표현식을 사용하여 일괄 처리하는 것이 좋습니다. 이렇게 하면 반복 작업을 현저히 줄이고, 파일 정리 효율을 높이며, 여러 파일의 처리 결과를 일관되게 유지할 수 있습니다.