이 글은 TXT 파일에서 숫자를 일괄 삭제하는 예를 들어, 오피스 소프트웨어의 일괄 찾기 및 바꾸기 기능을 활용하여 여러 텍스트 파일을 처리하는 방법을 설명합니다. HeSoft Doc Batch Tool 을 통해 사용자는 여러 txt 파일을 한 번에 가져올 수 있으며, 찾기 방식에서 공식을 사용한 퍼지 텍스트 찾기를 선택하고 정규식 규칙 \d+를 입력하여 연속된 숫자를 매칭시키고, 바꾸기 후 키워드 목록을 비워두어 매칭된 내용을 일괄 삭제할 수 있습니다. 또한 처리 전후 효과, 단계별 목적 및 작업 시 주의사항에 대해서도 설명합니다.
문서 정리, 데이터 클렌징, 콘텐츠 아카이빙 과정에서 가장 번거로운 것은 대개 복잡한 단일 작업이 아니라 대량의 반복적인 작은 작업입니다. 예를 들어, 여러 TXT 파일에 숫자 키워드(번호, 페이지, 통계 수치, 거리, 연도 또는 임시 마커 등)가 포함되어 있습니다. 사용자는 이러한 내용을 모두 삭제해야 하지만 파일이 많아 텍스트 편집기로 하나씩 열어 처리하면 속도가 느리고 오류가 발생하기 쉽습니다. 이 글에서는 실제 예시를 통해 HeSoft Doc Batch Tool 를 사용하여 와일드카드 정규 표현식으로 텍스트 파일에서 일치하는 내용을 일괄 삭제하는 방법을 설명합니다.
예시 규칙은 \d+로, 연속된 숫자를 찾는 데 사용됩니다. '대체할 키워드 목록'을 비워두면 일치하는 모든 숫자를 삭제할 수 있습니다. 이 방법은 규칙이 명확하고 반복성이 강한 작업을 한 번 설정한 후 도구에 맡기는 오피스 소프트웨어 일괄 처리의 핵심 가치를 보여줍니다.
적용 시나리오: 고정된 단어가 아닌, 규칙에 따라 텍스트 유형을 삭제해야 하는 경우
'일괄 텍스트 키워드 삭제'를 검색하는 많은 사용자의 실제 필요는 단순히 고정된 단어 하나를 삭제하는 것이 아니라, 규칙에 맞는 일련의 내용을 삭제하는 것입니다. 예를 들어 모든 숫자 삭제, 모든 번호 삭제, 특정 형식의 코드 삭제, 괄호 안의 마커 삭제, 각 파일의 동일한 광고 문구 삭제 등이 있습니다. 이러한 내용이 완전히 동일하다면 정확히 찾기 기능을 사용할 수 있고, 내용 형식은 같지만 구체적인 값이 다르다면 와일드카드나 정규 표현식이 더 적합합니다.
이 예시에서 black_holes.txt에는 "10", "30" 등 서로 다른 숫자가 포함되어 있으며, 다른 txt 파일에도 각기 다른 숫자가 있을 수 있습니다. 이 숫자들을 모두 삭제하려면 숫자를 하나씩 찾는 것은 현실적으로 불가능합니다. \d+와 같은 규칙을 사용해야 길이가 다른 숫자 콘텐츠를 한 번에 처리할 수 있습니다. txt, 로그, 내보낸 데이터, 자료 원고 등의 텍스트 파일에서 이러한 일괄 처리 방식은 매우 실용적입니다.
효과 미리보기: 처리 전에 여러 개의 대상 TXT 파일 확인 가능
처리 전, 폴더에는 정리가 필요한 여러 텍스트 파일이 있습니다. 스크린샷에는 big_bang.txt, black_holes.txt, dark_energy.txt, dark_matter.txt, galaxies.txt 등의 파일이 표시됩니다. 파일 수는 5개에 불과하지만, 실제 작업에서는 수십 개 또는 수백 개가 될 수 있어 수동 처리 비용이 빠르게 증가합니다.

그중 black_holes.txt를 열어보면 본문에 여러 숫자가 포함되어 있음을 알 수 있습니다. 스크린샷은 이번에 정규 규칙을 통해 삭제할 대상인 "10", "30" 등의 숫자를 빨간색 상자와 화살표로 표시했습니다.

처리 후 효과: 일치하는 숫자는 삭제되고 텍스트 본문은 유지됨
처리가 완료된 후 black_holes.txt를 다시 확인하면 원래 숫자가 있던 위치에 더 이상 숫자 콘텐츠가 없습니다. 텍스트 본문은 그대로 유지되며, 일치하는 숫자만 빈 값으로 대체되었습니다. 스크린샷의 녹색 마커는 삭제 후의 변화를 관찰하는 데 도움이 됩니다.

결과에서 볼 수 있듯이, 이 방법은 전체 줄이나 전체 단락을 삭제하는 것이 아니라 일치하는 키워드 조각만 삭제합니다. 이는 글의 주요 내용을 유지하면서 부분적인 콘텐츠만 정리해야 하는 작업에 매우 적합합니다. 목표가 특정 키워드가 포함된 전체 줄을 삭제하는 것이라면 '전체 줄' 관련 기능을 선택해야 합니다. 이 글에서 다루는 내용은 텍스트 내 일치 키워드 삭제입니다.
조작 단계: HeSoft Doc Batch Tool 를 사용하여 정규식 일치 콘텐츠 삭제하기
1단계: 텍스트 도구에서 찾기 및 바꾸기 기능 열기
HeSoft Doc Batch Tool 메인 인터페이스의 왼쪽에서 '텍스트 도구'를 선택합니다. 오른쪽 기능 카드에서 '텍스트 파일의 키워드 찾기 및 바꾸기'를 클릭합니다. 이 기능 설명은 텍스트 파일 내용의 키워드를 일괄 찾기 및 바꾸기 하는 것으로, TXT 콘텐츠 일괄 삭제 요구 사항에 정확히 부합합니다.

이 단계의 목적은 '파일 내용'을 처리할 도구를 선택하는 것입니다. 많은 일괄 처리 소프트웨어는 파일 이름, 폴더 이름, 형식 변환 등의 기능도 제공하지만, 이번에 처리할 대상은 txt 본문 내용이므로 텍스트 찾기 및 바꾸기 절차로 이동해야 합니다.
2단계: 처리할 여러 텍스트 파일 가져오기
기능 페이지에 들어가면 먼저 '처리할 레코드 선택' 단계에서 파일을 추가합니다. 인터페이스 상단에 '파일 추가' 및 '폴더에서 파일 가져오기'가 있습니다. 예시에는 5개의 txt 파일을 가져왔으며, 테이블에서 파일 이름, 경로, 확장자, 생성 시간 및 수정 시간을 확인할 수 있습니다.

여기서 파일을 가져온 후 목록을 확인하는 습관을 들이는 것이 좋습니다. 파일 확장자가 txt인지, 경로가 올바른지, 레코드 수가 예상과 일치하는지 점검합니다. 만약 실수로 파일이 추가된 경우 목록의 관리 항목을 통해 해당 레코드를 제거할 수 있으며, 다시 선택해야 하는 경우 인터페이스의 비우기 기능을 통해 다시 가져올 수 있습니다. 확인 후 '다음'을 클릭합니다.
3단계: 찾기 방식을 수식을 사용한 퍼지 텍스트 찾기로 설정하기
'처리 옵션 설정' 페이지에서 '찾기 방식'을 찾습니다. 이 예시에서는 '정확히 텍스트 찾기' 대신 '수식을 사용하여 퍼지 텍스트 찾기'를 선택합니다. 스크린샷에서 해당 옵션이 빨간색 상자로 표시되어 있습니다.

이 모드를 선택하는 이유는 삭제하려는 대상이 특정 숫자 하나가 아니라 모든 숫자이기 때문입니다. 정규식 또는 와일드카드 규칙은 '연속된 숫자'와 같은 일련의 내용을 설명할 수 있으므로, 퍼지 규칙을 통한 검색이 적합합니다.
4단계: 찾을 키워드 목록에 \d+ 입력하기
왼쪽의 '찾을 키워드 목록'에 \d+를 입력합니다. 이 의미는 간단히 말해 하나 이상의 연속된 숫자를 찾는 것입니다. 실제 검색 시 텍스트 내의 "5", "10", "100", "26000" 등이 모두 인식됩니다.
오른쪽의 '대체할 키워드 목록'은 비워 둡니다. 인터페이스에 '입력하지 않으면 삭제 처리'라고 안내되어 있으므로, 대체 내용을 입력하지 않으면 삭제 효과를 얻을 수 있습니다. 만약 숫자를 특정 플레이스홀더(예: "숫자")로 통일하여 대체하려면 오른쪽에 해당 텍스트를 입력할 수 있지만, 이 예시의 목표는 삭제이므로 비워 둡니다.
5단계: 저장 위치 설정, 실행 및 결과 샘플 검사
처리 옵션을 완료한 후 흐름에 따라 '다음'을 클릭하고 '저장 위치 설정'으로 이동한 다음 '처리 시작'으로 이동합니다. 데이터 안전을 위해 새 폴더로 출력하거나 원본 파일을 미리 백업하는 것을 권장합니다. 내용에 영향을 미치는 일괄 삭제 작업인 만큼, 규칙이 너무 광범위하게 작성되면 예상보다 많은 내용이 삭제될 수 있습니다.
처리가 완료된 후, 최소한 한두 개의 결과 파일을 열어 표본 검사를 수행합니다. 원래 숫자가 있던 위치가 삭제되었는지, 단락이 정상적인지, 원치 않는 공백 문제는 없는지 중점적으로 확인할 수 있습니다. 예시 처리 후, black_holes.txt에서 숫자가 더 이상 표시되지 않는 것은 일괄 삭제가 성공했음을 의미합니다.
자주 묻는 질문 및 주의사항
1. '수식을 사용한 퍼지 텍스트 찾기'와 '정확히 텍스트 찾기'를 어떻게 선택하나요?
"광고", "테스트", "draft"와 같은 고정된 단어를 삭제하려면 정확히 텍스트 찾기를 사용할 수 있습니다. 모든 숫자, 다른 번호, 다른 길이의 코드와 같은 유형의 콘텐츠를 삭제하려면 수식을 사용한 퍼지 텍스트 찾기가 더 적합합니다.
2. 숫자 삭제 후 텍스트 사이가 부자연스러우면 어떻게 하나요?
이 예시는 숫자만 삭제하며, 문장을 자동으로 재작성하지 않습니다. 따라서 숫자 앞뒤의 공백, 단위, 문장 부호가 남을 수 있습니다. 필요에 따라 한 번 더 공백 정리를 진행하거나, 정식 처리 전에 더 완전한 일치 규칙을 설계할 수 있습니다. 중요한 문서의 경우 여러 위치를 표본 검사하는 것이 좋습니다.
3. 왜 소량의 파일로 먼저 테스트해야 하나요?
정규 표현식은 효율적이지만 신중해야 합니다. \d+는 모든 연속된 숫자와 일치하므로 적용 범위가 매우 넓습니다. 먼저 소량의 사본으로 테스트하여 규칙이 예상에 부합하는지 확인한 후 전체 파일을 일괄 처리하면 오류 확대를 방지할 수 있습니다.
4. docx, doc, PDF 등의 파일을 일괄 처리할 수 있나요?
이 글의 스크린샷은 텍스트 도구의 TXT 파일 처리 과정을 보여줍니다. Word의 docx, doc 또는 PDF와 같은 형식의 경우 소프트웨어에서 해당 유형의 도구를 선택하고, 해당 기능이 콘텐츠 찾기 및 바꾸기를 지원하는지 확인해야 합니다. 파일 형식에 따라 구조가 다르므로 TXT 절차를 직접 적용하지 않는 것이 좋습니다.
요약: 정규 규칙과 일괄 도구의 결합으로 텍스트 정리 효율성 향상
와일드카드 정규 표현식을 사용하여 텍스트 파일의 키워드를 일괄 삭제하는 것은 규칙이 명확하지만 파일 수가 많은 작업에 적합합니다. HeSoft Doc Batch Tool 를 통해 사용자는 여러 txt 파일을 한 번에 가져와 동일한 흐름 안에서 찾기 규칙과 대체 결과를 설정하여, 반복적이었던 수동 삭제 작업을 자동화된 일괄 처리로 전환할 수 있습니다.
현재 정리가 필요한 텍스트 파일이 있다면, 먼저 샘플 파일을 복사하여 이 글의 단계에 따라 \d+를 입력하고 대체 내용을 비워둔 채 처리 결과가 올바른지 확인한 후 전체 디렉터리를 처리하는 것이 좋습니다. 이렇게 하면 많은 시간을 절약하고, 여러 파일의 정리 기준을 일관되게 유지할 수 있습니다.