자료 공유, 테스트 데이터 준비 및 텍스트 템플릿 정리 과정에서 여러 TXT 파일의 숫자를 일괄적으로 플레이스홀더로 바꿔야 하는 경우가 자주 있습니다. 이 글에서는 TXT 파일 내용 일괄 마스킹 시나리오를 중심으로 HeSoft Doc Batch Tool 의 텍스트 도구를 사용하여 "텍스트에서 키워드 찾아 바꾸기" 기능으로 여러 txt 파일을 가져오고, 수식 퍼지 검색을 통해 \d+로 숫자를 매칭하여 일괄적으로 AAA로 바꾸는 방법을 시연합니다. 처리 전후 비교, 전체 단계 및 규칙 주의 사항을 제공합니다.
다른 사람, 고객 또는 외부 시스템에 텍스트 자료를 보내기 전에 많은 사람들이 먼저 콘텐츠를 민감 정보 제거(비식별화) 처리합니다. 예를 들어 숫자, 번호, 통계값, 거리, 금액 또는 기타 민감한 정보를 통일된 자리 표시자로 대체하는 것입니다. 문제는 이러한 정보가 여러 TXT 파일에 분산되어 있는 경우가 많고, 각 파일의 숫자가 다르다는 점입니다. 수동으로 파일을 하나씩 열어 바꾸는 것은 시간이 오래 걸릴 뿐만 아니라 누락되기 쉽습니다.
본 글은 전형적인 요구 사례를 예로 들어, 여러 txt 텍스트 파일 속의 숫자 내용을 일괄적으로 AAA로 바꾸는 방법을 설명합니다. 여기서 AAA는 자리 표시자로 이해할 수 있으며, 필요에 따라 ***, [숫자], {num} 등 다른 텍스트로 대체할 수도 있습니다. 예시에 사용된 업무용 소프트웨어는 HeSoft Doc Batch Tool 로, 문서와 파일의 일괄 처리를 지향하여 다량의 파일 반복 작업 문제를 해결하는 데 적합합니다.
글은 처리 전 상태가 어떠한지, 처리 후 어떤 효과가 나타나는지, 그리고 소프트웨어에서 단계별로 작업을 완료하는 방법을 스크린샷과 함께 설명합니다. 읽고 나면 동일한 방법을 TXT 내용 일괄 비식별화, 텍스트 키워드 일괄 치환, 로그 파일 정리, 자료 템플릿화 등의 작업에 사용할 수 있습니다.
적용 시나리오: 일괄 비식별화, 일괄 정리 및 일괄 템플릿화
실제 업무 환경에서 TXT 파일은 중간 데이터나 경량 문서의 역할을 담당하는 경우가 많습니다. 형식이 단순하여 시스템 간 전송이 용이하지만, 이는 곧 민감 정보가 평문 형태로 직접 노출될 수 있음을 의미하기도 합니다. 파일 수가 많을 때는 일괄 처리가 매우 필요합니다.
다음과 같은 상황에 본 글의 방법이 적합합니다.
- 자료 공유 전 비식별화: 텍스트 속의 숫자, 번호, 통계 데이터를 통일적으로 치환하여 원본 정보 노출을 방지합니다.
- 테스트 샘플 준비: 실제 데이터를 자리 표시자로 대체하여 텍스트 구조는 유지하되 구체적인 수치는 숨깁니다.
- 교육 또는 연수 자료 정리: 여러 사례의 숫자를 통일적으로 치환하여 범용 템플릿 제작을 용이하게 합니다.
- 시스템 로그 정리: 로그에는 ID, 타임스탬프, 수량 등의 숫자 정보가 포함될 수 있으며, 규칙에 따라 통일적으로 처리할 수 있습니다.
- 여러 영문 txt 자료 처리: 본문이 영어이더라도, 치환할 내용이 규칙에 부합한다면 일괄 처리가 가능합니다.
일반적인 찾아 바꾸기와 비교했을 때, 본 글의 핵심은 "유사 내용"의 일괄 치환에 있습니다. 하나의 고정된 숫자만 바꾸는 것이 아니라, 정규 표현식을 사용하여 모든 숫자를 기술함으로써 소프트웨어가 자동으로 인식하고 처리하게 합니다.
효과 미리보기: 치환 전후 비교가 더 직관적입니다
처리 전: 여러 텍스트 파일이 통일된 처리를 기다리고 있습니다
스크린샷에서 볼 수 있듯이, 하나의 폴더 안에 big_bang.txt, black_holes.txt, dark_energy.txt, dark_matter.txt, galaxies.txt 등 여러 txt 파일이 있습니다. 이 파일들 모두에 동일한 찾아 바꾸기 규칙을 적용해야 합니다.

이러한 파일 구성 방식은 매우 일반적입니다. 동일한 프로젝트, 주제 또는 동일한 배치의 내보내기 결과를 같은 디렉터리에 배치하는 것입니다. 수동으로 처리할 때는 하나씩 열어야 하지만, 일괄 처리 도구는 여러 레코드를 한 번에 가져와 통일적으로 실행할 수 있습니다.
처리 전: 숫자가 본문 단락 속에 흩어져 있습니다
black_holes.txt를 열면 텍스트 콘텐츠에 여러 숫자가 나타나는 것을 볼 수 있습니다. 예를 들어 스크린샷에 표시된 10과 30은 각각 다른 문맥에서 나타납니다. 실제 파일에는 질량 범위, 거리 수치 등 더 많은 숫자가 포함될 수도 있습니다.

일반적인 정확한 찾기만 사용한다면, 치환할 모든 숫자를 각각 알고 있어야 합니다. 그러나 비식별화 시나리오에서는 일반적으로 구체적인 값이 아닌 "그것이 숫자"라는 사실에만 관심을 갖습니다. 따라서 정규 표현식을 사용하는 것이 더 적합합니다.
처리 후: 숫자 위치가 자리 표시자 AAA로 대체되었습니다
일괄 처리가 완료된 후 같은 파일을 다시 확인하면, 원래 숫자 위치가 AAA로 바뀐 것을 볼 수 있습니다. 스크린샷에는 여러 AAA가 강조 표시되어 있어, 소프트웨어가 규칙에 따라 치환을 완료했음을 설명해줍니다.

이러한 처리 결과는 비식별화 후의 전시, 테스트 및 템플릿 제작에 매우 적합합니다. 텍스트 구조는 그대로 유지되지만, 구체적인 숫자는 더 이상 직접 노출되지 않습니다.
조작 단계: HeSoft Doc Batch Tool 로 TXT 일괄 치환 완료하기
1단계: 텍스트 도구를 열고 찾아 바꾸기 기능 선택
HeSoft Doc Batch Tool 를 시작한 후, 왼쪽 탐색 메뉴에서 텍스트 도구를 선택합니다. 이 소프트웨어 인터페이스는 Word 도구, Excel 도구, PDF 도구, 그림 도구 및 텍스트 도구 등 다양한 유형의 업무 처리 작업을 카테고리별로 표시합니다. 이번 처리 대상은 txt 파일 내용이므로, 텍스트 도구 분류로 진입해야 합니다.
텍스트 도구 페이지에서 "텍스트 파일에서 키워드 찾아 바꾸기"를 선택합니다. 스크린샷에서 이 기능 카드의 설명은 텍스트 파일 내용의 키워드를 일괄 찾아 바꾸는 것으로, 이번 "일괄적으로 숫자를 AAA로 바꾸기" 요구사항에 부합합니다.

이 단계의 예상 결과는 일괄 작업 마법사 페이지로 진입하는 것이며, 이후 동일한 작업 안에 여러 텍스트 파일을 추가하고 치환 규칙을 설정할 수 있습니다.
2단계: 처리할 여러 txt 파일 가져오기
"텍스트 파일에서 키워드 찾아 바꾸기" 페이지에 진입하면, 먼저 처리할 레코드를 선택합니다. 인터페이스 오른쪽 상단에는 파일 추가 및 폴더에서 파일 가져오기가 있습니다. 파일이 이미 하나의 폴더에 모여 있다면, 폴더에서 가져오기를 사용하는 것이 보통 시간을 절약해 줍니다.

가져온 후, 테이블에는 파일 이름, 경로, 확장자, 만든 날짜, 수정한 날짜 등의 정보가 나열됩니다. 예시에는 총 5개의 레코드가 있으며, 확장자는 모두 txt이고, 하단 요약 부분에는 레코드 수가 5로 표시됩니다. 처리 전에 목록을 주의 깊게 확인해야 합니다. 처리해야 할 파일은 모두 포함되었는지, 처리하지 말아야 할 파일은 제외되었는지 확인합니다.
만약 특정 파일이 이번 치환 작업에 참여해서는 안 된다면, 작업 열의 삭제 아이콘을 통해 제거할 수 있습니다. 확인 후 하단의 다음을 클릭하여 처리 옵션 설정으로 진입합니다.
3단계: 수식 유사 텍스트 찾기 사용 선택
2단계 "처리 옵션 설정"에서 소프트웨어는 찾기 방식을 제공합니다. 스크린샷은 정확한 텍스트 찾기 또는 수식 유사 텍스트 찾기 사용을 선택할 수 있음을 보여줍니다. 이번 목표는 고정된 숫자가 아닌 모든 숫자를 치환하는 것이므로, 수식 유사 텍스트 찾기 사용을 선택해야 합니다.

이 옵션을 표현식 규칙에 따라 찾는 것으로 이해할 수 있습니다. 텍스트 내 특정 내용이 규칙에 부합하기만 하면, 소프트웨어가 이를 인식하여 치환을 실행합니다. 일괄 비식별화 측면에서, 이 방법은 항목을 하나씩 나열하는 것보다 훨씬 효율적입니다.
4단계: 찾을 키워드와 바꿀 키워드 입력
왼쪽 "찾을 키워드 목록"에 다음과 같이 입력합니다.
\d+오른쪽 "바꿀 키워드 목록"에 다음과 같이 입력합니다.
AAA여기서 \d+는 연속된 숫자를 매칭하는 데 사용되며, AAA는 치환 후의 자리 표시자입니다. 이렇게 설정하면 소프트웨어가 가져온 여러 txt 파일에서 \d+ 규칙에 부합하는 모든 내용을 찾아 AAA로 대체합니다.
주의할 점은 양쪽 목록의 대응 관계를 유지해야 한다는 것입니다. 왼쪽의 각 찾기 규칙은 오른쪽의 해당 순서에 맞는 치환 내용에 대응됩니다. 여러 그룹의 규칙을 설정할 경우, 한 줄씩 검사하여 잘못된 위치를 피하는 것이 좋습니다.
5단계: 저장 위치 설정 후, 일괄 처리 실행
키워드 설정을 완료한 후, 페이지 흐름에 따라 계속 진행하여 저장 위치 설정으로 진입합니다. 파일 일괄 처리 시, 원본 파일을 직접 덮어쓰는 것을 피하기 위해 새로운 출력 위치를 우선적으로 선택하는 것이 좋습니다. 이렇게 하면 처리 후 비교 검사하여 결과에 문제가 없는지 확인할 수 있습니다.
마지막으로 처리 시작 단계에 진입하여 일괄 찾아 바꾸기를 실행합니다. 처리가 끝나면 출력 폴더의 txt 파일을 열어 표본 검사를 합니다. 원래 숫자가 AAA로 치환된 것을 확인하면 작업이 성공적으로 실행된 것입니다.
핵심 규칙 분석: 왜 \d+가 숫자 비식별화를 완료할 수 있을까요
\d+는 본 튜토리얼에서 가장 중요한 설정입니다. 이것은 일반적인 정규 표현식 작성법에 속하며, 숫자 내용을 매칭하는 데 적합합니다.
- \d는 숫자 문자를 나타냅니다.
- +는 앞의 내용이 한 번 이상 나타남을 의미합니다.
- \d+는 5, 10, 100, 26000과 같은 연속된 숫자 구간을 나타냅니다.
처리 결과 스크린샷에서 파일 내 여러 숫자가 AAA로 치환된 것을 볼 수 있습니다. 일반적인 정수에 대해서는 이 규칙이 매우 직관적입니다. 하지만 텍스트에 쉼표가 있는 숫자, 소수, 음수 또는 단위가 있는 조합 내용이 있다면, \d+는 그 중 숫자 부분만 매칭할 수 있습니다. 예를 들어 26,000은 26과 000 두 부분으로 나뉘어 처리되어 최종적으로 AAA,AAA로 표시될 수 있습니다. 따라서 정식으로 일괄 처리하기 전에 먼저 대표적인 파일 하나를 골라 테스트하는 것이 좋습니다.
자주 묻는 질문 및 주의사항
1. 일괄 치환하면 가져온 파일이 모두 수정되나요
작업 목록에 있는 파일에 설정된 규칙이 적용됩니다. 따라서 파일을 가져올 때 반드시 범위를 확인해야 합니다. 일부 파일만 처리하려는 경우, 폴더 전체의 관련 없는 파일까지 작업에 가져오지 않도록 해야 합니다.
2. 숫자를 다른 내용으로 바꿀 수 있나요
가능합니다. 예시에서 AAA를 사용한 것은 단지 시연을 위한 것입니다. 필요에 따라 ***, [숨김], NUMBER 또는 다른 자리 표시자로 치환 내용을 설정할 수 있습니다.
3. 숫자를 바꾸는 대신 삭제하고 싶다면요
스크린샷 오른쪽 힌트에서 볼 수 있듯이, 바꿀 키워드 목록에 "입력하지 않으면 삭제 의미입니다". 따라서 매칭된 숫자를 삭제하고 싶다면 바꿀 내용을 기입하지 않으면 됩니다. 다만 삭제 작업은 텍스트 가독성에 더 큰 영향을 줄 수 있으니 먼저 백업하는 것이 좋습니다.
4. 정확한 찾기와 수식 유사 찾기는 어떻게 선택하나요
고정된 단어를 바꾸려면 정확한 텍스트 찾기를 선택하는 것이 더 간단하고, 모든 숫자, 특정 번호 또는 날짜 형식과 같이 규칙성이 있는 내용을 바꾸려면 수식 유사 텍스트 찾기 사용을 선택해야 합니다.
5. doc, docx, PDF 등 파일에 사용할 수 있나요
본 글의 스크린샷은 텍스트 도구 중 TXT 파일 처리 흐름을 보여줍니다. Word의 doc, docx 파일이나 PDF 파일은, 파일 유형에 따라 소프트웨어 왼쪽의 해당 Word 도구 또는 PDF 도구를 선택해야 하며, 서로 다른 형식의 처리 방식을 혼용하는 것을 피해야 합니다.
6. 일괄 비식별화 전에 왜 먼저 테스트해야 하나요
정규 표현식은 매우 효율적이지만, 규칙이 너무 넓어 바꾸지 말아야 할 내용까지 매칭될 위험도 있습니다. 소량의 샘플로 먼저 테스트하여 규칙이 정확한지 확인한 후 전체 파일을 일괄 처리하면 효과적으로 위험을 줄일 수 있습니다.
요약: 정규 표현식으로 일괄 치환하여 TXT 비식별화 효율 높이기
본 글은 HeSoft Doc Batch Tool 를 사용하여 여러 TXT 파일 속의 숫자를 AAA로 일괄 치환하는 방법을 시연했습니다. 핵심 단계에는 텍스트 도구로 진입, 텍스트 파일에서 키워드 찾아 바꾸기 선택, 여러 txt 파일 가져오기, 수식 유사 텍스트 찾기 사용 선택, \d+를 찾을 규칙으로 입력, AAA를 바꿀 내용으로 입력, 그리고 나서 저장 위치를 설정하고 처리를 시작하는 것이 포함됩니다.
일괄 비식별화, 일괄 정리 또는 텍스트 템플릿을 일괄 제작해야 하는 사용자에게 이 방법은 반복 작업을 현저히 줄여줄 수 있습니다. 파일을 하나씩 찾을 필요도 없고, 모든 숫자를 미리 나열할 필요도 없이, 처리할 내용을 규칙으로 기술하기만 하면 업무용 소프트웨어가 일괄적으로 치환을 완료합니다. 소량의 파일부터 테스트를 시작하여 결과를 확인한 후 전체 폴더를 처리함으로써 효율성과 정확성을 모두 확보할 것을 권장합니다.