TXT 텍스트 파일이 여러 개 있고, 그 안에서 일괄적으로 변경해야 할 숫자, 번호, 키워드가 많을 경우, 파일을 하나씩 열어서 수동으로 찾아 바꾸는 것은 시간이 오래 걸릴 뿐만 아니라 누락되기 쉽습니다. 이 글에서는 여러 txt 파일 내의 숫자 내용을 AAA로 일괄 변경하는 예를 들어, HeSoft Doc Batch Tool 의 "텍스트에서 키워드 찾아 바꾸기" 기능을 사용하는 방법을 소개합니다. 수식을 통해 퍼지(fuzzy) 텍스트 검색, 즉 흔히 말하는 와일드카드나 정규 표현식 방식을 활용하여 여러 텍스트 파일을 한 번에 처리할 수 있으며, 이는 데이터 비식별화, 템플릿 정리, 로그 정돈, 콘텐츠 표준화 같은 작업에 적합합니다.
대량의 TXT 텍스트 파일을 정리할 때, 동일한 유형의 내용을 일괄적으로 교체해야 하는 경우가 자주 발생합니다. 예를 들어, 여러 텍스트에 숫자 번호, 통계 수치, 거리, 연도, 수량, ID 또는 기타 동적 콘텐츠가 분산되어 있는 경우, 파일을 하나씩 열고 편집기의 찾기 및 바꾸기 기능을 사용하여 처리하면 단계가 반복될 뿐만 아니라 특정 파일이나 위치를 누락하기 쉽습니다.
이 문서에서 해결하고자 하는 문제는 와일드카드, 정규 표현식과 같은 규칙을 사용하여 여러 텍스트 파일에서 키워드를 일괄적으로 찾아 바꾸는 방법입니다. 예제에서는 여러 txt 파일의 모든 숫자를 AAA로 통일하여 바꿀 것입니다. 시연 대상은 TXT 일반 텍스트 파일이지만, 이러한 접근 방식은 로그 텍스트, 내보낸 데이터 설명, 문서 초안, 구성 설명, 일괄 생성된 보고서 텍스트 등의 파일 내용을 처리하는 데에도 동일하게 적합합니다.
이 문서에서 사용하는 오피스 소프트웨어는 HeSoft Doc Batch Tool 입니다. 이 소프트웨어는 단순히 하나의 파일을 편집하는 것이 아니라 파일 일괄 처리를 지향하여 사용자의 반복 작업을 줄여줍니다. 여러 텍스트 파일에서 동일한 찾기 및 바꾸기 규칙을 실행해야 하는 시나리오에 이 도구는 수동으로 하나씩 처리하는 것보다 효율적이며, 결과의 일관성을 유지하기도 더 쉽습니다.
적용 시나리오: 정규식을 이용한 TXT 콘텐츠 일괄 찾기 및 바꾸기에 적합한 경우
가끔 하나의 txt 파일에서 하나의 단어만 수정한다면 일반 텍스트 편집기로도 충분합니다. 하지만 파일 수가 많아지거나, 찾으려는 내용이 고정된 단어가 아니라 특정 패턴을 가진 텍스트 유형이라면 정규 표현식을 사용한 일괄 교체가 더 적합합니다.
일반적인 시나리오는 다음과 같습니다:
- 숫자 일괄 교체: 예를 들어 기사, 자료, 로그의 모든 숫자를 통일된 자리 표시자로 바꿔 비식별화 또는 템플릿화 처리에 사용합니다.
- 번호 일괄 정리: 예를 들어 주문 번호, 배치 번호, 챕터 번호, 일련번호 등 형식이 완전히 같지 않지만 특정 규칙을 따르는 경우입니다.
- 변화하는 키워드 일괄 교체: 다른 파일에 나타나는 연도, 버전 번호, 가격, 통계 값 등입니다.
- 영어 또는 중국어 텍스트 일괄 처리: 콘텐츠가 순수 텍스트이고 통일된 규칙에 따라 찾아 바꿔야 한다면 유사한 프로세스를 사용할 수 있습니다.
- 자료 일괄 정리: 예를 들어 연구 자료, 교육 자료, 웹에서 내보낸 txt 콘텐츠, AI가 생성한 텍스트 초안 등입니다.
본 사례에서 처리 전 폴더에는 big_bang.txt, black_holes.txt, dark_energy.txt, dark_matter.txt, galaxies.txt 등 여러 txt 파일이 있습니다. 이들은 모두 동일한 종류의 텍스트 자료에 속하므로, 하나씩 열어 숫자 콘텐츠를 수정하면 파일 수가 늘어남에 따라 작업량이 급격히 증가합니다.

결과 미리 보기: 처리 전에는 숫자가 텍스트에 분산되어 있고, 처리 후에는 AAA로 통일되어 교체됨
처리 전: 여러 숫자를 통일적으로 식별해야 함
처리 전 예제 파일 black_holes.txt에서 본문에는 10, 30 등 여러 숫자가 있습니다. 이 숫자들은 각기 다른 문장에 나타나며 위치가 고정되어 있지 않습니다. 일반적인 정확한 찾기를 사용하면 특정 숫자 하나만 찾을 수 있습니다. 예를 들어 10만 바꿀 수 있고 모든 숫자를 한 번에 포함할 수는 없습니다.

이것이 바로 정규 표현식의 가치입니다. "10", "30", "5", "100"과 같은 구체적인 숫자를 하나씩 지정할 필요 없이 "연속적으로 나타나는 숫자"를 나타내는 규칙 하나만 사용하면 됩니다. 스크린샷에서 사용된 규칙은 \d+이며, 하나 이상의 숫자 문자를 찾는 것으로 이해할 수 있습니다. 이렇게 하면 소프트웨어가 파일을 처리할 때 규칙에 따라 모든 숫자 부분을 식별합니다.
처리 후: 규칙에 부합하는 숫자가 일괄 교체됨
처리가 완료된 후 black_holes.txt를 다시 열면 원래 여러 위치에 있던 숫자들이 AAA로 통일되어 교체된 것을 볼 수 있습니다. 예를 들어 원문에서 반지름, 질량, 거리 등을 나타내던 위치의 숫자들이 모두 동일한 자리 표시 텍스트로 변경되었습니다.

이 결과는 일괄 교체가 단지 특정 고정 단어 하나만 바꾸는 것이 아니라, 규칙에 따라 한 유형의 콘텐츠를 식별했음을 보여줍니다. 일괄 비식별화, 일괄 템플릿화 또는 일괄 텍스트 표준화가 필요한 작업에 이 방식은 반복 작업을 현저히 줄일 수 있습니다.
조작 단계: HeSoft Doc Batch Tool 를 사용하여 텍스트 키워드 일괄 교체
1단계: 텍스트 도구로 이동하여 텍스트 내 키워드 찾기 및 바꾸기 선택
HeSoft Doc Batch Tool 를 열면 왼쪽 도구 분류에서 파일 이름, 폴더 이름, 파일 정리, Word 도구, Excel 도구, PowerPoint 도구, PDF 도구, 텍스트 도구 등 여러 오피스 파일 처리 항목을 볼 수 있습니다. 본 사례에서는 TXT 텍스트 콘텐츠를 처리하므로 왼쪽에서 텍스트 도구를 선택합니다.
텍스트 도구 목록에서 "텍스트 내 키워드 찾기 및 바꾸기"를 클릭합니다. 인터페이스 설명은 이 기능이 텍스트 파일 콘텐츠에서 키워드를 일괄적으로 찾아 바꾸는 데 사용된다고 나타내며, 이 문서에서 달성하려는 목표와 정확히 일치합니다.

이 단계의 목적은 올바른 일괄 처리 기능 모듈로 진입하는 것입니다. 진입하면 소프트웨어는 단계별 워크플로우를 통해 파일 선택, 처리 옵션 설정, 저장 위치 설정 및 처리 시작을 안내하여 일괄 작업의 오류 가능성을 줄여줍니다.
2단계: 처리할 TXT 파일 추가
기능 페이지에 진입하면 먼저 1단계 "처리할 레코드 선택"이 나타납니다. 스크린샷에서 볼 수 있듯이, 페이지 상단에는 파일 추가와 폴더에서 파일 가져오기 두 가지 진입점이 제공됩니다. 파일 수가 적으면 파일 추가를 사용할 수 있고, 여러 txt 파일이 동일한 폴더에 있다면 폴더에서 파일 가져오기를 사용하여 한 번에 여러 파일을 추가하는 것이 더 좋습니다.

예제에는 이미 5개의 txt 파일이 가져와졌으며, 목록에는 일련번호, 이름, 경로, 확장자, 생성 시간, 수정 시간 및 조작 등의 정보가 표시됩니다. 파일에는 big_bang.txt, black_holes.txt, dark_energy.txt, dark_matter.txt, galaxies.txt가 포함되며 확장자는 모두 txt입니다. 하단 요약 영역에는 레코드 수가 5로 표시되어 이번에 5개의 텍스트 파일을 일괄 처리할 것임을 나타냅니다.
이 단계에서는 두 가지 점을 중점적으로 확인해야 합니다. 첫째, 파일 목록에 처리해야 할 모든 txt 파일이 포함되어 있는지 확인합니다. 둘째, 처리할 필요가 없는 파일이 실수로 추가되지 않았는지 확인합니다. 목록에서 처리할 필요 없는 레코드는 작업 열의 삭제 아이콘을 통해 제거할 수 있습니다. 이상 없음을 확인하면 페이지 하단의 다음을 클릭하여 처리 옵션 설정으로 넘어갑니다.
3단계: 수식 퍼지 텍스트 찾기 선택, 정규 표현식 입력
2단계 "처리 옵션 설정"에서는 찾기 방식과 교체할 내용을 설정해야 합니다. 스크린샷에서 볼 수 있듯이, "찾기 방식" 영역에는 정확한 텍스트 찾기와 수식을 사용하여 퍼지 텍스트 찾기 두 가지 옵션이 있습니다. 본 사례는 고정된 숫자가 아닌 모든 숫자를 찾아야 하므로 수식을 사용하여 퍼지 텍스트 찾기를 선택해야 합니다.

다음으로, 왼쪽의 "찾을 키워드 목록"에 입력합니다:
\d+여기서 \d+는 하나 이상의 연속된 숫자와 일치시키는 데 사용되는 일반적인 정규 표현식 작성법입니다. 예를 들어 10, 30, 100, 26000 등이 모두 식별될 수 있습니다. 파일마다 숫자가 다를 수 있으므로, 숫자를 하나씩 입력하는 것보다 이러한 규칙을 사용하는 것이 일괄 처리에 더 적합합니다.
그런 다음, 오른쪽 "교체 후 키워드 목록"에 입력합니다:
AAA이는 왼쪽 규칙과 일치하는 모든 콘텐츠가 AAA로 교체됨을 의미합니다. 스크린샷에서는 좌우 양쪽의 찾기 항목과 교체 항목을 대응시키기 위한 방향 버튼도 볼 수 있습니다. 본 사례에서는 찾기 \d+, 교체 AAA라는 한 세트의 규칙만 필요합니다.
문자의 대소문자를 무시하려면 "추가 옵션"의 관련 설정에 주의를 기울이면 됩니다. 단, 본 사례에서 찾는 것은 숫자이므로 대소문자 옵션은 숫자 일치 결과에 영향을 미치지 않습니다. 설정을 완료했으면 다음을 클릭하여 계속 진행합니다.
4단계: 저장 위치 설정 및 처리 시작
인터페이스 상단의 워크플로우에 따르면, 이후 "저장 위치 설정"과 "처리 시작"이 있습니다. 스크린샷은 처음 두 단계를 중점적으로 보여주지만, 워크플로우 바로부터 소프트웨어가 처리된 파일의 저장 위치를 설정하도록 요구한 후 일괄 처리를 실행할 것이라고 합리적으로 판단할 수 있습니다.
특히 처음 정규 표현식으로 일괄 교체하는 경우, 저장 위치 설정 시 유일한 원본 파일을 직접 덮어쓰지 않는 것이 좋습니다. 처리 결과를 새 폴더에 저장하여 교체 효과가 정확한지 확인한 후, 정식 파일에 사용할지 결정할 수 있습니다. 이렇게 하면 규칙을 잘못 작성하더라도 원본 내용이 되돌릴 수 없게 수정되는 것을 피할 수 있습니다.
저장 위치 설정을 완료한 후 처리 시작 단계로 넘어가 일괄 교체를 실행합니다. 처리가 완료되면 파일 중 하나를 열어 표본 검사하여 숫자가 예상대로 AAA로 교체되었는지 확인합니다.
정규 표현식 \d+의 의미와 숫자 일괄 교체에 적합한 이유
많은 사용자가 "정규 표현식"이라고 하면 복잡하다고 생각하지만, 일괄 오피스 시나리오에서는 소수의 일반적인 작성법만 익혀도 많은 반복적인 문제를 해결할 수 있습니다. 본 사례에서 사용된 \d+는 매우 전형적입니다:
- \d: 숫자 문자를 나타내며, 보통 0에서 9까지 일치시킬 수 있습니다.
- +: 앞의 내용이 한 번 이상 연속해서 나타남을 의미합니다.
- \d+: 조합하면 연속된 숫자 부분과 일치시킵니다.
예를 들어 텍스트에 "10 times", "30 kilometers", "100 solar masses", "26,000 light-years"가 나타날 때, \d+는 그 안의 연속된 숫자 부분을 식별합니다. 주의할 점은, 숫자에 쉼표, 소수점 또는 기타 기호가 포함되어 있으면 일치 효과는 표현식 작성 방식의 영향을 받습니다. 본 사례 스크린샷에서 26,000이 AAA,AAA로 교체된 것을 볼 수 있는데, 이는 쉼표 양쪽의 숫자가 각각 식별되어 교체되었음을 설명합니다. 실제 사용 시에는 자신의 데이터 형식에 맞게 규칙을 설계해야 합니다.
자주 묻는 질문 및 주의 사항
1. 정확한 텍스트 찾기를 사용하지 않는 이유
정확한 찾기는 "black hole"을 "black object"로 바꾸는 것과 같이 고정된 콘텐츠를 교체하는 데 적합합니다. 하지만 모든 숫자를 바꾸려면 구체적인 숫자가 매우 다양할 수 있으므로, 정확한 찾기를 사용하려면 하나씩 나열해야 해서 비효율적이고 누락되기 쉽습니다. 정규식이나 와일드카드 방식이 "동일한 유형의 콘텐츠"를 찾는 데 더 적합합니다.
2. 일괄 교체 전 백업이 필요한가요
백업을 권장합니다. 일괄 처리의 장점은 한 번에 많은 파일을 수정할 수 있다는 것이지만, 규칙을 잘못 작성했을 때 영향 범위가 더 넓어질 수 있다는 의미이기도 합니다. 폴더를 하나 복사해두거나, 소프트웨어의 저장 위치 단계에서 새 출력 디렉터리를 선택할 수 있습니다.
3. 공백으로 교체하면 삭제가 가능한가요
스크린샷 오른쪽에 "입력하지 않으면 삭제를 의미합니다"라고 안내되어 있습니다. 이는 교체 후 키워드 목록에 내용을 입력하지 않으면, 일치하는 텍스트를 삭제하는 데 사용할 수 있음을 의미합니다. 실제 사용 전에 소량의 파일로 먼저 테스트하여 효과가 예상과 일치하는지 확인하는 것이 좋습니다.
4. docx 또는 doc 처리에 적합한가요
이 문서에서 시연하는 것은 TXT 텍스트 도구에서의 일괄 찾기 및 바꾸기입니다. docx, doc 파일과 같은 Word 문서를 처리한다면, 소프트웨어의 Word 도구 관련 기능을 먼저 확인해야 합니다. 파일 형식이 다르면 콘텐츠 구조도 달라지므로, TXT 처리 워크플로우를 Word 문서 처리와 동일하게 간주할 수는 없습니다.
5. 규칙이 복잡할수록 좋은가요
그렇지 않습니다. 일괄 오피스 처리는 안정성과 검증 가능성을 중요시합니다. 간단한 규칙으로 해결할 수 있는 문제라면 지나치게 복잡한 표현식을 작성하지 마세요. 예를 들어 숫자만 바꾼다면 \d+로도 충분히 직관적입니다. 소수점, 쉼표가 포함된 숫자 또는 번호 형식을 일치시키려면 점차적으로 규칙을 확장해 나가면 됩니다.
요약: 일괄 처리 도구로 반복적인 찾기 및 바꾸기 작업 줄이기
이 문서의 예제를 통해, HeSoft Doc Batch Tool 의 "텍스트 내 키워드 찾기 및 바꾸기" 기능을 사용하면 여러 TXT 파일의 숫자를 정규 표현식 규칙에 따라 한 번에 AAA로 교체할 수 있음을 알 수 있습니다. 전체 워크플로우에는 텍스트 도구 선택, 여러 txt 파일 가져오기, 수식 퍼지 텍스트 찾기 설정, 찾기 규칙 및 교체 내용 입력, 저장 위치 설정 및 처리 시작이 포함됩니다.
대량의 텍스트 자료, 로그 파일, 설명 문서 또는 일괄 내보낸 콘텐츠를 자주 처리하는 사용자에게 정규 표현식 일괄 교체는 반복 작업을 현저히 줄일 수 있습니다. 소량의 샘플 파일로 먼저 규칙을 테스트하여 처리 결과가 정확한지 확인한 후, 전체 폴더에 대해 일괄 처리를 수행하는 것이 좋습니다. 이렇게 하면 효율성을 높이면서 텍스트 콘텐츠 교체의 정확성과 일관성을 보장할 수 있습니다.