많은 번호로 시작하는 파일을 수동으로 분류하면 시간이 많이 걸리고 오류가 발생하기 쉽습니다. 이 글에서는 "파일명에 101, 102, 103 등 번호가 포함된 파일을 자동으로 정리하는 방법"에 대해 HeSoft Doc Batch Tool 에서 파일을 가져오고, 파일명으로 분류를 선택한 후, 사용자 정의 정규식을 사용하여 파일명의 처음 세 자리 숫자를 추출하여 최종적으로 해당 폴더를 자동 생성하고 같은 번호의 파일을 한곳에 모으는 방법을 설명합니다.
많은 사무 자료가 생성될 때부터 번호를 가지고 있지만, 저장할 때는 여전히 같은 디렉토리에 쌓여 있는 경우가 많습니다. 예를 들어 업무 시스템에서 내보낸 텍스트 파일, 장비 로그, 고객 첨부 파일, 일괄 다운로드한 보고서, 스캔 후 문서 등 파일 이름이 101LON05417.txt, 102SYD15496.txt, 103LON28360.txt와 같은 형식일 수 있습니다. 파일 이름 앞의 101, 102, 103은 이미 서로 다른 카테고리에 속한다는 것을 나타내지만, 자동 정리 도구가 없으면 사용자는 여전히 하나씩 선택, 복사, 이동해야 하므로 시간이 매우 낭비됩니다.
본 문서는 사무 환경에 적합한 일괄归档 방법을 소개합니다. " HeSoft Doc Batch Tool "의 파일 이름별로 파일 분류 기능을 사용하여, 와일드카드 개념과 정규 표현식 규칙을 통해 파일 이름에서 번호를 추출하고 자동으로 분류 폴더를 생성합니다. 예시에서는 ^\d{3}을 사용하여 파일 이름 시작 부분의 세 자리 숫자를 매칭하여, 소프트웨어가 자동으로 101로 시작하는 파일은 101 폴더에, 102로 시작하는 파일은 102 폴더에, 103으로 시작하는 파일은 103 폴더에 넣도록 합니다.
이 방법의 핵심은 특정 파일 형식이 아니라 "파일 이름 규칙"입니다. 따라서 예시 스크린샷은 TXT 파일이지만, doc, docx, xls, xlsx, ppt, pptx, PDF, JPG, PNG 등 사무용 파일에도 동일하게 적용됩니다. 파일 이름에 추출 가능한 분류 정보가 있으면 일괄 처리 소프트웨어를 사용하여 반복 작업을 줄이고 파일 정리 효율성을 높일 수 있습니다.
적용 시나리오: 파일 이름에 번호, 코드, 날짜가 있을 때 특히 적합
이름이 비슷하지만 분류가 다른 여러 파일을 자주 접한다면 파일 이름별 자동 분류 사용에 매우 적합합니다. 예를 들어, 기업 자료에서 흔히 볼 수 있는 명명 방식은 다음과 같습니다. 고객 번호 + 도시 코드 + 일련번호, 프로젝트 번호 + 파일 유형 + 날짜, 부서 번호 + 직원 번호 + 양식 이름, 장비 번호 + 로그 유형 + 타임스탬프. 이러한 파일의 경우, 실제归档 위치를 결정하는 것은 파일 이름의 작은 문자열 조각일 뿐입니다.
수동으로 정리할 때는 파일 이름을 확인하고, 어떤 카테고리에 속하는지 판단한 다음, 새 폴더를 만들고 파일을 이동해야 합니다. 개수가 적으면 괜찮지만, 개수가 많아지면 오류율이 현저히 높아집니다. 예를 들어 102로 시작하는 파일을 실수로 101 폴더에 끌어다 놓거나 특정 파일을 누락하면 나중에 찾을 때 문제가 발생합니다. 일괄 처리 도구의 장점은 규칙이 일관되고 실행이 안정적이어서, 규칙만 올바르게 설정하면 동일한 기준으로 모든 파일을 처리할 수 있습니다.
본 문서의 번호는 파일 이름 시작 부분에 위치하며 길이는 세 자리 숫자로 고정되어 있으므로 정규 표현식을 사용한 매칭에 매우 적합합니다. 정규 표현식은 더 정확한 와일드카드 규칙으로 이해할 수 있습니다. 일반 와일드카드는 보통 "임의의 문자" 또는 "임의의 개수 문자"를 나타내는 데 사용되지만, 정규 표현식은 위치, 문자 유형 및 길이를 추가로 제한할 수 있습니다. "파일 이름 앞 세 자리가 숫자"라는 요구 사항에 대해 ^\d{3}는 간결하고 정확한 표현입니다.
결과 미리보기: 처리 전 파일에는 번호가 있지만 여전히 섞여 있음
처리 전 스크린샷에서 파일 목록에는 101, 102, 103으로 시작하는 파일이 동시에 존재합니다. 사용자는 파일 이름을 통해 서로 다른 분류에 속해야 한다는 것을 알 수 있지만, 파일 자체는 아직 다른 폴더에 들어가 있지 않습니다. 이때 모든 101 파일을 한곳에 모으려면 보통 먼저 정렬하거나 검색한 다음 수동으로 선택하여 이동해야 합니다.

볼 수 있듯이, 101 그룹 파일에는 101LON05417.txt, 101LON09060.txt, 101SYD60290.txt 등이 포함됩니다. 102 그룹 파일에는 102LON48897.txt, 102NYC53821.txt, 102TYO76564.txt 등이 포함됩니다. 103 그룹 파일에는 103LON23328.txt, 103LON26108.txt, 103SYD61045.txt 등이 포함됩니다. 파일 이름의 패턴은 매우 명확하지만, 파일이 수백 개로 확장되면 수동 분류는 반복적이고 지루하며 실수하기 쉬운 작업이 됩니다.
결과 미리보기: 처리 후 동일 번호 파일이 해당 폴더에 들어감
일괄 분류를 실행하면, 소프트웨어는 파일 이름 시작 부분에서 추출된 번호에 따라 101, 102, 103 세 개의 폴더를 생성합니다. 이러한 정리 결과는 자료 관리 습관에 더 적합하며, 추후 번호별로 찾거나, 압축하거나, 백업하거나, 보내는 데도 편리합니다.

처리 후의 이점은 직접적입니다. 폴더 이름이 곧 분류 값이므로 추가로 설명 문서를 만들 필요가 없습니다. 동일한 번호의 파일이 한곳에 모여 있어 찾는 비용이 줄어듭니다. 이후에 동일한 유형의 파일이 더 생겨도 동일한 규칙으로 계속 분류하여 보관할 수 있어 디렉토리 구조의 통일성을 유지할 수 있습니다.
조작 단계: HeSoft Doc Batch Tool 로 번호별로 폴더를 일괄 생성
1단계: 파일 정리 기능 열기, 파일 이름별 분류로 진입
HeSoft Doc Batch Tool 를 시작한 후, 왼쪽 탐색 모음에서 파일 정리를 찾습니다. 파일 정리 모듈은 파일 분류, 정리,归档 등 일괄 사무 작업을 지향합니다. 해당 모듈에 들어가면 파일 이름별로 파일 분류를 선택합니다.

이 단계의 목적은 올바른 일괄 처리 유형을 선택하는 것입니다. 소프트웨어 인터페이스에서는 확장자별 분류, 기존 폴더에 따라 새 폴더 생성, 파일 시스템 속성의 시간 수정 등 다른 도구도 볼 수 있지만, 본 문서에서 구현하려는 것은 "파일 이름의 번호에 따라 분류 폴더 생성"이므로 "파일 이름별로 파일 분류"를 선택해야 합니다. 선택하면 소프트웨어는 단계별 안내가 있는 처리 인터페이스로 진입합니다.
2단계: 정리할 파일 가져오기, 먼저 목록이 올바른지 확인
기능 페이지에 진입하면 먼저 "처리할 레코드 선택" 단계에 도달합니다. 인터페이스 상단에는 파일 추가와 폴더에서 파일 가져오기가 제공됩니다. 파일이 모두 동일한 디렉토리에 있다면 "폴더에서 파일 가져오기"를 사용하는 것이 좋습니다. 일부 파일만 처리하고 싶다면 실제 상황에 따라 "파일 추가"를 사용할 수 있습니다.

파일을 가져오면 목록에 이름, 경로, 확장자, 생성 시간, 수정 시간 등의 정보가 표시됩니다. 스크린샷에서 파일 경로는 D:\test 아래의 여러 txt 파일이며, 레코드 수는 20개임을 확인할 수 있습니다. 이 목록은 처리 전의 작업 목록에 해당하므로, 다음 단계로 진행하기 전에 한 번 확인하는 것이 좋습니다. 파일 개수가 대략적으로 맞는지, 파일 확장자가 예상과 일치하는지, 이름에 실제로 추출할 번호가 포함되어 있는지 확인하세요.
파일 이름에 여러 숫자 세그먼트가 동시에 포함된 경우, 이번에 추출할 세그먼트가 어느 것인지 특히 확인해야 합니다. 본 문서의 번호는 시작 부분에 있으므로, 나중에 "시작 부분 한정"이 있는 정규 표현식을 사용할 것입니다. 번호가 시작 부분이 아니라 중간이나 끝에 있다면 실제 명명 규칙에 맞는 규칙으로 변경해야 합니다.
3단계: 사용자 정의 정규 표현식으로 분류 선택
파일 목록을 확인한 후 하단의 다음을 클릭하여 "처리 옵션 설정"으로 들어갑니다. 이 페이지에서는 첫 글자로 분류, 첫 숫자로 분류, 첫 영문자로 분류, 시작 부분의 몇 글자로 분류, 끝 부분의 몇 글자로 분류 등 다양한 분류 방식을 제공합니다. 간단한 규칙의 경우 이러한 옵션으로 충분하지만, "파일 이름 시작 연속 세 자리 숫자"를 더 정확하게 매칭하려면 사용자 정의 정규 표현식으로 분류를 사용하는 것이 더 확실합니다.

인터페이스에서 사용자 정의 정규 표현식으로 분류를 선택한 다음, 정규 표현식 입력란에 다음을 입력합니다.
^\d{3}
여기서의 논리는 다음과 같습니다. 파일 이름의 시작 위치에서만 찾기 시작하고, 연속된 세 자리 숫자만 가져옵니다. 101LON05417.txt를 예로 들면, 매칭 결과는 101입니다. 102LON48897.txt를 예로 들면, 매칭 결과는 102입니다. 103PAR08578.txt를 예로 들면, 매칭 결과는 103입니다. 소프트웨어는 이러한 매칭 결과를 분류 기준으로 사용하므로, 최종적으로 101, 102, 103 등의 폴더가 형성됩니다.
"시작 부분의 몇 글자로 분류"를 직접 선택하면 특정 고정 길이 시나리오에서 비슷한 효과를 볼 수도 있지만, 정규 표현식은 "반드시 숫자여야 한다"는 것을 명확하게 제한하므로 장기적인 재사용에 더 적합합니다. 어떤 파일 이름이 세 자리 숫자로 시작하지 않으면, 동일한 유형의 번호로 잘못 처리되지 않으므로, 이는 표준화된 정리에 더 도움이 됩니다.
4단계: 대소문자 기본값 유지, 저장 위치 설정 계속
동일한 페이지 하단에서 "알파벳 대소문자 변환" 설정을 볼 수 있으며, 옵션에는 기본값, 대문자로 변환, 소문자로 변환이 포함됩니다. 본 문서에서는 숫자 번호를 추출하므로 대소문자가 결과에 영향을 미치지 않으므로 기본값을 유지하면 됩니다.
설정을 완료한 후 다음을 클릭하여 "저장 위치 설정"으로 들어갑니다. 인터페이스 흐름에는 이 단계가 명확하게 표시되어 있으며, 일괄 분류된 파일을 어디에 저장할지 지정하는 데 사용됩니다. 결과를 대조하기 쉽도록, 원본 파일과 혼동을 피하기 위해 명확한 출력 디렉토리를 선택하는 것이 좋습니다. 중요한 자료의 경우, 정식 처리 전에 먼저 샘플 파일을 복사하여 테스트하고, 분류 결과가 올바른지 확인한 후 전체 파일을 일괄 처리하는 것이 좋습니다.
5단계: 처리 시작 및 분류 결과 확인
저장 위치 설정을 완료하면 흐름의 "처리 시작"으로 들어갑니다. 소프트웨어는 가져온 파일 목록에 따라 파일 이름을 하나씩 읽어 들여, 정규 표현식을 사용하여 분류 값을 추출한 다음, 해당 폴더를 생성하고 파일을 그 안에 넣습니다. 처리가 끝나면 저장 디렉토리를 열어 101, 102, 103으로 명명된 폴더를 볼 수 있습니다.
결과를 확인할 때는 두 가지에 중점을 둘 수 있습니다. 첫째, 폴더 이름이 예상과 일치하는지, 둘째, 동일한 번호 아래의 파일이 모두 해당 폴더에 들어갔는지입니다. 이것들이 모두 맞다면, 이 규칙을 동일한 유형의 더 많은 파일에 계속 적용할 수 있습니다. 앞으로 동일한 명명 규칙을 가진 TXT, Word, Excel 또는 PDF 파일을 만나도 동일한 아이디어로 일괄归档할 수 있습니다.
규칙 확장: 다양한 파일 명명 방식에 따른 조정 방법
본 문서 예시에서는 ^\d{3}을 사용했으며, 이는 "파일 이름 시작이 세 자리 숫자"인 경우에 적합합니다. 파일 이름 접두사 길이가 다르면 중괄호 안의 숫자를 조정할 수 있습니다. 예를 들어, 파일 이름 시작이 두 자리 부서 번호라면 ^\d{2}를 사용할 수 있습니다. 시작이 네 자리 연도 또는 프로젝트 번호라면 ^\d{4}를 사용할 수 있습니다.
파일 이름 시작이 숫자가 아니라 알파벳 코드인 경우, 예를 들어 HR001.docx, FIN2026.xlsx, OPS-log.pdf와 같다면 알파벳 규칙에 따라 표현식을 설정해야 합니다. 인터페이스에서도 첫 영문자로 분류 등의 옵션을 제공하므로, 사용자는 복잡도에 따라 더 간단한 내장 방식을 선택하거나 사용자 정의 정규 표현식을 계속 사용할 수 있습니다. 원칙은 다음과 같습니다. 규칙이 파일 이름에 더 잘 맞을수록 분류 결과가 더 정확해집니다.
파일 이름에 한글 분류가 포함된 경우, 예를 들어 "재무-비용 청구서-001.pdf", "인사-계약-002.docx"와 같다면, 먼저 구분자와 필드 위치를 관찰할 수 있습니다. 시작 부분의 몇 글자로만 분류한다면 인터페이스의 "시작 부분의 몇 글자로 분류"를 고려할 수 있습니다. 더 복잡한 세그먼트를 매칭해야 한다면 사용자 정의 정규 표현식을 사용하는 것이 더 유연합니다.
자주 묻는 질문 및 주의사항
1. 왜 101, 102, 103 폴더를 직접 수동으로 만들지 않나요?
파일이 10여 개뿐일 때는 수동 조작도 번거롭지 않아 보입니다. 하지만 사무 환경의 파일 수는 종종 지속적으로 증가하며, 분류 규칙도 반복적으로 사용됩니다. 일괄 처리 도구를 사용하는 의미는 규칙을 조작 아이디어로 저장하여, 매번 반복적인 판단과 드래그 시간을 줄이고, 사람이 폴더를 잘못 넣을 위험도 낮추는 데 있습니다.
2. 정규 표현식이 파일 내용에 영향을 미치나요?
본 문서의 작업은 파일 이름으로 분류하는 것이며, 규칙은 파일 이름의 일부 문자열을 분류 기준으로 추출하는 데 사용되며 파일 내용을 편집하는 것이 아닙니다. docx, xlsx, PDF, txt 등의 파일의 경우, 분류 기준은 모두 파일 이름 자체입니다. 단, 안전을 위해 중요한 자료는 일괄 처리 전에 백업하거나 샘플로 먼저 테스트하는 것을 권장합니다.
3. 파일 이름 시작에 세 자리 숫자가 없으면 어떻게 하나요?
일부 파일 이름이 ^\d{3} 규칙에 맞지 않으면, 본 문서의 규칙에 따라 101, 102, 103과 같은 분류 값을 추출할 수 없습니다. 처리 전에 먼저 명명 규칙을 통일하거나, 실제 상황에 더 맞는 분류 방식을 선택해야 합니다. 예를 들어 첫 영문자로 분류, 시작 부분의 몇 글자로 분류, 사용자 정의 위치 범위 내 문자로 분류 등은 모두 인터페이스에서 볼 수 있는 처리 옵션입니다.
4. 대량의 파일을 처리할 때 어떤 제안이 있나요?
먼저 소량의 파일로 규칙을 검증하여 출력 디렉토리와 분류 결과가 모두 올바른지 확인한 후, 대량의 파일을 가져오는 것이 좋습니다. 업무 시스템에서 내보낸 파일의 경우, 규칙의 안정적인 매칭을 위해 원본 이름을 그대로 유지하는 것이 가장 좋습니다. 파일 이름에 공백, 특수 기호가 있거나 대소문자가 통일되지 않은 경우, 이러한 문자들이 분류에 영향을 미칠지 사전에 확인해야 합니다.
요약: 수동 드래그 대신 규칙으로 사무 파일 분류를 더 안정적으로
파일 이름 번호별 분류는 매우 흔한 사무 요구 사항입니다. 본 문서는 101, 102, 103으로 시작하는 TXT 파일 예시를 통해, HeSoft Doc Batch Tool 에서 "파일 이름별로 파일 분류"를 사용하고, 사용자 정의 정규 표현식으로 분류를 통해 ^\d{3}을 입력하여 파일 이름 앞 세 자리 숫자를 자동으로 추출하고, 해당 폴더를 일괄 생성하는 방법을 시연했습니다.
이 방법의 가치는 반복 가능하고, 확장 가능하며, 효율성이 높다는 데 있습니다. 텍스트 로그, Word 문서 docx, Excel 표 xlsx, PDF 보고서, 이미지 스캔본 등 무엇을 정리하든, 파일 이름에 안정적인 번호나 분류 코드가 포함되어 있다면 동일한 아이디어로 일괄 처리를 고려할 수 있습니다. 먼저 소량의 파일을 골라 규칙을 테스트하고, 정확성을 확인한 후 전체 디렉토리를 처리하여, 파일 정리를 수작업에서 규칙 기반의 자동归档으로 전환하는 것을 권장합니다.