프로젝트 자료, 고객 파일, 검사 보고서 및 시스템 내보내기 데이터는 종종 번호로 시작하는 이름으로 지정되며, 모두 한 디렉터리에 섞여 있으면 이후 검색 및 보관이 비효율적이 됩니다. 본 문서는 101, 102, 103 번호 파일을 예로 들어 HeSoft Doc Batch Tool 을(를) 사용하여 파일명 분류 및 사용자 정의 정규 표현식으로 번호를 추출하고, 파일을 해당 폴더에 일괄적으로 넣는 방법을 설명하며, txt, docx, xlsx, pdf 등 다양한 사무용 파일에 적용 가능합니다.
프로젝트 관리, 고객 자료 보관, 재무 증빙 정리, 검사 보고서 배포 등의 사무 환경에서 파일 이름에는 종종 번호가 포함됩니다. 예를 들어 프로젝트 번호 101, 고객 번호 102, 배치 번호 103 등이 파일 이름 시작 부분에 표시됩니다. 이러한 명명 방식은 원래 식별을 용이하게 하기 위한 것이지만, 모든 파일을 동일한 폴더에 저장하면 파일 수가 증가함에 따라 폴더가 점점 더 혼란스러워집니다.
많은 사람들이 가장 직접적인 방법을 사용합니다. 이름순으로 정렬하여 101로 시작하는 파일은 101 폴더로, 102로 시작하는 파일은 102 폴더로 끌어다 놓는 것입니다. 문제는 이 방식이 수동 판단에 의존하기 때문에 수십 개의 파일을 처리할 때는 괜찮지만 수백 개의 파일을 처리할 때는 효율성이 현저히 떨어진다는 점입니다. 더 번거로운 점은 txt, docx, doc, xlsx, xls, pdf 및 이미지 등 파일 유형이 혼합되면 수동 분류 시 누락이 더 쉽게 발생한다는 것입니다.
이처럼 "파일명에 규칙이 있고 분류 작업이 반복되는" 업무는 오피스 소프트웨어를 사용하여 일괄 처리할 수 있습니다. 본문에서는 스크린샷과 함께 HeSoft Doc Batch Tool 의 조작 방법을 소개합니다. "파일명으로 파일 분류" 기능을 통해 사용자 정의 정규식으로 분류를 선택하고, 파일명의 앞 세 자리 숫자를 추출하여 파일을 101, 102, 103 등의 폴더로 일괄 정리합니다.
적용 시나리오: 프로젝트 번호, 고객 번호, 배치 번호를 분류 기준으로 사용 가능
본문 예시에서는 파일명 앞 세 자리 숫자를 추출하지만, 이것이 단순히 숫자 자체만을 의미하는 것은 아닙니다. 실제 업무에서 이 번호 구간은 명확한 비즈니스적 의미를 가질 수 있습니다.
- 프로젝트 번호: 101은 A 프로젝트, 102는 B 프로젝트, 103은 C 프로젝트를 나타냅니다.
- 고객 번호: 다른 고객의 계약서, 첨부 파일, 견적서를 번호별로 분류합니다.
- 부서 번호: 각 부서에서 제출한 자료를 부서 코드별로 나누어 저장합니다.
- 배치 번호: 검사 보고서, 생산 기록, 물류 자료를 배치별로 정리합니다.
- 지역 번호: 다른 지역의 데이터 파일을 지역 코드별로 그룹화합니다.
분류 정보가 파일명에 일정하게 나타나기만 하면 규칙을 통해 추출할 수 있습니다. 수동 분류와 비교할 때, 와일드카드 또는 정규식의 장점은 재사용 가능하다는 점입니다. 규칙을 설정해 놓으면 후속으로 유사한 파일에 바로 적용할 수 있어 매번 다시 판단할 필요가 없습니다.
효과 미리보기: 무질서한 파일에서 번호별 분류까지
처리 전: 파일명 접두사는 다르지만 모두 한곳에 쌓여 있음
처리 전 스크린샷에서 파일 목록은 이미 이름순으로 정렬된 것처럼 보이지만, 101, 102, 103으로 시작하는 파일은 여전히 같은 디렉토리 안에 있습니다. 빨간색 화살표는 이러한 번호를 표시하여 파일명 자체가 이미 분류 기준을 제공하고 있음을 보여줍니다.

이것이 프로젝트 자료 디렉토리라면, 101로 시작하는 파일은 한 프로젝트에, 102로 시작하는 파일은 다른 프로젝트에, 103으로 시작하는 파일은 세 번째 프로젝트에 속할 수 있습니다. 혼재되어 있으면 추후 찾기도 불편하고 프로젝트별로 묶어 전달하기도 어렵습니다.
처리 후: 각 번호가 하나의 폴더에 대응됨
처리 후 스크린샷에는 파일이 101, 102, 103 세 개의 폴더로 정리된 모습이 표시됩니다. 이 결과는 파일명 시작 부분에서 동일한 번호와 일치하는 파일이 같은 분류 폴더에 배치될 것이라는 우리의 예상과 일치합니다.

이러한 정리를 마치면 디렉토리 구조가 팀 협업에 더 적합해집니다. 프로젝트 책임자는 해당 프로젝트 폴더를 직접 확인할 수 있고, 고객 자료는 고객 번호별로 전달할 수 있으며, 분류 담당자도 각 번호 아래의 파일이 완전한지 신속하게 확인할 수 있습니다.
조작 단계: 정규식으로 번호를 추출하여 일괄 분류
1단계: 파일 정리 도구를 열고 파일명 분류 선택
HeSoft Doc Batch Tool 를 열고 왼쪽 기능 탐색에서 "파일 정리"를 클릭합니다. 오른쪽에는 파일 정리와 관련된 여러 기능이 표시됩니다. 이번에는 파일명의 프로젝트 번호나 고객 번호에 따라 분류할 것이므로 "파일명으로 파일 분류"를 선택합니다.

유의할 점은, 여기서 선택한 것은 확장자 분류가 아닌 파일명 분류라는 것입니다. 확장자 분류는 txt, docx, pdf 등을 유형별로 나누는 데 적합하며, 파일명 분류는 101, 102, 103과 같은 비즈니스 번호를 나누는 데 적합합니다. 둘은 해결하는 문제가 다르므로 선택하기 전에 자신의 정리 기준을 명확히 해야 합니다.
2단계: 정리할 파일을 가져와 목록 확인
기능에 진입하면 첫 단계는 처리할 레코드를 선택하는 것입니다. "파일 추가"를 클릭하여 하나씩 추가하거나 "폴더에서 파일 가져오기"를 클릭하여 디렉토리 전체의 파일을 일괄 가져올 수 있습니다. 예시 스크린샷에는 파일이 목록으로 가져와져 이름, 경로, 확장자, 생성 시간 및 수정 시간이 명확하게 표시됩니다.

표에서 파일명은 101LON05417.txt, 101LON09060.txt 등이며, 경로는 D:\test에 위치하고 확장자는 txt임을 볼 수 있습니다. 하단의 레코드 수는 20으로 표시되어 이번에 처리 대기 중인 파일 레코드가 총 20개임을 의미합니다. 목록을 확인하는 목적은 일괄 처리에 참여할 파일 범위가 정확한지 확인하는 것입니다. 디렉토리에 임시 파일, 관련 없는 파일 또는 명명 규칙에 맞지 않는 파일이 있다면 분류 결과에 영향을 주지 않도록 미리 제외하는 것이 좋습니다.
파일 목록에 이상이 없는지 확인한 후 "다음"을 클릭하여 처리 옵션 설정으로 넘어갑니다.
3단계: 사용자 정의 정규식으로 분류 선택
처리 옵션 설정 페이지에서 인터페이스는 다양한 분류 방식을 제공합니다. 간단한 시나리오에서는 첫 번째 문자, 첫 번째 숫자, 처음 몇 문자 등으로 분류할 수 있으며, 보다 유연한 사무 규칙을 위해 "사용자 정의 정규식으로 분류"를 사용하는 것이 좋습니다. 스크린샷에는 이미 이 옵션이 선택되어 있습니다.

본 예시의 규칙은 파일명 시작 부분의 세 자리 숫자를 추출하는 것이므로 정규식 입력란에 ^\d{3}을 기입합니다. 이는 세 부분으로 나누어 이해할 수 있습니다. ^는 파일명 시작, \d는 숫자, {3}은 세 자리 일치를 의미합니다. 최종 추출 결과는 101, 102, 103이 됩니다.
일반 와일드카드와 비교했을 때, 정규식은 "어디서부터 시작할지, 어떤 문자를 취할지, 몇 개의 문자를 취할지"를 설명하는 데 더 적합합니다. 파일명 시작 부분에 두 자리 문자와 세 자리 숫자가 오는 등 더 복잡한 파일명 규칙을 다루는 경우에도 규칙을 숙지한 후 표현식을 조정할 수 있습니다. 하지만 본 예시에서는 ^\d{3}으로 충분히 정확합니다.
페이지 하단에는 "기본값", "대문자로 변환", "소문자로 변환"을 포함한 "문자 대소문자 변환" 설정도 있습니다. 본 예시의 분류 기준은 숫자이므로 대소문자 변경이 필요 없으니 기본값을 유지하면 됩니다. 설정을 마친 후 "다음"을 클릭합니다.
4단계: 저장 위치를 선택하고 처리를 시작합니다
페이지 흐름에 따라 이후 "저장 위치 설정" 및 "처리 시작"으로 이동해야 합니다. 저장 위치는 특히 특정 정규식 규칙을 처음 사용하는 경우 새로운 대상 디렉토리를 선택하는 것이 좋습니다. 이렇게 하면 원본 파일과 처리 결과를 비교하기 쉽습니다. 확인 난이도를 높이지 않도록 중요한 디렉토리를 함부로 덮어쓰거나 혼용하지 마십시오.
처리를 시작하면 소프트웨어가 목록에 따라 파일명을 하나씩 분석하고, 일치하는 번호를 추출하여 해당 번호에 따라 분류 폴더를 만들거나 사용합니다. 예시 파일의 경우, 101로 시작하는 파일은 101 폴더로, 102로 시작하는 파일은 102 폴더로, 103으로 시작하는 파일은 103 폴더로 분류됩니다. 처리가 완료되면 출력 디렉토리에서 최종 폴더 구조를 확인할 수 있습니다.
자주 묻는 질문 및 주의사항
1. 정규식 규칙은 txt 파일에만 사용할 수 있나요
아닙니다. 예시 파일이 txt인 것은 스크린샷의 데이터가 표시하기 편리하기 때문입니다. 파일명으로 분류하는 것은 파일 내용을 읽지 않으므로, 이름이 규칙에만 맞으면 Word 문서(docx/doc), Excel 표(xlsx/xls), PDF 파일, 프레젠테이션(pptx/ppt) 및 이미지 파일 모두 유사한 규칙을 사용할 수 있습니다.
2. 파일명 시작 부분이 세 자리 숫자가 아니면 어떻게 하나요
실제 명명 방식에 따라 표현식을 수정해야 합니다. 예를 들어 시작 부분이 네 자리 프로젝트 번호라면 ^\d{4}를 사용할 수 있고, 시작 부분이 두 자리 문자라면 문자를 일치시키는 규칙을 고려할 수 있습니다. 핵심은 규칙이 파일명 구조와 일관성을 유지하도록 하는 것입니다.
3. 일부 파일이 예상 폴더에 들어가지 않는 이유는 무엇인가요
흔한 원인은 파일명이 표현식에 맞지 않기 때문입니다. 예를 들어 파일명 앞에 공백, 밑줄, 한글 설명이 있거나 번호가 시작 위치에 있지 않은 경우입니다. 사용 전에 파일 목록을 먼저 확인하여 명명 구조를 파악하는 것이 좋습니다. 규칙이 통일되지 않은 것을 발견하면 파일명을 먼저 정리한 후 일괄 분류를 실행하는 것도 방법입니다.
4. 일괄 정리 전에 무엇을 준비해야 하나요
중요 파일을 미리 백업하거나 출력 위치를 새 디렉토리로 설정하는 것이 좋습니다. 그다음 소량의 샘플로 정규식을 먼저 테스트합니다. 마지막으로 처리된 폴더명이 예상과 일치하는지 확인합니다. 이렇게 하면 일괄 처리로 인한 오작업 위험을 줄일 수 있습니다.
요약: 오피스 소프트웨어로 규칙화된 파일을 표준 디렉토리로 정리하기
프로젝트 번호나 고객 번호로 파일을 일괄 정리하는 것은 본질적으로 파일명의 규칙 정보를 폴더 구조로 변환하는 것입니다. HeSoft Doc Batch Tool 의 "파일명으로 파일 분류" 기능을 통해 이러한 반복 작업을 한 번의 설정으로 완료할 수 있습니다. 파일을 가져온 후 "사용자 정의 정규식으로 분류"를 선택하고 ^\d{3}을 입력한 다음 저장 위치를 설정하고 처리를 시작하면 101, 102, 103 등의 번호가 매겨진 파일이 해당 폴더로 자동 분류됩니다.
업무에서 프로젝트 자료, 고객 파일, 배치 보고서 또는 시스템에서 내보낸 데이터를 자주 정리해야 한다면 이러한 일괄 처리 방식을 우선적으로 채택하는 것이 좋습니다. 수동으로 새 폴더를 만들고 파일을 드래그하는 시간을 절약할 수 있을 뿐만 아니라 분류 기준을 더욱 통일성 있게 만들어 잘못 배치하거나 누락하는 경우를 줄여, 파일 관리가 진정한 사무 효율 향상에 도움이 되도록 합니다.