파일 이름에 번호, 고객 코드, 지역 코드 또는 프로젝트 코드가 포함된 파일이 많을 경우, 수동으로 폴더를 만들고 파일을 하나씩 이동하는 것은 매우 시간이 많이 소요됩니다. 이 문서에서는 파일 이름 시작 부분의 101, 102, 103을 예로 들어 HeSoft Doc Batch Tool 의 "파일 이름별 파일 분류" 기능을 사용하는 방법을 설명합니다. 사용자 정의 정규 표현식 ^\d{3}을 통해 파일 이름의 처음 세 자리 숫자를 추출하고, 해당 분류 폴더를 일괄 생성하여 같은 유형의 파일을 한곳에 모을 수 있습니다.
일상 업무에서 많은 파일들이 완전히 무질서하게 쌓여 있는 경우는 드물며, 파일명에 이미 분류에 사용할 정보가 포함되어 있는 경우가 많습니다. 예를 들어 101LON05417.txt, 102NYC53821.txt, 103PAR08578.txt 같은 파일은 앞 부분의 101, 102, 103이 부서, 고객, 배치, 도시, 프로젝트 또는 주문 유형을 나타낼 수 있습니다. 문제는 파일 수가 수십 개에서 수백, 수천 개로 늘어나면, 사람이 일일이 파일명을 확인하고 폴더를 생성한 후 드래그하여 이동하는 방식은 효율이 낮을 뿐만 아니라 파일을 잘못된 위치에 넣기 쉽다는 점입니다.
이 글에서 해결하고자 하는 것은 바로 이러한 전형적인 파일명 기준 대량 파일 분류 문제입니다. 업무용 소프트웨어 " HeSoft Doc Batch Tool "의 파일 정리 기능을 사용하여, 사용자 정의 정규 표현식을 통해 파일명 앞의 세 자리 숫자를 추출하고, 소프트웨어가 자동으로 파일을 해당 폴더로 분류하도록 할 것입니다. 예시에서 파일명이 101로 시작하는 파일은 101 폴더에, 102로 시작하는 파일은 102 폴더에, 103으로 시작하는 파일은 103 폴더에 각각 저장됩니다. 이 방법은 TXT 텍스트 파일뿐만 아니라 Word 문서(doc, docx), Excel 스프레드시트(xls, xlsx), PDF, 이미지, 압축 파일 등 일반적인 업무 파일에도 적용 가능하며, 파일명에 안정적인 분류 규칙이 있으면 됩니다.
적용 시나리오: 정규 표현식으로 파일명 기준 대량 분류에 적합한 파일
'파일명 기준 분류'는 파일명에 일정한 규칙이 있는 자료를 처리하는 데 적합합니다. 예를 들어 파일명 앞부분이 고객 번호이고 그 뒤에 업무 유형과 일련번호가 오는 경우, 파일명 첫 몇 자리가 프로젝트 번호이고 그 뒤에 도시 약자 또는 날짜가 오는 경우, 파일명 끝에 버전 번호, 월, 연도가 포함된 경우, 또는 파일명 중간 고정 위치에 부서 코드가 있는 경우 등이 있습니다. 이러한 정보들을 와일드카드나 정규 표현식으로 추출할 수 있다면 분류 기준으로 삼을 수 있습니다.
본문 스크린샷의 TXT 파일을 예로 들면, 파일명 구조는 대략 '세 자리 숫자 + 영문 코드 + 숫자 번호 + 확장자'입니다. 우리가 필요한 분류 기준은 바로 파일명 맨 앞의 세 자리 숫자이므로, 정규 표현식 ^\d{3}을 사용하여 매칭할 수 있습니다. '^'는 파일명 시작 부분부터 매칭함을 의미하며, '\d'는 숫자를, '{3}'은 숫자가 3회 연속 등장함을 의미합니다. 즉, 소프트웨어는 각 파일명 시작 부분에서 세 자리 숫자를 추출하여 분류 폴더명으로 사용합니다.
이 방법은 특히 다음과 같은 업무 시나리오에 적합합니다: 재무 증빙을 공급업체 코드로 보관, 검사 보고서를 장비 번호로 보관, 업무 첨부 파일을 고객 번호로 보관, 프로젝트 자료를 프로젝트 코드로 보관, 사진이나 스캔본을 배치 번호로 보관, 로그 파일을 서버나 모듈 번호로 보관. 수동 정리에 비해 파일을 일괄 처리하면 반복 작업을 줄이고 폴더 구조를 더 명확하게 하며, 추후 검색, 백업 및 인계에도 편리합니다.
결과 미리 보기: 처리 전, 파일들이 한 디렉터리에 혼재된 상태
처리 전에는 모든 파일이 동일한 폴더 안에 있습니다. 파일명 맨 앞을 보면 101, 102, 103 세 그룹임을 이미 알 수 있지만, 파일들은 여전히 혼재되어 있습니다. 파일이 많은 경우 특정 번호의 모든 자료를 찾으려면 정렬, 검색 또는 수동으로 일일이 필터링해야 합니다.

처리 전 스크린샷을 보면 파일명 왼쪽에 앞 세 자리 숫자가 표시된 것을 볼 수 있습니다. 예를 들어 101LON05417.txt, 101SYD26137.txt는 모두 101에 속하고, 102LON48897.txt, 102NYC53821.txt는 102에, 103LON23328.txt, 103PAR08578.txt는 103에 속합니다. 사람이 직접 보면 규칙을 알 수 있지만, 문제는 그 수가 많아지면 수동 작업 비용이 급격히 증가한다는 점입니다. 업무용 소프트웨어를 사용하여 일괄 정리하는 가치는 바로 여기에 있습니다. 규칙에 따라 반복 작업을 실행하도록 하여, 사용자는 분류 규칙을 한 번만 설정하면 됩니다.
결과 미리 보기: 처리 후 101, 102, 103 분류 폴더 자동 생성
처리가 완료되면 원래 혼재되어 있던 파일들은 파일명 앞의 세 자리 숫자에 따라 해당 폴더로 분류됩니다. 예시 결과에서 소프트웨어가 101, 102, 103 세 개의 폴더를 생성한 것을 볼 수 있으며, 이는 파일명에서 추출된 세 개의 분류 값을 나타냅니다.

이러한 결과는 매우 직관적입니다. 이후 101에 해당하는 파일을 보려면 101 폴더로, 102나 103을 보려면 해당 디렉터리로 바로 이동하면 됩니다. 장기간 유지 관리가 필요한 자료 보관소의 경우, 이러한 디렉터리 구조는 하나의 큰 폴더에 많은 파일을 쌓아두는 것보다 관리하기 훨씬 쉽습니다.
조작 단계: HeSoft Doc Batch Tool 를 사용하여 정규 표현식으로 파일 분류하기
1단계: '파일 정리'로 들어가 '파일명에 따라 파일 분류' 선택
HeSoft Doc Batch Tool 를 실행한 후, 왼쪽 기능 표시줄에서 파일 정리를 선택합니다. 파일 정리 페이지에서는 파일명으로 분류하기, 확장자별 분류하기, 기존 폴더에 따라 일괄 새 폴더 생성하기 등 파일 보관과 관련된 여러 도구를 볼 수 있습니다. 본문에서 사용하는 것은 첫 번째 기능인 파일명에 따라 파일 분류입니다.

이 단계의 목적은 소프트웨어에 우리가 하려는 작업이 이름 바꾸기나 형식 변환이 아니라, 파일명 속 특정 내용을 기반으로 분류 관계를 만드는 것임을 알려주는 것입니다. 이 기능을 선택하면 소프트웨어는 단계별 처리 흐름으로 진입하며, 이후 파일 가져오기, 분류 규칙 설정, 저장 위치 설정, 처리 시작을 순서대로 완료합니다.
2단계: 분류할 파일 추가 또는 폴더에서 가져오기
'파일명에 따라 파일 분류' 기능에 진입하면 화면 상단에 파일 추가, 폴더에서 파일 가져오기, 비우기, 더 보기 등의 버튼을 볼 수 있습니다. 파일이 분산되어 있다면 '파일 추가'를 사용하고, 이미 특정 디렉터리에 모여 있다면 '폴더에서 파일 가져오기'를 사용하는 것이 더 적합합니다.

가져오기가 완료되면 소프트웨어는 처리 대기 파일의 일련번호, 이름, 경로, 확장자, 생성 시간 및 수정 시간을 목록에 표시합니다. 스크린샷에서 파일 경로는 D:\test 디렉터리, 확장자는 txt, 레코드 수는 20개임을 알 수 있습니다. 이 단계를 통해 사용자는 가져온 파일이 올바른지 먼저 확인하여, 정리가 필요 없는 파일이 일괄 작업에 추가되는 것을 방지할 수 있습니다. 처리에 포함되지 않아야 할 파일을 발견하면 인터페이스의 조작 열을 통해 제거할 수 있으며, 잘못 가져왔다면 상단의 '비우기'를 사용하여 다시 선택할 수 있습니다.
이 단계의 예상 결과는, 분류가 필요한 모든 파일이 목록에 나타나고, 파일명 규칙이 이번 분류 목표에 부합하는 것입니다. 예를 들어 본문에서는 앞 세 자리 숫자로 분류하므로, 가져온 파일명은 101, 102, 103 등 세 자리 숫자로 시작해야 합니다.
3단계: 처리 옵션에서 '사용자 정의 정규 표현식으로 분류' 선택하기
파일 목록에 문제가 없음을 확인한 후, 하단의 다음을 클릭하여 '처리 옵션 설정'으로 들어갑니다. 여기가 이번 대량 분류의 핵심입니다. 인터페이스에는 첫 글자로 분류, 첫 숫자로 분류, 첫 영문자로 분류, 마지막 몇 글자로 분류, 처음 몇 글자로 분류, 사용자 정의 위치 범위 내 문자로 분류, 그리고 사용자 정의 정규 표현식으로 분류 등 다양한 방식이 제공됩니다.

본문의 예시에서는 사용자 정의 정규 표현식으로 분류를 선택하고, 정규 표현식 입력 필드에 다음과 같이 입력합니다:
^\d{3}
이 표현식의 의미는 파일명 시작 부분에서부터 연속된 세 자리 숫자를 찾는 것입니다. 101LON05417.txt의 경우 매칭 결과는 101, 102NYC53821.txt의 경우 102, 103LON23328.txt의 경우 103이 됩니다. 소프트웨어는 매칭된 내용을 분류 폴더명으로 사용하여 파일명 접두사별 일괄 보관을 실현합니다.
인터페이스 하단에는 대소문자 변환 옵션도 제공되며, 기본값, 대문자로 변환, 소문자로 변환이 있습니다. 본문의 분류 기준은 숫자이므로 기본값을 유지하면 됩니다. 분류 기준이 영문자이고 파일명이 abc, ABC, Abc 등 여러 대소문자 형태로 나타난다면, 필요에 따라 대소문자 통일 여부를 선택하여 분류 폴더 중복을 줄일 수 있습니다.
4단계: 저장 위치 설정 및 처리 시작
정규 표현식 설정을 완료한 후, 계속해서 다음을 클릭하면 진행 중인 '저장 위치 설정'으로 들어갑니다. 이 단계는 분류 후 파일이 어디에 저장될지를 결정하는 곳입니다. 처리 완료 후 결과를 확인하기 쉬운 새로운 디렉터리를 선택하는 것이 좋습니다. 중요한 자료라면, 테스트 디렉터리에서 먼저 한 번 실행하여 규칙에 문제가 없는지 확인한 후 실제 파일을 처리할 수도 있습니다.
저장 위치 설정을 완료하면 '처리 시작' 단계로 진입합니다. 이때 소프트웨어는 앞서 가져온 파일 목록과 정규 표현식 규칙에 따라 자동으로 해당 분류 폴더를 생성하고, 동일한 분류 값에 매칭된 파일들을 한 곳에 모읍니다. 처리가 완료되면 101, 102, 103과 같은 폴더 구조를 확인할 수 있습니다.
이 단계의 예상 결과는, 수동으로 일일이 새 폴더를 만들거나 파일을 드래그할 필요 없이, 소프트웨어가 파일명의 매칭 결과에 따라 일괄 정리를 완료하는 것입니다. 수량이 많은 TXT, docx, xlsx, PDF 등의 파일의 경우, 이는 반복적인 수작업을 현저히 줄여줍니다.
정규 표현식 설명: ^\d{3}을 사용하는 이유
많은 사용자가 '정규 표현식' 하면 복잡하다고 느끼지만, 실제 대량 파일 정리에서는 몇 가지 사용법만 익히면 됩니다. 본문에서 사용한 ^\d{3}은 매우 전형적인 파일명 접두사 매칭 규칙입니다.
여기서 '^'는 파일명의 시작 위치에 매칭됨을 의미합니다. 이 기호가 없으면 표현식이 파일명 내 임의의 위치에서 세 자리 숫자를 찾을 수 있지만, '^'를 추가하면 시작 부분만 매칭합니다. 이렇게 하면 뒤쪽의 번호를 분류 기준으로 잘못 인식하는 것을 방지할 수 있습니다. '\d'는 임의의 숫자, 즉 0부터 9까지의 숫자 하나를 의미합니다. '{3}'은 앞의 숫자가 3회 연속 나타남을 의미합니다. 따라서 전체 표현식은 파일명 시작 부분의 세 자리 숫자를 찾는 것입니다.
파일명 앞 네 자리가 연도나 번호인 경우 규칙을 ^\d{4}로 변경할 수 있고, 앞 두 자리가 지역 코드인 경우 ^\d{2}로 변경할 수 있습니다. 파일명 시작이 ABC001.docx처럼 영문자인 경우, 시작 부분의 글자를 매칭하는 정규 표현식 작성을 고려할 수 있습니다. 구체적으로 어떤 규칙을 사용할지는 파일명 규칙에 따라 달라집니다.
자주 묻는 질문과 주의사항
1. 파일명에 일정한 규칙이 없어도 대량 분류할 수 있나요?
파일명에 규칙이 전혀 없다면 어떤 일괄 도구로도 어느 폴더에 넣어야 할지 정확히 판단하기 어렵습니다. 먼저 파일명 내에 시작 번호, 날짜, 고객 코드, 부서 약자 또는 고정 구분자 등 안정적인 정보가 존재하는지 관찰해 보는 것이 좋습니다. 규칙만 찾을 수 있다면 소프트웨어의 기존 분류 방식이나 사용자 정의 정규 표현식을 사용하여 추출해 볼 수 있습니다.
2. TXT 파일이 아니어도 이 방법으로 정리할 수 있나요?
가능합니다. 스크린샷 예시는 txt 파일이지만, '파일명에 따라 분류'하는 기준은 파일명이지 파일 내용이 아닙니다. 따라서 Word 문서(doc, docx), Excel 스프레드시트(xls, xlsx), PowerPoint 파일(ppt, pptx), PDF, 이미지, 오디오, 비디오 등 파일명이 규칙에만 맞다면 유사한 방법으로 일괄 정리할 수 있습니다.
3. 정규 표현식을 잘못 쓰면 어떻게 되나요?
표현식이 원하는 내용을 제대로 찾아내지 못하면 분류 결과가 예상과 다를 수 있습니다. 따라서 먼저 소수의 파일로 테스트해 보는 것이 좋습니다. 예를 들어 10~20개의 샘플 파일을 먼저 가져와서 올바르게 101, 102, 103 폴더가 생성되는지 확인한 후 대량의 자료를 처리하는 것입니다. 중요한 파일의 경우 처리 전에 백업을 해두는 것도 좋습니다.
4. 분류 기준에 대소문자가 포함될 때 주의할 점은?
파일명의 분류 값에 영문자가 포함된 경우, 대소문자 차이로 인해 다른 폴더가 생성될 수 있습니다. 예를 들어 abc와 ABC는 다른 분류로 간주될 수 있습니다. 스크린샷의 처리 옵션은 알파벳 대소문자 변환 설정을 제공하므로, 사용자는 필요에 따라 기본값을 유지하거나 대문자 또는 소문자로 통일하여 분류 결과를 더 규범화할 수 있습니다.
요약: 소프트웨어가 규칙에 따라 반복 작업을 처리하게 하여 파일 보관 효율을 높이기
파일 대량 정리의 핵심은 사용자가 더 많이 클릭하게 하는 것이 아니라, 반복적이고 기계적이며 실수하기 쉬운 작업을 업무용 소프트웨어에 맡기는 것입니다. 본문 예시에서 HeSoft Doc Batch Tool 는 '파일명에 따라 파일 분류' 기능과 사용자 정의 정규 표현식 ^\d{3}을 사용하여 파일명 시작 부분에서 101, 102, 103을 추출하고, 해당 폴더를 자동 생성하여 파일을 보관했습니다.
만약 귀하의 파일명에도 고객 번호, 프로젝트 번호, 부서 코드, 날짜 또는 배치 번호가 포함되어 있다면, 먼저 가장 안정적인 명명 규칙을 찾아낸 후 대량 분류 기능을 사용하여 정리하는 것을 권장합니다. TXT, docx, xlsx, PDF 등 업무 파일을 자주 처리하는 사용자에게 이 방법은 수동 필터링 및 드래그 시간을 확실히 줄여주고, 자료 관리를 더 체계화하며, 이후 파일 검색도 더 수월하게 만들어 줍니다.