이 문서에서는 HeSoft Doc Batch Tool 을 사용하여, 원래 1.pdf, 2.pdf 등 의미 없는 이름으로 저장된 여러 PDF 파일을 파일 내용에 포함된 계약 번호로 일괄 변경하는 방법을 소개합니다. "파일 내용으로 PDF 파일 이름 변경" 기능을 통해, 와일드카드와 유사한 정규식 \d{8}을 사용하여 PDF 본문에서 8자리 숫자 번호를 자동으로 식별하고 원본 파일 이름을 덮어쓸 수 있습니다. 이는 계약, 주문, 기록, 스캔 문서 등 번호별로 정리해야 하는 사무 환경에 적합합니다.
일상적인 사무 작업에서 많은 PDF 파일이 처음에는 다운로드 순서, 스캔 순서 또는 임시 번호에 따라 저장됩니다. 예를 들어 1.pdf, 2.pdf, 3.pdf, 4.pdf와 같은 파일명은 임시 저장에는 편리하지만, 이후 검색, 보관 및 공유에는 불편합니다. 특히 계약서, 합의서, 견적서, 주문서, 송장, 프로젝트 자료 등 PDF 문서에서 진정으로 가치 있는 정보는 계약 번호, 주문 번호, 고객 번호 또는 프로젝트 번호와 같이 문서 내용 안에 있는 경우가 많습니다. PDF를 일일이 열어서 번호를 확인하고 파일명을 수동으로 수정하면 시간이 오래 걸릴 뿐만 아니라 복사 오류, 누락, 중복된 이름으로 수정될 가능성도 높습니다.
본 문서는 이러한 문제점을 해결하고자 합니다. 사무용 소프트웨어의 일괄 처리 기능과 와일드카드/정규식 규칙을 사용하여 많은 PDF 파일 내용에서 고정된 형식의 번호를 추출하고, PDF 파일명을 일괄적으로 해당 번호로 변경하는 방법을 설명합니다. 아래에서는 HeSoft Doc Batch Tool 을 예시로, 여러 PDF 파일을 "1.pdf, 2.pdf……"에서 "10026877.pdf, 20036655.pdf……"로 일괄 변경하는 전체 과정을 시연합니다.
적용 시나리오
이 방법은 파일 수가 많고, 명명 규칙이 통일되어 있으며, 본문 내에 식별 가능한 번호가 존재하는 PDF 일괄 이름 변경 작업에 특히 적합합니다. 일반적인 "파일명 찾아 바꾸기"와 달리, 여기서는 기존 파일명의 문자를 수정하는 것이 아니라 PDF 내용에서 특정 텍스트를 읽어 들여, 읽어 들인 텍스트를 새 파일명으로 사용하는 것입니다.
일반적인 시나리오는 다음과 같습니다:
- 계약서 PDF 일괄 이름 변경: 계약서 첫 페이지에서 Contract No., 계약 번호, 합의 번호 등의 정보를 추출합니다.
- 주문 PDF 일괄 이름 지정: 주문 본문에서 주문 번호, 구매 발주 번호 또는 고객 주문 번호를 추출합니다.
- 스캔 파일 보관: 스캔되면 파일명이 1.pdf, 2.pdf, scan001.pdf 등이 될 수 있으며, 본문의 번호에 따라 보관해야 합니다.
- 회계 파일 정리: 송장, 지급 신청서, 경비 보고서 등의 PDF에서 번호를 추출하여 파일명으로 사용합니다.
- 프로젝트 자료 관리: 프로젝트 번호, 작업 번호, 티켓 번호를 추출하여 PDF 파일명을 통일합니다.
이러한 번호가 8자리 숫자처럼 비교적 고정된 형식을 가진다면, 유사한 와일드카드 표현식을 사용하여 매칭할 수 있습니다. 스크린샷의 작업은 정규식 "\d{8}"을 사용하였으며, 이는 연속된 8자리 숫자를 매칭한다는 의미입니다. 사무직 사용자 입장에서는 이를 더 정밀한 와일드카드 표현식으로 이해할 수 있습니다. 각 번호를 수동으로 지정하는 대신, 소프트웨어가 규칙에 맞는 텍스트를 자동으로 찾도록 하는 것입니다.
효과 미리 보기: 처리 전후
처리 전: 파일명에 일련번호만 있어 내용을 알 수 없음
처리 전 PDF 파일명은 각각 1.pdf, 2.pdf, 3.pdf, 4.pdf로 매우 간단합니다. 파일명만 봐서는 각 PDF가 어느 계약에 해당하는지 전혀 알 수 없으며, 파일명으로 계약 번호를 직접 검색할 수도 없습니다.

PDF 중 하나를 열면 문서 내용에 명확한 계약 번호가 있는 것을 볼 수 있습니다. 예를 들어 스크린샷의 계약서 첫 페이지에는 "Contract No." 뒤에 8자리 숫자 "10026877"이 표시됩니다. 이것이 바로 추출하여 파일명으로 사용하고자 하는 내용입니다.

처리 후: PDF 파일명이 본문의 번호로 변경됨
일괄 처리가 완료되면 원래의 일련번호 파일명이 PDF 내용에서 식별된 8자리 번호로 대체됩니다. 예시에서는 파일명이 10026877.pdf, 20036655.pdf, 20100511.pdf, 33952100.pdf로 변경되었습니다. 이렇게 하면 파일을 열지 않고도 파일명으로 해당 계약을 판단하고 검색할 수 있습니다.

장기간 보관해야 하는 사무용 파일의 경우, 이러한 명명 방식은 단순한 일련번호보다 더 신뢰할 수 있습니다. 추후 로컬 폴더, 공유 드라이브, 기업용 클라우드 스토리지 또는 문서 관리 시스템에서 검색하더라도 번호만으로 파일을 바로 찾을 수 있습니다.
조작 단계
1단계: "파일 내용으로 PDF 파일 이름 변경" 기능 진입
HeSoft Doc Batch Tool 을 열면 왼쪽에서 파일 이름, 폴더 이름, 파일 정리, Word 도구, Excel 도구, PDF 도구 등 여러 사무 파일 처리 분류를 볼 수 있습니다. 여기서는 PDF 파일명을 처리해야 하므로 왼쪽의 "파일 이름" 분류를 선택합니다.
기능 카드에서 "7. 파일 내용으로 PDF 파일 이름 변경"을 찾습니다. 이 기능의 설명은 'PDF 파일 내용의 특정 텍스트를 해당 파일의 파일명으로 일괄 변경'하는 것으로, 계약서 PDF에서 계약 번호를 추출하여 이름을 변경하는 데 적합합니다.

이 단계의 목적은 올바른 일괄 처리 시작점으로 진입하는 것입니다. 일반적인 파일명 바꾸기와 달리, 이 기능은 PDF 내용을 읽어들이므로 파일명은 의미가 없지만 본문에 유효한 번호가 포함된 문서를 처리하는 데 적합합니다.
2단계: 일괄 이름 변경할 PDF 파일 추가
기능 페이지에 진입하면 인터페이스 상단에 현재 기능이 "파일 내용으로 PDF 파일 이름 변경"이라고 표시됩니다. 페이지의 첫 단계는 "처리할 레코드 선택"입니다. "파일 추가"를 통해 PDF를 하나씩 선택하거나, "폴더에서 파일 가져오기"를 통해 특정 폴더의 PDF를 한 번에 가져올 수 있습니다.
스크린샷에는 4개의 PDF 파일이 가져와졌으며, 목록에는 일련번호, 이름, 경로, 확장자, 생성 시간, 수정 시간 등의 정보가 표시되어 있습니다. 파일명은 각각 1.pdf, 2.pdf, 3.pdf, 4.pdf이며, 확장자는 모두 pdf이고 경로는 D 드라이브 테스트 디렉터리 아래에 있습니다.

이 단계의 목적은 일괄 처리할 파일 범위를 확인하는 것입니다. 가져온 후에는 먼저 목록을 확인하는 것이 좋습니다. 파일 수가 맞는지, 확장자가 pdf인지, 실수로 처리할 필요 없는 파일이 추가되지는 않았는지 확인합니다. 처리하지 말아야 할 파일이 있다면 목록의 삭제 작업을 사용하여 해당 레코드를 제거할 수 있습니다.
3단계: PDF 내용에서 추출할 텍스트 구간 설정
"다음"을 클릭하면 "처리 옵션 설정"으로 진입합니다. 이곳이 전체 일괄 이름 변경 과정의 핵심입니다. 인터페이스에 "검색 영역" 옵션이 있으며, 스크린샷에서는 "사용자 정의 수식과 일치하는 텍스트"가 선택되어 있습니다. 이는 소프트웨어가 첫 번째 줄 텍스트나 특정 고정 위치의 텍스트를 단순히 가져오는 것이 아니라, 우리가 입력한 규칙에 따라 PDF 내용에서 일치하는 텍스트를 찾는다는 것을 의미합니다.
"정규식" 입력란에는 예시로 "\d{8}"이 입력되어 있습니다. 이 표현식은 연속된 8자리 숫자를 찾는 데 사용됩니다. 계약 번호가 정확히 8자리 숫자이므로, 소프트웨어는 PDF 내용에서 이 규칙에 맞는 텍스트를 찾아 매칭된 번호를 이름 변경에 사용합니다.

같은 페이지 아래쪽에는 "위치" 설정이 있으며, 스크린샷에서는 "전체 파일명 덮어쓰기"가 선택되어 있습니다. 이는 새로 추출된 번호가 원래 파일명의 메인 부분을 직접 대체한다는 의미입니다. 예를 들어 1.pdf는 10026877.pdf가 되며, 원래 파일명 앞뒤로 번호가 추가되지 않습니다.
이 단계의 예상 결과는 소프트웨어가 규칙에 따라 각 PDF에서 8자리 숫자를 식별하여 그 숫자를 해당 PDF의 새 파일명으로 사용하는 것입니다. 만약 번호가 8자리가 아니라면 실제 형식에 맞게 표현식을 조정해야 합니다. 예를 들어 번호가 6자리 숫자면 \d{6}을, 10자리 숫자면 \d{10}을 사용할 수 있습니다. 하지만 구체적인 표현식은 문서 내용을 기준으로 해야 하며, 관계없는 숫자와 매칭되는 것을 피해야 합니다.
4단계: 저장 위치 설정 및 처리 시작
인터페이스 상단의 진행 표시줄을 보면, 이어서 "저장 위치 설정"과 "처리 시작" 두 단계가 있습니다. 규칙 설정을 완료한 후, 계속해서 "다음"을 클릭하고 인터페이스 안내에 따라 저장 위치를 선택한 다음 처리 시작 단계로 진입합니다.
이 단계에서는 파일의 중요도에 따라 적절한 저장 방식을 선택하는 것이 좋습니다. 중요한 계약서나 공식 문서라면, 먼저 새 폴더에 출력하여 이름 변경 결과가 정확한지 확인한 후 교체하거나 보관하는 것이 좋습니다. 이렇게 하면 오작업 위험을 줄이고 처리 전후 파일을 쉽게 추적할 수 있습니다.
처리를 시작하면 소프트웨어가 목록의 PDF 내용을 일괄적으로 읽어들여 "\d{8}" 규칙에 따라 해당 번호를 찾고 파일명을 번호 형식으로 변경합니다. 처리가 완료되면 폴더로 돌아가 결과를 확인할 수 있으며, 앞서 미리 보기에서 본 것처럼 원래의 1.pdf, 2.pdf 등의 파일이 해당 계약 번호 파일명으로 변경됩니다.
와일드카드/정규식 설정 아이디어
많은 사용자가 이러한 유형의 규칙을 와일드카드 표현식이라고 부릅니다. 엄밀히 말하면, 스크린샷의 입력 항목 이름은 "정규식"이며, 이는 일반 와일드카드보다 고정 형식 텍스트를 처리하는 데 더 적합합니다. 와일드카드는 일반적으로 별표가 모든 문자를 나타내는 것과 같은 단순한 매칭에 사용되지만, 정규식은 "연속된 몇 자리 숫자", "특정 접두사 뒤의 번호", "문자와 숫자를 포함하는 코드" 등의 규칙을 더 정밀하게 설명할 수 있습니다.
이 예시에서 계약 번호는 연속된 8자리 숫자이므로 \d{8}을 사용합니다. 여기서 \d는 숫자를 나타내고, {8}는 8회 연속 출현을 나타냅니다. 이 둘을 조합하면 연속된 8개의 숫자를 찾는 의미입니다. 일괄 PDF 이름 변경 시 이 규칙의 장점은, 파일 안에 있는 구체적인 번호를 알 필요 없이 번호 형식만 동일하면 소프트웨어가 하나씩 식별할 수 있다는 것입니다.
유의할 점은, PDF 내에 연속된 8자리 숫자가 여러 개 있을 경우 소프트웨어가 조건에 맞는 텍스트 중 하나와 매칭될 수 있다는 것입니다. 따라서 정식 일괄 처리 전에 먼저 소량의 샘플로 테스트하여 추출 결과가 확실히 계약 번호인지, 날짜, 전화번호, 금액 번호 또는 기타 숫자가 아닌지 확인하는 것이 좋습니다. 문서에 유사한 숫자가 여러 개 있다면, 번호 앞뒤의 고정 문자와 결합하여 규칙을 더 구체화하는 것을 고려할 수 있지만, 구체적인 작성 방법은 실제 문서 내용에 따라 설계해야 합니다.
자주 묻는 질문 및 주의 사항
1. 처리하기 전에 PDF를 열어 번호 형식을 확인해야 하는 이유는 무엇인가요?
일괄 이름 변경은 내용 매칭 규칙에 의존하기 때문입니다. 먼저 샘플 PDF 한두 개를 열어 계약 번호가 모두 8자리 숫자인지, 문서에 항상 나타나는지, 동일한 길이의 다른 숫자가 없는지 확인하면 더 정확한 표현식을 선택하는 데 도움이 되어, 일괄 처리 후 오류가 발생하는 것을 방지할 수 있습니다.
2. PDF가 스캔된 이미지라면 번호를 바로 인식할 수 있나요?
본 문서의 스크린샷은 PDF 뷰어에서 보이는 텍스트 콘텐츠를 내용 매칭을 통해 이름을 변경하는 것을 보여줍니다. PDF가 순수 이미지 스캔 파일인 경우, 파일 내에 인식 가능한 텍스트 레이어가 있는지에 따라 텍스트를 직접 추출할 수 있는지 여부가 결정됩니다. 처리 전에 PDF에서 번호를 복사해 보아, 복사할 수 없다면 OCR 문자 인식 후 내용 기반 이름 변경 기능을 사용해야 할 수 있습니다.
3. 파일명에 원래의 1, 2, 3이 유지되나요?
스크린샷의 "위치" 설정이 "전체 파일명 덮어쓰기"로 선택되어 있으므로, 원래 파일명의 메인 부분은 추출된 번호로 대체됩니다. 확장자 pdf는 유지되므로 처리 결과는 10026877.pdf와 같은 형식이지, 10026877 또는 10026877.pdf.pdf가 아닙니다.
4. 일괄 처리 전에 백업이 필요한가요?
백업을 권장합니다. 일괄 처리는 효율을 크게 향상시킬 수 있지만, 계약, 회계, 문서 보관 등 공식 파일을 다룰 때는 먼저 테스트 디렉터리에 복사해 두고 규칙이 올바른지 확인한 후 정식 파일을 처리하는 것이 가장 좋습니다. 또는 소량의 PDF를 선택해 시험 실행하여 파일명 결과가 예상과 일치하는지 확인할 수 있습니다.
5. 이 방법은 PDF에만 적용되나요?
본 문서에서 시연한 것은 "파일 내용으로 PDF 파일 이름 변경" 기능으로, PDF 파일에 적용됩니다. 소프트웨어 인터페이스에서도 Word 도구, Excel 도구 등 사무용 파일 처리 분류를 볼 수 있으며, doc, docx, xls, xlsx 등의 파일을 처리할 때는 해당 유형의 기능 시작점을 선택해야 하며, 다른 형식을 동일한 PDF 처리 작업에 혼합해서 넣으면 안 됩니다.
요약
HeSoft Doc Batch Tool 을 사용하면, 원래는 사람이 직접 열어보고, 확인하고, 복사하고, 이름을 변경해야 했던 PDF 정리 작업을 하나의 규칙 기반 일괄 작업으로 전환할 수 있습니다. 계약서 PDF의 경우, 본문에 형식이 안정적인 계약 번호가 존재하기만 하면 "파일 내용으로 PDF 파일 이름 변경" 기능과 와일드카드와 유사한 정규식 \d{8}을 함께 사용하여 신속하게 번호를 추출하고 기존 파일명을 덮어쓸 수 있습니다.
이 방법의 핵심 가치는 반복 작업을 줄이고, 수동 이름 변경 오류를 낮추며, 파일 검색 효율을 높이는 데 있습니다. 대량의 PDF를 정식으로 처리하기 전에, 먼저 몇 개의 샘플 파일을 선택하여 표현식과 이름 변경 결과를 테스트하고, 오류가 없음을 확인한 후 전체 폴더를 일괄 가져와 처리하는 것을 권장합니다. 장기 보관이 필요한 계약서, 주문서 및 스캔 파일의 경우, 이 방법은 일상적인 사무 효율을 확연히 향상시킬 것입니다.