폴더에 대량의 PDF 계약서가 있지만 파일명이 1.pdf, 2.pdf, 3.pdf 같은 임시 번호로 되어 있다면, 이후 검색과 보관이 매우 비효율적입니다. 이 글에서는 계약서 PDF를 예로 들어 HeSoft Doc Batch Tool 를 사용하여, 사용자 정의 매칭 표현식을 통해 PDF 본문에서 8자리 계약 번호를 추출하고 이를 새로운 파일명으로 일괄 적용하는 방법을 소개합니다. 글에서는 처리 전후 효과와 소프트웨어 조작 스크린샷을 결합하여 파일 가져오기, 표현식 설정, 파일명 덮어쓰기 선택 및 일괄 이름 변경 완료의 전체 과정을 설명합니다.
계약서, 주문서, 송장, 보고서 등 PDF 파일 관리 현장에서 자주 마주치는 실제적인 문제가 있습니다. 파일 내용에는 계약 번호, 주문 번호 또는 프로젝트 번호가 분명히 있는데, 파일명은 "1.pdf, 2.pdf, 3.pdf, 4.pdf"와 같은 임시 이름인 경우입니다. 파일 수가 적을 때는 일일이 열어서 확인하고, 번호를 복사한 후 수동으로 파일명을 변경하면 됩니다. 하지만 수십 개, 수백 개로 늘어나면 반복 작업에 시간이 오래 걸릴 뿐만 아니라 복사 오류, 변경 누락, 잘못된 파일 덮어쓰기 등의 실수가 발생하기 쉽습니다.
이 글에서 해결하려는 문제는 바로 와일드카드 표현식 또는 유사한 정규 표현식 매칭 방식을 사용하여 PDF 파일 내용에서 특정 텍스트를 대량으로 추출하고, 추출된 텍스트를 PDF 파일명으로 사용하는 방법입니다. 예시에서 PDF 본문에는 "10026877"과 같은 8자리 계약 번호가 포함되어 있으며, HeSoft Doc Batch Tool 의 "파일 내용으로 PDF 파일 이름 바꾸기" 기능을 사용하여 원래의 숫자 순번 파일명을 계약 번호 파일명으로 일괄 변경할 것입니다.
이러한 작업은 사무 환경에서 대량 파일 정리에 매우 적합합니다. 핵심 가치는 개별 파일 이름 변경이 아니라, 대량의 반복적이고 기계적이며 오류가 발생하기 쉬운 수동 작업을 오피스 소프트웨어에 맡겨 일괄 처리함으로써 보관, 검색, 자료 인계 시의 효율성을 높이는 데 있습니다.
적용 분야: 어떤 PDF가 표현식을 이용한 일괄 이름 변경에 적합한가
와일드카드 표현식이나 정규 표현식을 사용하여 PDF 파일명을 일괄 변경하려면, 파일 내용에 식별 및 매칭 가능한 고정된 형식의 텍스트가 존재해야 합니다. 예를 들어 이 글의 스크린샷 속 계약 PDF에는 페이지에 "Contract No."가 있고 그 뒤에 8자리 숫자가 따라옵니다. 이러한 번호가 각 파일에서 일관된 형식을 유지하고 있다면 표현식을 통해 한 번에 추출할 수 있습니다.
일반적인 적용 분야는 다음과 같습니다:
- 계약 PDF: 계약 번호, 협정 번호, 고객 번호를 파일명으로 사용.
- 주문 PDF: 주문 번호, 구매 주문 번호, 운송장 번호로 일괄 이름 변경.
- 송장 또는 영수증 PDF: 송장 번호, 일련 번호, 날짜+번호로 보관.
- 프로젝트 자료 PDF: 프로젝트 번호, 작업 번호, 기록 번호로 통일된 이름 지정.
- 스캔 파일 PDF: OCR 처리 후 본문 텍스트를 인식할 수 있다면, 본문 속 번호에 따라 이름 변경을 시도할 수 있습니다.
파일 내용 속 목표 텍스트가 8자리 계약 번호처럼 고정된 길이의 숫자라면, 예시와 같이 "\d{8}"을 사용하여 매칭할 수 있습니다. 여기서의 개념은 와일드카드와 유사합니다. 각 번호를 하나씩 지정할 필요 없이, "연속된 8개의 숫자를 찾겠다"는 하나의 규칙을 정의하는 것입니다. 소프트웨어는 이 규칙에 따라 각 PDF 내용에서 일치하는 텍스트를 찾고, 그 결과를 파일 이름에 사용합니다.
결과 미리보기: 처리 전 파일명과 PDF 내용 속 번호
처리 전, 폴더 내 PDF 파일명은 단순한 순번에 불과합니다. 이러한 파일명으로는 각 PDF가 어떤 계약에 해당하는지 바로 알 수 없고, 파일 탐색기에서 특정 계약 번호를 검색하기도 불편합니다.

처리 전 스크린샷에서 파일명이 "1.pdf, 2.pdf, 3.pdf, 4.pdf"임을 확인할 수 있습니다. 특정 계약서를 찾으려면 파일을 하나씩 열어 내용을 확인해야 합니다. 대량 계약서 보관 측면에서 이러한 명명 방식은 분명히 표준화되지 않았습니다.
그중 하나의 PDF를 열어보면 본문에 명확한 계약 번호가 존재합니다. 스크린샷에서 빨간색 상자는 "Contract No." 뒤의 숫자 "10026877"을 표시하고 있습니다. 이것이 바로 추출하여 파일명으로 사용하고자 하는 핵심 정보입니다.

즉, 현재 파일명은 비즈니스 의미가 없지만 PDF 내용 자체에는 중요한 번호가 포함되어 있습니다. HeSoft Doc Batch Tool 가 할 일은 바로 이러한 내용 속 번호를 자동으로 식별하여 원래 파일명을 대체하는 것입니다.
처리 후 결과: PDF 파일명이 8자리 계약 번호로 변경됨
처리가 완료되면 원래의 순번 파일명이 PDF 본문에서 추출한 8자리 숫자 번호로 대체됩니다. 이렇게 하면 파일을 열지 않아도 각 PDF에 해당하는 계약 번호를 알 수 있어, 이후 조회, 정렬, 보관이 훨씬 편리해집니다.

처리 후 스크린샷을 보면 파일명이 "10026877.pdf, 20036655.pdf, 20100511.pdf, 33952100.pdf"로 변경된 것을 알 수 있습니다. 이는 소프트웨어가 여러 PDF 파일 내용에서 각각의 8자리 번호를 성공적으로 추출하여 일괄적으로 파일명을 변경했음을 의미합니다.
이러한 결과는 수동으로 이름을 변경하는 것보다 안정적입니다. 표현식 설정이 정확하기만 하면, 일괄 처리 시 모든 파일이 동일한 규칙에 따라 실행되므로, 수동으로 파일을 열고, 복사하고, 붙여넣고, 수정하는 과정에서 발생하는 실수를 줄일 수 있습니다.
조작 절차: 파일 내용을 이용하여 PDF 일괄 이름 변경
1단계: "파일 내용으로 PDF 파일 이름 바꾸기" 기능으로 이동
HeSoft Doc Batch Tool 을(를) 연 후, 왼쪽 기능 분류에서 "파일 이름"을 선택합니다. 메인 인터페이스에는 파일명 키워드 찾아 바꾸기, 텍스트 삽입, 접두사 및 접미사 추가 등 파일명 처리와 관련된 여러 기능 카드가 표시됩니다. 이 글에서는 PDF 본문에서 텍스트를 추출하여 파일명으로 사용해야 하므로, "파일 내용으로 PDF 파일 이름 바꾸기"를 선택합니다.

이 단계의 목적은 "PDF 내용에 따라 이름 변경" 전용 처리 흐름으로 진입하는 것입니다. 이는 기존 파일명의 특정 문자를 수정하는 일반적인 파일명 변경과 달리, PDF 내부 텍스트를 읽어 들여 매칭된 내용을 새 파일명 생성에 사용합니다.
2단계: 일괄 처리할 PDF 파일 추가
기능 페이지에 진입하면, 인터페이스 상단에 현재 기능명 "파일 내용으로 PDF 파일 이름 바꾸기"가 표시됩니다. 첫 번째 단계는 "처리할 레코드 선택"입니다. "파일 추가"를 통해 하나 또는 여러 개의 PDF를 가져오거나, "폴더에서 파일 가져오기"를 통해 특정 폴더 안의 PDF 파일들을 한 번에 가져올 수 있습니다.

스크린샷에서 4개의 PDF 파일을 가져왔으며, 표에는 순번, 이름, 경로, 확장자, 생성 시간, 수정 시간 등의 정보가 나열되어 있습니다. 현재 파일명은 여전히 "1.pdf, 2.pdf, 3.pdf, 4.pdf"이고 확장자는 pdf입니다. 인터페이스 하단에 레코드 수가 4로 표시되어, 이 4개 파일이 이번 일괄 처리 대상임을 알 수 있습니다.
이 단계에서는 파일 목록이 올바른지 먼저 확인하고, 관련 없는 파일을 실수로 가져오지 않았는지 점검하는 것이 좋습니다. 처리할 필요가 없는 파일이 발견되면 목록 오른쪽의 삭제 작업으로 제거할 수 있으며, 파일 수가 많으면 인터페이스의 필터링, 정렬 기능을 함께 활용하여 대조할 수 있습니다.
3단계: 검색 영역 설정, 사용자 지정 매칭 텍스트 선택
파일 가져오기가 완료되면 "다음"을 클릭하여 "처리 옵션 설정"으로 들어갑니다. "검색 영역"에서 인터페이스는 "첫 번째 줄 텍스트", "첫 번째 바코드 이미지", "사용자 지정 수식으로 매칭된 텍스트" 등 여러 옵션을 제공합니다. 이 글의 목표는 PDF 본문에서 8자리 계약 번호를 추출하는 것이므로 "사용자 지정 수식으로 매칭된 텍스트"를 선택합니다.

이 단계는 매우 중요합니다. 사용자 지정 매칭을 선택하면, 아래에 입력한 표현식에 따라 소프트웨어가 PDF 내용에서 규칙에 맞는 텍스트를 찾습니다. 고정된 형식의 계약 번호, 주문 번호, 기록 번호의 경우, 이 방식이 첫 번째 줄 고정 추출보다 더 유연하며, 레이아웃은 다르지만 번호 규칙이 동일한 파일에 적합합니다.
4단계: 표현식 "\d{8}" 입력, 8자리 숫자 번호 매칭
"정규 표현식" 입력 상자에 "\d{8}"을 입력합니다. 이 표현식은 연속된 8자리 숫자와 일치한다는 의미입니다. 예시 PDF의 계약 번호가 정확히 8자리 숫자이므로, 이 표현식으로 "10026877", "20036655", "20100511" 등의 번호를 매칭할 수 있습니다.
이를 와일드카드 이름 변경의 개념으로 이해한다면, "\d"는 하나의 숫자 문자를, "{8}"은 연속 8회 출현을 의미한다고 볼 수 있습니다. 이렇게 하면 각 계약 번호를 일일이 입력할 필요 없이, 소프트웨어가 각 PDF에서 "8자리 숫자" 규칙에 맞는 텍스트를 자동으로 찾습니다.
유의할 점은, 표현식이 실제 파일 내용과 최대한 일치해야 한다는 것입니다. PDF 내에 날짜, 전화번호 일부 또는 금액 코드 등 다른 8자리 숫자가 있을 경우, 원치 않는 텍스트가 매칭될 수 있습니다. 이런 경우 실제 파일 내용에 따라 매칭 규칙을 더 좁힐 수 있으며, 예를 들어 번호 앞뒤의 고정 문자를 결합하여 더 정밀한 표현식을 설정할 수 있습니다. 이 글의 스크린샷에서는 "\d{8}" 설정만을 보여주고 있으므로, 예시는 8자리 숫자 매칭을 위주로 합니다.
5단계: 이름 지정 위치를 '전체 파일명 덮어쓰기'로 선택
"위치" 영역에서 스크린샷에는 "전체 파일명 덮어쓰기"가 선택되어 있습니다. 이는 매칭된 텍스트가 원본 파일명 본체를 직접 대체함을 의미합니다. 예를 들어 원래 파일명 "1.pdf"는 처리 후 "10026877.pdf"가 되고, 확장자는 PDF 파일 확장자로 그대로 유지됩니다.
만약 번호를 원래 파일명 앞뒤에 추가하기를 원한다면, 인터페이스의 위치 옵션에서 "파일명 왼쪽" 또는 "파일명 오른쪽"을 선택할 수도 있습니다. 하지만 이 글의 목표는 파일명을 계약 번호로 완전히 표준화하는 것이므로, "전체 파일명 덮어쓰기"를 선택하는 것이 가장 직접적입니다.
6단계: 계속 다음 단계로, 저장 위치 설정 및 처리 시작
표현식과 위치 설정을 완료한 후 하단의 "다음"을 클릭합니다. 이후 흐름은 "저장 위치 설정" 및 "처리 시작"으로 이어집니다. 인터페이스 안내에 따라 저장 방식을 선택한 후 처리를 실행하면 됩니다. 처리가 완료되면 폴더로 돌아가 파일명을 확인하여, PDF가 본문 속 계약 번호로 일괄 변경된 것을 볼 수 있습니다.
대량 파일을 정식으로 처리하기 전에, 먼저 소량의 샘플로 테스트하는 것이 좋습니다. 예를 들어 3~5개의 PDF를 먼저 가져와서 매칭 결과와 파일명 결과가 예상과 일치하는지 확인한 후 전체 폴더를 일괄 처리하는 것이 좋습니다. 이렇게 하면 표현식 설정 부정확으로 인한 대량 파일명 오류 위험을 낮출 수 있습니다.
자주 묻는 질문 및 주의사항
1. 왜 계약 번호를 직접 입력하지 않고 "\d{8}"을 사용하나요?
하나의 계약 번호를 직접 입력하면 단일 파일에만 매칭되지만, "\d{8}"은 '연속된 8자리 숫자'라는 텍스트 유형을 서술합니다. 일괄 이름 변경의 의의는 통일된 규칙으로 여러 파일을 처리하는 데 있으므로, 표현식을 사용하여 여러 PDF의 서로 다른 번호를 매칭하는 것이 더 적합합니다.
2. PDF 안에 8자리 숫자가 여러 개라면 어떻게 하나요?
하나의 PDF에 여러 개의 8자리 숫자가 나타나면, 소프트웨어가 그중 하나를 매칭할 수 있습니다. 파일명 결과가 부정확해지는 것을 피하려면, 파일 내용의 특징에 따라 표현식을 최적화하여 가능한 한 목표 번호만 매칭되도록 규칙을 만들어야 합니다. 처리 전에 몇 개의 PDF를 무작위로 확인하여 번호 형식이 유일한지 확인하는 것이 매우 중요합니다.
3. 스캔본 PDF도 이렇게 이름을 변경할 수 있나요?
PDF가 단순한 이미지 스캔 파일이고 본문 텍스트가 복사 가능한 텍스트로 인식되지 않았다면, 내용 기반 매칭으로는 번호를 얻지 못할 수 있습니다. 이러한 파일은 일반적으로 먼저 문자 인식을 수행하여 PDF 내용을 읽을 수 있게 만든 후, 내용 기반 이름 변경 기능을 사용해야 합니다.
4. 일괄 처리 전에 백업이 필요한가요?
특히 처음으로 표현식을 사용한 일괄 이름 변경을 시도할 때는 원본 파일 백업을 유지하는 것이 좋습니다. 일괄 처리가 효율성을 크게 높여주지만, 표현식 규칙이 부정확하게 설정되면 여러 파일의 이름이 예상과 달라질 수 있기 때문입니다. 먼저 백업하거나 소규모 배치로 테스트하는 것이 보다 안전한 오피스 파일 처리 습관입니다.
요약: 규칙으로 수동 이름 변경을 대체하여 PDF 보관 효율성 향상
이 글의 예시를 통해 HeSoft Doc Batch Tool 을(를) 사용하면, PDF를 일일이 열어 계약 번호를 찾고 복사하여 붙여넣고 이름을 변경해야 했던 작업을, 한 번의 파일 가져오기, 한 번의 표현식 설정, 일괄 처리 완료라는 흐름으로 바꿀 수 있음을 알 수 있습니다. 계약 PDF, 주문 PDF, 송장 PDF 및 각종 기록 PDF에 있어 이러한 내용 기반 일괄 파일명 변경 방법은 매우 실용적입니다.
폴더에 "1.pdf, 2.pdf, 스캔본.pdf"처럼 비즈니스 의미가 부족한 파일명이 많고, PDF 본문에 계약 번호, 주문 번호 또는 기록 번호가 포함되어 있다면, 먼저 몇 개의 파일로 표현식 매칭 효과를 테스트한 후 전체 자료를 일괄 처리하는 것을 권장합니다. 와일드카드 표현식이나 정규 표현식을 적절히 사용하면 반복적인 수작업을 크게 줄여 PDF 파일 정리를 더욱 표준화되고 효율적으로 만들 수 있습니다.