PDF 파일 이름이 1.pdf, 2.pdf, 3.pdf인 경우 이후 검색 및 보관이 매우 번거롭습니다. 본문에서는 HeSoft Doc Batch Tool 을 예로 들어 "파일 내용으로 PDF 파일 이름 변경" 기능에 진입하여 여러 PDF 파일을 가져오고, 정규 표현식 \d{8}을 사용하여 본문 내 8자리 번호를 매칭시켜 최종적으로 번호로 명명된 PDF 파일을 일괄 생성하는 방법을 설명합니다. 이는 계약서, 주문서, 문서 및 스캔 파일 정리에 적합합니다.
사무실에서 자주 마주치는 PDF 유형이 있습니다. 폴더 안에는 정갈하게 정리되어 있지만 파일 이름은 1.pdf, 2.pdf, 3.pdf, 4.pdf에 불과합니다. 실제로 아카이빙해야 할 때가 되어서야 이러한 파일명에 어떤 업무적 의미도 없다는 것을 깨닫게 됩니다. 어떤 파일이 특정 계약서인지, 어떤 파일이 특정 주문에 해당하는지 알려면 일일이 PDF를 열어 내용을 확인해야 합니다. 파일이 몇 개 없을 때는 괜찮지만, 수십 개, 수백 개라면 수동으로 확인하고 이름을 바꾸는 것은 전형적인 반복 작업이 됩니다.
더 번거로운 점은 사람이 직접 이름을 바꾸면 실수하기 쉽다는 것입니다. 예를 들어 계약 번호를 한 자리 덜 복사하거나, A 파일의 번호를 B 파일 이름에 적거나, 같은 번호를 반복해서 붙여넣는 경우, 이 모든 것이 추후 검색과 아카이빙에 영향을 줍니다. 계약서, 주문서, 고객 자료, 프로젝트 파일 등의 사무 문서에 있어 올바른 파일 이름은 매우 중요합니다. 이 글에서는 사무용 소프트웨어로 여러 PDF의 본문 내용을 일괄적으로 읽어 들여, 와일드카드/정규 표현식으로 번호를 매칭한 뒤, 그 번호를 PDF 파일명으로 자동 설정하는 더 효율적인 방법을 소개합니다.
이 글에서 사용된 소프트웨어는 HeSoft Doc Batch Tool 입니다. 사무용 파일 일괄 처리 소프트웨어로, 대량의 PDF, Word, Excel, 이미지, 텍스트 파일 등을 처리하여 사용자의 반복 작업을 줄이는 데 적합합니다. 아래에서는 PDF 파일이 내용 매칭을 통해 어떻게 일괄적으로 파일명을 변경할 수 있는지 중점적으로 살펴보겠습니다.
적용 시나리오
보유한 PDF 파일이 다음 특징을 충족한다면, 이 글에서 소개하는 방법을 사용하기에 매우 적합합니다.
- 파일명에 업무적 의미가 없는 경우 (예: 1.pdf, 2.pdf, 스캔1.pdf, download.pdf 등).
- PDF 본문에 계약 번호, 주문 번호, 신청 번호, 고객 번호 등 안정적인 형태의 번호가 존재하는 경우.
- 번호 형식이 비교적 통일된 경우 (예: 모두 연속된 8자리 숫자).
- 파일 한두 개가 아니라 여러 개의 PDF를 일괄 처리해야 하는 경우.
- 최종 파일명이 검색, 정렬, 공유 및 아카이빙에 용이하기를 바라는 경우.
예시 속의 PDF는 여러 계약서 파일입니다. 각 PDF 안에는 "Contract No."에 해당하는 8자리 숫자 번호가 있습니다. 목표는 단순히 파일명에 접두사나 접미사를 추가하는 것이 아니라, PDF 내용에서 번호를 추출하여 새로운 파일명으로 만드는 것입니다.
이 방법은 다른 사무 자료에도 동일하게 사용할 수 있습니다. 예를 들어 구매 주문서에 8자리 주문 번호가 있거나, 프로젝트 보고서에 프로젝트 번호가 있거나, 결재 서류에 문서 번호가 있어, 번호가 규칙으로 식별될 수만 있다면 비슷한 방식으로 일괄 이름 변경이 가능합니다. Word 문서를 처리할 때는 보통 doc, docx 등의 형식이, Excel 표를 처리할 때는 xls, xlsx 등의 형식이 관련됩니다. 이 글에서는 PDF 파일을 사용하므로, 기능 진입점으로 PDF 내용과 관련된 이름 변경 기능을 선택합니다.
결과 미리보기: 무의미한 일련번호에서 검색 가능한 번호로
처리 전: 숫자 일련번호만 있는 PDF 파일
처리 전 폴더에는 1.pdf, 2.pdf, 3.pdf, 4.pdf라는 이름의 PDF 4개가 있습니다. 이러한 명명 방식은 파일 수와 대략적인 순서만 나타낼 뿐, 파일의 내용은 전혀 나타내지 못합니다.

그중 하나의 PDF를 열어보면, 본문 첫 페이지에 계약 번호 정보가 포함되어 있습니다. 스크린샷에서 빨간색 상자로 표시된 "10026877"이 바로 파일명으로 사용하고자 하는 내용입니다. 즉, 파일명은 1.pdf이지만 문서 내부에는 이미 파일명으로 더 적합한 번호가 존재합니다.

처리 후: 각 PDF가 본문 번호에 따라 명명됨
일괄 처리 기능을 사용한 후, 파일명은 10026877.pdf, 20036655.pdf, 20100511.pdf, 33952100.pdf로 변경되었습니다. 새 파일명은 PDF 본문의 번호와 직접 대응되므로, 나중에 특정 계약이나 주문을 찾을 때 번호만 검색하면 됩니다.

사무 관리 관점에서 보면 이러한 명명 방식이 더 규범적입니다. 수동으로 파일을 확인하는 횟수를 줄여줄 뿐만 아니라, 폴더 구조를 더욱 명확하게 만들어 동료에게 인계하거나, 시스템에 업로드하거나, 장기 보관용 아카이브로 저장하는 데 적합합니다.
작업 절차
1단계: 파일 이름 분류에서 PDF 내용 이름 변경 기능 선택하기
HeSoft Doc Batch Tool 를 실행하면 왼쪽에 기능 분류 탐색 메뉴가 있습니다. 스크린샷에서 "파일 이름" 분류가 선택된 것을 볼 수 있으며, 메인 영역에는 파일명과 관련된 여러 일괄 처리 기능이 표시됩니다.
이 기능들 중에서 "7. 파일 내용을 사용하여 PDF 파일 이름 바꾸기"를 선택합니다. 기능 설명을 보면, PDF 파일 내용의 특정 텍스트를 해당 파일의 이름으로 일괄 지정하는 데 사용됩니다. 이것이 바로 우리가 달성하려는 효과입니다. PDF 본문에서 번호를 추출하여, 수동으로 하나씩 바꾸는 대신 사용하는 것입니다.

이 단계의 핵심은 올바른 기능 진입점을 선택하는 것입니다. 단순히 파일명에 접두사를 추가하거나, 텍스트를 삭제하거나, 키워드를 바꾸는 것이라면 다른 파일 이름 변경 기능으로도 가능할 수 있습니다. 하지만 PDF 내부 텍스트를 읽어 들여야 한다면, 반드시 "파일 내용을 사용하여 PDF 파일 이름 바꾸기"를 선택해야 합니다.
2단계: PDF 파일 추가 및 처리 대상 목록 확인하기
기능에 진입하면 페이지 상단에 현재 작업 이름이 표시되고, 진행 표시줄에는 "처리할 레코드 선택, 처리 옵션 설정, 저장 위치 설정, 처리 시작" 단계를 거쳐야 함이 표시됩니다. 첫 번째 단계에서는 처리해야 할 PDF를 목록에 추가해야 합니다.
인터페이스 오른쪽 상단에 "파일 추가" 및 "폴더에서 파일 가져오기" 버튼이 있습니다. 파일이 적다면 "파일 추가"를 사용할 수 있고, 폴더 전체가 처리 대상 PDF라면 "폴더에서 파일 가져오기"가 더 효율적입니다. 스크린샷 속 목록에는 이미 4개의 파일이 추가되어 있으며, 이름은 1.pdf, 2.pdf, 3.pdf, 4.pdf이고 확장자는 모두 pdf입니다.

목록에는 경로, 생성 시간, 수정 시간 등의 정보도 표시됩니다. 이 정보는 파일 출처가 올바른지 확인하는 데 도움을 줍니다. 예를 들어 스크린샷의 경로는 D 드라이브 test 디렉터리로 표시되어, 현재 처리 중인 것이 테스트 디렉터리의 PDF임을 알 수 있습니다. 실제 처리 시에는 경로를 먼저 확인하여 다른 디렉터리의 파일을 잘못 처리하는 것을 피하는 것이 좋습니다.
만약 목록에 처리할 필요가 없는 파일이 있다면, 작업 열의 삭제 버튼을 통해 제거할 수 있습니다. 파일 수와 이름에 이상이 없는지 확인한 후 하단의 "다음"을 클릭합니다.
3단계: 사용자 정의 수식 매칭 텍스트 선택 및 표현식 입력하기
두 번째 "처리 옵션 설정" 단계로 들어서면, 소프트웨어에게 PDF 콘텐츠의 어느 부분을 추출할지 알려줘야 합니다. 스크린샷에서 "찾기 영역"은 "사용자 정의 수식에 매칭된 텍스트"를 선택하고 있습니다. 이는 소프트웨어가 사용자가 입력한 규칙에 따라 PDF 본문에서 텍스트를 찾는다는 의미입니다.
"정규식" 입력 상자에 "\d{8}"을 입력합니다. 이 규칙의 의미는 연속된 8자리 숫자를 매칭하는 것입니다. 예시 PDF의 계약 번호가 정확히 8자리 숫자이므로, 10026877, 20036655, 20100511, 33952100과 같은 번호를 자동으로 식별할 수 있습니다.

여기서 \d{8}은 정밀한 매칭을 위한 와일드카드 표현식의 일종으로 이해하면 됩니다. 일반적인 와일드카드는 '임의의 문자'나 '임의의 길이' 정도만 표현하는 경우가 많지만, 정규 표현식은 '숫자'와 '자릿수'를 명확하게 지정할 수 있습니다. 일괄 파일명 변경에 있어서 이런 방식이 문서에서 규칙적인 번호를 추출하는 데 더 적합합니다.
같은 페이지의 "위치" 영역에서는 "전체 파일 이름 덮어쓰기"가 선택되었습니다. 이는 매칭된 번호가 원래 파일명의 주체를 대체한다는 의미입니다. 1.pdf를 예로 들면, 10026877과 매칭된 후 파일명은 10026877.pdf가 됩니다. 원래 파일명을 유지하면서 왼쪽이나 오른쪽에 번호를 삽입하려면 다른 위치 옵션을 선택해야 하지만, 본 예시의 목표는 번호만으로 완전히 명명하는 것이므로 전체 파일명 덮어쓰기가 가장 직접적입니다.
4단계: 저장 위치 설정 및 일괄 처리 실행하기
표현식과 파일명 위치를 설정한 후 "다음"을 클릭합니다. 페이지 흐름에 따르면, 다음으로 저장 위치를 설정한 후 "처리 시작" 단계로 진입하게 됩니다. 스크린샷에는 후속 페이지가 나와 있지 않지만, 진행 표시줄에 이 두 단계가 명확히 표시되어 있습니다.
정식으로 실행하기 전에 저장 전략을 고려하는 것이 좋습니다. 원본 파일이 매우 중요한 경우, 먼저 새 폴더에 결과를 출력한 후 모든 파일명이 올바른지 확인하는 것이 좋습니다. 이상이 없음을 확인한 후, 결과물을 정식 아카이빙 디렉터리로 옮기십시오. 이렇게 하면 처리 전 파일을 보존하여 일괄 작업으로 인한 위험을 줄일 수 있습니다.
처리 시작을 클릭하면, 소프트웨어는 목록 속 PDF 콘텐츠를 하나씩 읽어 들여 \d{8} 규칙에 맞는 텍스트를 찾고, 매칭 결과를 파일명에 기록합니다. 처리가 끝나면 출력 폴더를 열어 일괄적으로 이름이 변경된 PDF를 확인할 수 있습니다.
표현식 설정 제안
본 예시에서는 계약 번호가 8자리 숫자이므로 \d{8}을 사용했습니다. 파일의 번호 형식이 다르다면 규칙을 조정해야 합니다. 일반적인 방식은 다음과 같습니다.
- 6자리 숫자 번호: \d{6} 사용을 고려할 수 있습니다.
- 10자리 숫자 번호: \d{10} 사용을 고려할 수 있습니다.
- 번호 자릿수가 고정되지 않은 경우: 실제 파일 내용을 바탕으로 더 적절한 규칙을 설계해야 합니다.
- 번호 주변에 고정된 문자가 있는 경우: 고정 문자를 결합하면 매칭 정확도를 높일 수 있습니다.
하지만 규칙이 단순할수록 관련 없는 내용과 매칭될 가능성이 높다는 점에 유의해야 합니다. 예를 들어 PDF에 계약 번호, 날짜, 전화번호, 금액 코드가 동시에 있고, 그중에 연속된 8자리 숫자가 있다면, 단순히 \d{8}만으로는 어떤 것이 파일명으로 필요한 번호인지 구분하지 못할 수 있습니다. 따라서 일괄 처리 전에 반드시 샘플 PDF를 추출 검사하여 매칭 결과가 업무상 필요한 번호와 일치하는지 확인하십시오.
자주 묻는 질문 및 주의사항
1. 파일명에서 직접 찾아 바꾸기를 사용하지 않는 이유는 무엇인가요?
처리 전 파일명이 1.pdf, 2.pdf 같은 일련번호이기 때문에 원본 파일명 안에는 계약 번호가 없습니다. 찾아 바꾸기는 기존 파일명의 텍스트만 수정할 수 있으며, PDF 본문에서 번호를 읽어 올 수 없습니다. 본 예시에서는 반드시 "파일 내용을 사용하여 PDF 파일 이름 바꾸기"와 같은 내용 읽기 기능을 사용해야 합니다.
2. \d{8}을 사용하면 날짜와 매칭될 수도 있지 않나요?
가능합니다. PDF에 20260603 같은 연속 8자리 날짜가 있고, 이것이 계약 번호보다 먼저 식별된다면 결과에 영향을 줄 수 있습니다. 따라서 먼저 몇 개의 샘플을 테스트해보는 것이 좋습니다. 문서에 여러 개의 8자리 숫자가 있다면 더 정밀한 규칙을 설계하거나, PDF 내 번호의 위치와 형식이 충분히 안정적인지 확인해야 합니다.
3. 폴더 전체를 한 번에 가져올 수 있나요?
가능합니다. 스크린샷의 기능 페이지에서 "폴더에서 파일 가져오기" 버튼을 제공하며, 동일한 디렉터리의 PDF를 일괄적으로 가져오는 데 적합합니다. 대량의 계약서, 주문서 또는 스캔 파일의 경우, 파일을 하나씩 추가하는 것보다 훨씬 시간을 절약할 수 있습니다.
4. 처리 후 확장자가 변경되나요?
PDF 파일의 이름을 변경하는 것이므로 파일 확장자는 여전히 pdf입니다. 예시에서 처리된 파일명은 10026877.pdf, 20036655.pdf 등으로, 파일명의 주요 부분만 번호로 대체되고 파일 형식에는 변화가 없음을 알 수 있습니다.
5. 스캔본 PDF에도 이 방법을 사용할 수 있나요?
PDF에 인식 가능한 텍스트 레이어가 있다면 일반적으로 내용 매칭이 가능합니다. 만약 단순한 이미지 스캔본이고 텍스트 레이어가 없다면, 소프트웨어가 그 안의 번호를 직접 읽지 못할 수 있습니다. 이러한 파일을 처리하기 전에, 먼저 PDF 뷰어에서 번호를 선택하거나 복사할 수 있는지 테스트해보십시오. 불가능하다면 먼저 OCR 인식을 수행해야 할 수도 있습니다.
요약
많은 PDF를 본문의 번호로 일괄 이름 변경하는 핵심은 두 가지입니다. 하나는 PDF 내용을 읽을 수 있는 일괄 이름 변경 기능을 선택하는 것이고, 다른 하나는 올바른 매칭 규칙을 설정하는 것입니다. HeSoft Doc Batch Tool 에서 제공하는 "파일 내용을 사용하여 PDF 파일 이름 바꾸기" 기능을 통해, 사용자는 표현식을 사용하여 PDF 본문에서 텍스트를 추출하고 자동으로 파일명을 바꿀 수 있습니다.
예시 속의 계약서 PDF의 경우, 파일을 가져오고 "사용자 정의 수식에 매칭된 텍스트"를 선택한 다음, \d{8}을 입력하고 전체 파일명을 덮어쓰도록 설정하기만 하면, 1.pdf, 2.pdf와 같은 임시 이름을 계약 번호 이름으로 일괄 변경할 수 있습니다. 먼저 소량의 파일로 규칙을 테스트하여 결과가 정확한지 확인한 후, 전체 폴더를 일괄 처리하는 것을 권장합니다. 이렇게 하면 효율성을 높이는 동시에 사무 파일 아카이빙의 정확성을 보장할 수 있습니다.