많은 PDF 파일을 1.pdf, 2.pdf, 3.pdf와 같은 임시 이름으로 계속 사용하면 이후 검색, 보관 및 전달이 매우 비효율적입니다. 본 문서는 계약 PDF를 예로 들어, HeSoft Doc Batch Tool 를 사용하여 파일 내용에서 번호를 찾고 와일드카드/정규 표현식 일치 규칙을 활용해 여러 PDF를 계약 번호.pdf로 일괄 이름 변경하는 방법을 소개합니다. 작업 과정에는 기능 선택, PDF 가져오기, 일치 표현식 설정, 저장 확인 및 처리를 시작하는 단계가 포함되며, 본문 정보에 따라 이름을 지정해야 하는 계약서, 주문서, 영수증, 보고서 등 사무 환경에 적합합니다.
일상 업무에서 많은 PDF 파일은 처음에 스캐너, 시스템 내보내기 또는 수동 임시 저장을 통해 생성되며, 파일 이름은 흔히 "1.pdf", "2.pdf", "3.pdf"와 같은 일련번호 형식입니다. 파일 몇 개 정도는 수동으로 열어서 번호를 확인하고 이름을 변경해도 괜찮지만, 폴더에 수십, 수백 개의 PDF 계약서, 주문서, 보고서 또는 영수증이 있다면 하나씩 처리하는 데 시간이 매우 오래 걸리고 번호를 잘못 복사하거나 파일 이름 변경을 누락하기 쉽습니다.
이 글에서 해결하려는 문제는 명확합니다. PDF 본문에 계약 번호, 주문 번호, 프로젝트 번호 등과 같은 고정된 형식의 번호가 포함되어 있을 때, 이 내용을 추출하여 일괄적으로 PDF 파일 이름으로 사용하는 것입니다. 스크린샷의 예시는 PDF 첫 페이지의 "Contract No." 뒤에서 8자리 숫자 번호를 식별한 다음, 원래의 1.pdf, 2.pdf, 3.pdf, 4.pdf를 각각 10026877.pdf, 20036655.pdf, 20100511.pdf, 33952100.pdf로 일괄 변경하는 것을 보여줍니다.
아래에서는 HeSoft Doc Batch Tool 의 인터페이스 스크린샷을 참고하여 "파일 내용을 사용하여 PDF 파일 이름 변경" 기능을 사용하는 방법과, 와일드카드와 유사한 일치 표현식(인터페이스에서는 "정규 표현식"이라고 함)을 통해 PDF 파일 이름 일괄 변경을 빠르게 완료하는 방법을 설명합니다.
적용 시나리오: 어떤 PDF가 내용 번호를 사용한 일괄 이름 변경에 적합한가
이 방법은 PDF 본문에 안정적이고 식별 가능한 텍스트가 존재하는 파일에 적합합니다. 예를 들어, 계약서 첫 페이지에 계약 번호, 인보이스나 영수증에 티켓 번호, 검사 보고서에 보고서 번호, 주문 PDF에 주문 번호, 기록 자료에 직원 번호나 프로젝트 번호가 있는 경우입니다. 이러한 번호가 PDF 텍스트에서 식별될 수 있고, 비교적 고정된 형식을 가지고 있다면 일치 표현식을 사용하여 일괄 추출할 수 있습니다.
스크린샷을 예로 들면, PDF 내용 중에 눈에 띄는 "Contract No."가 있고 그 뒤에 8자리 숫자 문자열이 따라옵니다. 수동으로 작업할 때는 PDF를 열어 빨간색 상자 안의 번호를 확인한 다음 파일 이름을 해당 번호로 변경하면 됩니다. 일괄 처리 소프트웨어의 경우, 각 PDF 내용에서 규칙에 맞는 텍스트를 소프트웨어가 자동으로 찾도록 하는 규칙을 설정해야 합니다.
파일이 PDF가 아니더라도 실제 기능에 따라 해당 모듈을 선택할 수 있습니다. 예를 들어 Word 문서는 docx나 doc일 수 있고, 텍스트 파일은 txt일 수 있습니다. 이 글은 PDF 일괄 이름 변경에 초점을 맞추지만, 그 개념은 파일 내용에 따라 파일 이름을 정리하는 많은 사무 작업 요구 사항에 똑같이 적용됩니다.
효과 미리보기: 처리 전과 후의 파일 이름 변화
처리 전: PDF 파일 이름은 단순 일련번호이며 내용을 알 수 없음
처리 전 폴더에는 4개의 PDF 파일이 있으며, 이름은 각각 1.pdf, 2.pdf, 3.pdf, 4.pdf입니다. 파일 이름만으로는 어떤 계약에 해당하는지 알 수 없고, 계약 번호로 직접 검색하거나 보관할 수도 없습니다.

그 중 하나의 PDF를 열면 본문 상단에 계약 번호가 포함된 것을 볼 수 있습니다. 스크린샷에서 빨간색 상자는 "10026877"이라는 8자리 숫자를 표시하며, 파일 이름으로 적합한 정보가 실제로 현재 파일 이름이 아닌 PDF 내용 내부에 있음을 보여줍니다.

처리 후: 파일 이름이 직접 PDF 본문의 번호로 변경됨
일괄 처리가 완료된 후, 원래의 4개 PDF는 해당 번호 파일 이름으로 변경되었습니다. 처리된 파일 이름에는 10026877.pdf, 20036655.pdf, 20100511.pdf, 33952100.pdf가 포함됩니다. 이렇게 하면 폴더에서 번호만으로 파일 내용을 직접 식별할 수 있으며, 계약 대장, 프로젝트 디렉터리 또는 보관 시스템으로 복사하기도 편리합니다.

이러한 명명 방식은 단순한 일련번호보다 장기적인 관리에 더 적합합니다. 이후 특정 계약 번호를 찾아야 할 경우, PDF를 하나씩 열어 확인할 필요 없이 폴더에서 번호를 검색하기만 하면 됩니다.
조작 순서: 와일드카드/정규 표현식을 사용하여 PDF 일괄 이름 변경하기
1단계: "파일 이름" 분류로 이동하여 PDF 내용 이름 변경 기능 선택
HeSoft Doc Batch Tool 를 연 후, 왼쪽 기능 분류에서 "파일 이름"을 선택합니다. 이 분류에는 파일 이름 키워드 찾기 및 바꾸기, 텍스트 삽입, 접두사 및 접미사 추가 등 파일 이름 일괄 수정과 관련된 기능이 집중 배치되어 있습니다.
현재 페이지에서 "7. 파일 내용을 사용하여 PDF 파일 이름 변경"을 선택합니다. 인터페이스 설명에서 이 기능이 "PDF 파일 내용의 특정 텍스트를 해당 파일의 파일 이름으로 일괄 설정"하는 데 사용됨을 알 수 있습니다. 이는 바로 이 글의 시나리오, 즉 PDF의 계약 번호를 추출하여 새로운 PDF 파일 이름으로 사용하는 것과 일치합니다.

이 기능을 선택하는 목적은 소프트웨어가 더 이상 기존 파일 이름만 처리하는 것이 아니라, PDF 내용 읽기 및 명명 규칙 설정 프로세스로 들어가도록 하는 것입니다. 계약 PDF, 보고서 PDF, 주문 PDF 등의 파일에 있어 이 단계는 번호 확인을 위해 수동으로 파일을 열어야 하는 작업 부하를 크게 줄여줍니다.
2단계: 처리할 PDF 추가 또는 폴더에서 가져오기
"파일 내용을 사용하여 PDF 파일 이름 변경" 기능에 진입하면 인터페이스는 1단계 "처리할 레코드 선택"으로 들어갑니다. 상단에서 "파일 추가", "폴더에서 파일 가져오기", "비우기", "더 보기" 등의 버튼을 볼 수 있습니다. 소량의 PDF에는 "파일 추가"를 사용할 수 있고, 폴더에 PDF가 많으면 "폴더에서 파일 가져오기"를 사용하는 것이 더 적합합니다.
스크린샷에는 이미 4개의 PDF가 가져와져 있으며, 목록에는 번호, 이름, 경로, 확장자, 생성 시간, 수정 시간 등의 정보가 표시됩니다. 파일 이름이 여전히 1.pdf, 2.pdf, 3.pdf, 4.pdf이고 확장자는 모두 pdf이며, 경로는 D 드라이브 테스트 디렉터리 아래에 있는 것을 볼 수 있습니다.

이 단계의 조작 목적은 어떤 PDF가 일괄 이름 변경에 참여할지 확인하는 것입니다. 가져온 후에는 먼저 레코드 수가 폴더의 대상 파일 수와 일치하는지 확인하고, 목록에 잘못 선택된 PDF가 없는지 확인하는 것이 좋습니다. 인터페이스 하단에 "레코드 수: 4"가 표시되어 있으며, 이는 이번에 4개의 파일이 처리될 것임을 나타냅니다.
파일에 오류가 없음을 확인한 후, 하단의 "다음"을 클릭하여 처리 규칙 설정으로 들어갑니다.
3단계: 사용자 정의 일치 텍스트 선택 및 표현식 입력
2단계 "처리 옵션 설정"으로 들어가면, 인터페이스는 "검색 영역" 선택 항목을 제공합니다. 스크린샷에서 볼 수 있는 옵션에는 "첫 번째 줄 텍스트", "첫 번째 바코드 이미지" 및 "사용자 정의 수식으로 일치하는 텍스트"가 포함됩니다. 이 예시에서는 PDF 본문에서 계약 번호를 일치시켜야 하며, 계약 번호는 8자리 숫자이므로 "사용자 정의 수식으로 일치하는 텍스트"를 선택합니다.
"정규 표현식" 입력 상자에 다음을 입력합니다:
\d{8}

여기서의 표현식은 더 강력한 와일드카드 규칙으로 이해할 수 있습니다. 이 중 \d는 숫자를 나타내고, {8}은 8회 연속 출현을 나타내므로, \d{8}은 PDF 내용에서 연속된 8자리 숫자와 일치합니다. 스크린샷의 계약 번호 10026877은 정확히 이 규칙에 부합합니다.
참고할 점은, 인터페이스 명칭은 "정규 표현식"을 사용하며, 이는 일반 와일드카드보다 더 정확합니다. 일반 와일드카드는 주로 파일 이름의 문자와 일치시키는 데 사용되지만, 여기서는 PDF 본문 텍스트에서 지정된 내용을 추출합니다. "8자리 계약 번호", "10자리 주문 번호", "고정 접두사 + 숫자"와 같은 시나리오에서는 정규 표현식이 더 적합합니다.
4단계: 명명 위치를 전체 파일 이름 덮어쓰기로 설정
동일한 설정 페이지에서 "위치" 옵션도 볼 수 있습니다. 스크린샷에는 "전체 파일 이름 덮어쓰기", "파일 이름 왼쪽에", "파일 이름 오른쪽에"가 포함되어 있습니다. 이 예시에서는 최종 파일 이름에 계약 번호만 남기고 원래의 1, 2, 3, 4를 더 이상 유지하지 않으려고 하므로 "전체 파일 이름 덮어쓰기"를 선택합니다.
"전체 파일 이름 덮어쓰기" 선택의 예상 결과는, 소프트웨어가 PDF 내용에서 8자리 숫자를 찾은 후 이 숫자로 원래 파일 이름 본체를 교체하고 PDF 확장자는 그대로 유지하는 것입니다. 예를 들어, 1.pdf는 10026877.pdf가 됩니다.
완전히 교체하는 것이 아니라 원래 파일 이름 앞뒤에 번호를 추가하려는 요구 사항이 있다면, 인터페이스에서 제공하는 옵션에 따라 "파일 이름 왼쪽에" 또는 "파일 이름 오른쪽에"를 선택할 수도 있습니다. 그러나 계약 보관 시나리오에서는 일반적으로 계약 번호를 직접 파일 이름으로 사용하는 것이 더 명확합니다.
설정 완료 후 "다음"을 클릭하여 계속해서 후속 저장 위치 및 처리 확인 프로세스로 진행합니다.
5단계: 저장 위치 확인 및 처리 시작
프로세스 바에서 이 기능에 후속으로 "저장 위치 설정" 및 "처리 시작" 두 단계가 더 있음을 볼 수 있습니다. 실제 작업 시, 저장 위치 단계 진입 후 자신의 보관 습관에 따라 출력 위치를 확인하는 것이 좋습니다. 중요한 계약서나 공식 문서인 경우, 유일한 원본을 직접 덮어쓰는 것은 권장하지 않으며, 먼저 새 폴더에 출력하고 오류가 없는지 확인한 후 교체하거나 보관할 수 있습니다.
저장 위치를 확인한 후 "처리 시작" 단계로 들어가 일괄 이름 변경을 실행합니다. 처리가 완료되면 폴더로 돌아가 결과를 확인합니다. 처리 후 스크린샷과 일치하게, 파일 이름은 PDF 내용에서 추출된 8자리 번호로 변경되어야 합니다.
자주 묻는 질문 및 주의 사항
1. 이것이 와일드카드 표현식이라고 하는데, 인터페이스에는 왜 정규 표현식이라고 표시되어 있나요?
많은 사용자가 "규칙에 따라 텍스트 일치"를 통칭하여 와일드카드 일치라고 부르는 데 익숙합니다. 엄밀히 말하면, 스크린샷의 입력 상자는 "정규 표현식"입니다. 정규 표현식은 와일드카드와 유사한 효과를 구현할 수 있으며, 번호, 날짜, 주문 번호 등 구조화된 텍스트를 일치시키는 데 더 적합합니다. 이 글에서 \d{8}은 연속된 8자리 숫자를 일치시키는 정규식 작성법입니다.
2. PDF에 8자리 숫자가 여러 개 있으면 어떻게 하나요?
만약 하나의 PDF 내에 연속된 8자리 숫자가 여러 개 존재한다면, 단순히 \d{8}을 사용하면 원하지 않는 숫자와 일치할 수 있습니다. 이때는 PDF 내용 특성에 따라 표현식을 조정하여, 규칙이 목표 번호에 최대한 가깝도록 해야 합니다. 예를 들어 고정 문자, 번호 접두사 또는 위치를 결합하여 정확도를 높입니다. 정식으로 일괄 처리하기 전에 소수의 파일로 테스트하는 것이 좋습니다.
3. PDF가 스캔 이미지라면 번호를 직접 인식할 수 있나요?
이 글의 스크린샷에 있는 PDF 내용은 소프트웨어에 의해 텍스트 규칙으로 일치될 수 있습니다. PDF가 단순한 이미지 스캔본이고 식별 가능한 텍스트 레이어가 없는 경우, 내용 추출이 영향을 받을 수 있습니다. 이런 상황이 발생하면, 먼저 PDF의 문자를 선택하여 복사할 수 있는지 확인한 후, 내용으로 이름을 변경하는 데 적합한지 결정해야 합니다.
4. 일괄 이름 변경 전에 백업이 필요한가요?
특히 계약, 재무, 법무, 프로젝트 기록 등 중요한 파일의 경우 백업을 권장합니다. 일괄 처리의 장점은 속도가 빠르다는 것이지만, 이는 동시에 규칙 설정 오류 시 여러 파일에 영향을 줄 수 있음을 의미하기도 합니다. 따라서 먼저 테스트 디렉터리를 복사하고, 표현식과 출력 결과가 올바른지 확인한 후에 정식 파일을 처리하는 것이 좋습니다.
5. 파일 이름에 포함할 수 있는 문자는 무엇인가요?
이 예시에서 추출하는 것은 순수한 숫자 번호이므로, 일반적으로 파일 이름에 사용할 수 없는 문자 문제를 발생시키지 않습니다. 만약 계약 명칭, 고객명 등 텍스트를 추출하는 경우, Windows 파일 이름에서 지원하지 않는 특수 기호에 주의해야 합니다. 명명 실패나 결과 이상 발생 시, 추출된 텍스트에 파일 이름으로 적합하지 않은 문자가 포함되어 있는지 확인해야 합니다.
요약: 내용 일치 규칙으로 반복되는 이름 변경 작업 줄이기
HeSoft Doc Batch Tool 의 "파일 내용을 사용하여 PDF 파일 이름 변경" 기능을 통해, 원래 수동으로 PDF를 열고 번호를 찾고, 번호를 복사하고, 파일 이름을 수정해야 했던 반복 과정을 하나의 규칙 설정 및 일괄 실행으로 바꿀 수 있습니다. 계약 PDF, 주문 PDF, 보고서 PDF, 영수증 PDF 등의 파일에 있어, 와일드카드/정규 표현식을 사용하여 본문의 번호를 추출하면 파일 정리 효율을 크게 높일 수 있습니다.
만약 폴더에도 1.pdf, 2.pdf, 스캔본.pdf, 내보내기 파일.pdf 등 관리하기 어려운 PDF가 많이 있다면, 먼저 몇 개의 샘플을 골라 본문의 번호 형식을 확인한 다음, 이 글의 단계에 따라 일치 표현식을 설정하는 것이 좋습니다. 규칙 검증에 오류가 없는 것을 확인한 후, 전체 폴더를 일괄 가져와 처리하면 더욱 안전하고 효율적으로 PDF 일괄 이름 변경을 완료할 수 있습니다.