많은 PDF 자료가 수신되거나 스캔된 후 1.pdf, 2.pdf 등 임시 이름으로 지정되지만, 정말 가치 있는 계약 번호나 주문 번호는 대부분 PDF 본문에 있습니다. 본 문서는 사무실 일괄 처리에 더 적합한 방법을 소개합니다: HeSoft Doc Batch Tool 을(를) 사용하여 "파일 내용으로 PDF 파일 이름 변경" 기능에 접근한 후, 여러 개의 PDF를 가져와 표현식으로 연속된 8자리 숫자를 매칭하고, 매칭 결과를 원래 파일 이름에 덮어씁니다. 처리 후 파일 이름은 자동으로 본문 속 번호로 변경되어 검색, 보관 및 공유가 용이해집니다.
일상 업무에서 PDF 파일은 종종 이메일 첨부, 스캔 보관, 시스템 내보내기 또는 제3자 전송을 통해 유입됩니다. 파일 내용은 계약 번호, 주문 번호, 고객 번호 등 핵심 정보를 포함하여 매우 정형화되어 있을 수 있지만, 파일 이름은 "1.pdf", "2.pdf", "3.pdf"처럼 매우 임의적인 경우가 많습니다. 이러한 파일들이 프로젝트 기록, 계약 대장 또는 공유 폴더에 편입될 때 임시 파일명을 그대로 사용하면 이후 검색이 매우 번거로워집니다.
기존 방식은 PDF를 일일이 열어 본문에서 번호를 찾은 후, 다시 폴더로 돌아가 수동으로 이름을 변경하는 것입니다. 이 방법은 간단해 보이지만 파일 수가 많아지면 많은 시간이 소요되고, 번호를 잘못 읽거나 복사 시 누락이 발생하거나 파일 이름이 중복되는 등의 문제가 생기기 쉽습니다. 본문에서 소개하는 방법은 HeSoft Doc Batch Tool 과 같은 사무 환경용 일괄 파일 처리 소프트웨어를 통해 표현식을 사용하여 PDF 내용에서 번호를 매칭하고, 해당 번호를 파일 이름에 자동으로 기입하는 것입니다.
본문 예시의 목표는 명확합니다. 업무 의미가 없던 PDF 파일명을 PDF 본문에 있는 8자리 계약 번호로 일괄 변경하는 것입니다. 전체 과정은 처리 전 상태, 소프트웨어 설정 단계 및 처리 후 명명 효과를 스크린샷과 함께 설명하여 '내용으로 찾기'와 'PDF 일괄 이름 변경'을 결합하는 방법을 이해하도록 돕습니다.
적용 시나리오: PDF 본문에서 번호를 추출하여 파일명으로 사용해야 하는 경우
PDF 내용에 따라 자동으로 이름을 변경하는 방식은 파일명은 비정형적이지만 본문 정보는 비교적 정형화된 자료에 적합합니다. 예를 들어 계약서 첫 페이지에는 보통 "Contract No." 또는 "계약 번호"가 나타나고, 주문 파일에는 "주문 번호"가, 인보이스, 입금 확인증, 검사 보고서, 시험 성적서 등에도 고유 번호가 포함되어 있는 경우가 많습니다. 이러한 번호가 각 PDF 내에서 비교적 고정된 형식을 가지고 있다면 표현식을 사용하여 일괄 매칭할 수 있습니다.
본문 예시에서는 연속된 8자리 숫자 번호를 사용합니다. 이러한 유형의 번호는 "\d{8}"과 같은 정규 표현식을 사용하여 추출할 수 있습니다. 많은 사용자들이 이러한 규칙을 흔히 와일드카드 표현식이라고 부르지만, 소프트웨어 인터페이스에서는 '정규 표현식' 입력란에 해당합니다. 이들의 공통 기능은 규칙을 사용하여 찾고자 하는 텍스트를 기술하는 것이지, 구체적인 내용을 하나씩 입력하는 것이 아닙니다.
이러한 방법은 특히 다음과 같은 사무 요구에 적합합니다:
- 계약서 PDF를 정리하여 파일 이름을 계약 번호로 변경하는 경우.
- 고객 자료를 정리하여 파일 이름을 고객 번호나 기록 번호로 변경하는 경우.
- 주문 PDF를 정리하여 파일 이름을 주문 번호로 변경, Excel 대장과의 대조를 용이하게 하는 경우.
- 보고서나 증명서를 정리하여 파일 이름을 보고서 번호, 검사 번호로 변경하는 경우.
- 다운로드나 스캔으로 생성된 임시 PDF 파일을 검색 가능한 정형화된 이름으로 통일하는 경우.
수동으로 이름을 변경하는 것과 비교하여, 사무용 소프트웨어로 일괄 처리하면 규칙의 일관성을 유지하고 반복적인 노동을 줄일 수 있습니다. 특히 파일 수가 많고 명명 규칙이 통일된 시나리오에서 효율성 향상이 매우 두드러집니다.
효과 미리보기: 무의미한 일련번호에서 검색 가능한 계약 번호로
처리 전: 파일 이름이 단순한 숫자에 불과함
처리 전 폴더에는 PDF 파일명이 "1.pdf, 2.pdf, 3.pdf, 4.pdf"입니다. 이 이름들은 파일 순서만 나타낼 뿐 계약 번호, 고객 정보 또는 업무 내용을 전혀 반영하지 못합니다. 파일이 많을수록 이러한 명명 방식은 관리 비용을 증가시킵니다.

동료가 계약 번호 "10026877" 파일을 찾아달라고 요청하면, 폴더에서 바로 검색할 수 없어 각 PDF를 열어 하나씩 확인해야 합니다. 이것이 바로 이 글에서 해결하고자 하는 핵심 문제점입니다. 파일 내용에는 번호가 있지만 파일 이름에는 번호가 없는 것입니다.
PDF 본문에 추출 가능한 번호가 존재함
그중 하나의 PDF를 열면 계약서 본문 상단에 계약 번호가 있는 것을 볼 수 있습니다. 스크린샷에서 빨간색 화살표와 빨간색 박스로 표시된 "10026877"이 대상 텍스트이며, "Contract No." 뒤에 위치해 파일 이름으로 사용하기에 매우 적합한 고유 식별자입니다.

다른 PDF에도 동일한 형식의 8자리 번호가 존재하기만 하면 표현식을 통해 일괄 인식할 수 있습니다. 이어서 "\d{8}"을 사용하여 연속된 8자리 숫자를 매칭하고, 매칭된 결과를 원래 파일 이름에 덮어쓸 것입니다.
처리 후: 파일 이름이 자동으로 본문 번호로 변경됨
일괄 처리가 완료된 후, 폴더 내 PDF 이름은 원래의 일련번호에서 계약 번호로 변경되었습니다. 처리 결과는 다음과 같습니다:

처리 후 파일 이름은 "10026877.pdf, 20036655.pdf, 20100511.pdf, 33952100.pdf"를 포함합니다. 이 이름들은 더 명확하여 파일 내용을 직접적으로 반영할 뿐만 아니라 계약 대장, 고객 자료, 메일 기록 또는 업무 시스템 내 번호와 대응시키기에도 용이합니다.
조작 단계: 표현식을 사용하여 PDF 파일 일괄 이름 변경
1단계: 파일 이름 분류에서 PDF 내용 이름 변경 기능 선택
HeSoft Doc Batch Tool 를 시작하면 왼쪽에서 파일 이름, 폴더 이름, 파일 정리, Word 도구, Excel 도구, PowerPoint 도구, PDF 도구 등 여러 도구 분류를 볼 수 있습니다. 이 글에서 다루는 것은 파일 이름이므로 먼저 '파일 이름' 분류로 들어갑니다.
기능 카드에서 '파일 내용을 사용하여 PDF 파일 이름 변경'을 선택합니다. 이 기능의 설명은 여러 PDF 파일 내용 중의 특정 텍스트를 해당 파일의 파일명으로 사용하는 것이므로, 본문의 계약 번호에 따라 PDF 이름을 바꾸려는 요구 사항에 정확히 부합합니다.

이 단계의 예상 결과는 마법사 방식의 처리 인터페이스로 진입하는 것입니다. 이후 작업은 처리할 기록 선택, 처리 옵션 설정, 저장 위치 설정, 처리 시작의 네 가지 단계로 진행됩니다. 이러한 절차는 각 단계를 먼저 확인하고 진행할 수 있어 오작동 확률을 낮추므로 대량 파일 작업에 적합합니다.
2단계: 이름을 변경할 PDF 파일 가져오기 및 목록 확인
"파일 내용을 사용하여 PDF 파일 이름 변경" 페이지에 들어가면 먼저 처리할 파일을 추가해야 합니다. 인터페이스 오른쪽 상단에서 "파일 추가", "폴더에서 파일 가져오기", "비우기", "더 보기" 등의 버튼을 확인할 수 있습니다. 소량의 파일은 "파일 추가"를 사용할 수 있고, 한 폴더 전체가 처리할 PDF라면 "폴더에서 파일 가져오기"를 사용할 수 있습니다.

스크린샷에는 4개의 레코드가 이미 가져와 있으며, 이름은 각각 "1.pdf, 2.pdf, 3.pdf, 4.pdf"이고 경로는 D 드라이브 테스트 디렉터리에 있으며 확장자명은 모두 pdf입니다. 가져온 후에는 세 가지를 중점적으로 확인해야 합니다. 첫째, 파일 수가 올바른지, 둘째, 확장자명이 모두 처리해야 할 PDF인지, 셋째, 목록에 관련 없는 파일이 혼입되었는지입니다.
목록에 처리할 필요 없는 파일이 나타나면 작업 열의 삭제 버튼을 통해 제거할 수 있으며, 가져오기가 잘못된 경우 "비우기"를 사용한 후 다시 추가할 수 있습니다. 이상 없음을 확인한 후 하단의 "다음"을 클릭하여 처리 옵션 설정으로 이동합니다.
3단계: 검색 영역으로 "사용자 정의 공식과 매칭된 텍스트" 선택
"처리 옵션 설정" 페이지에서는 먼저 소프트웨어가 PDF의 어느 위치에서 텍스트를 추출할지 결정해야 합니다. 인터페이스의 '검색 영역'은 "첫 번째 줄 텍스트", "첫 번째 바코드 이미지" 및 "사용자 정의 공식과 매칭된 텍스트"를 포함한 여러 옵션을 제공합니다.
계약 번호가 PDF의 첫 번째 줄이라고 단정할 수 없고, 8자리 숫자를 매칭할 규칙을 사용해야 하므로 "사용자 정의 공식과 매칭된 텍스트"를 선택합니다. 스크린샷에서 해당 옵션이 선택되어 있습니다.

이 항목을 선택하는 의미는, 소프트웨어가 단순히 고정된 위치의 텍스트를 가져오는 것이 아니라 작성한 표현식에 따라 PDF 본문에서 대상 콘텐츠를 찾는다는 점입니다. 계약서 판형이나 머리글 레이아웃이 달라도 번호 형식이 일치하는 파일들에게 이 방법이 일반적으로 더 유연하게 적용됩니다.
4단계: 정규 표현식에 "\d{8}" 입력
"정규 표현식" 입력란에 "\d{8}"을 기입합니다. 여기서 "\d"는 숫자를 나타내고 "{8}"은 8회 연속 출현을 의미하므로, 전체 표현식은 "연속된 8자리 숫자 매칭"을 의미합니다. 예시 PDF의 계약 번호가 바로 8자리 숫자이므로 이 규칙으로 인식될 수 있습니다.
이 단계는 PDF 파일을 일괄 이름 변경하는 핵심입니다. 각 PDF에 구체적으로 어떤 번호가 있는지 알 필요도, 사전에 번호 목록을 정리할 필요도 없이 소프트웨어에 "번호가 어떻게 생겼는지"만 알려주면 됩니다. 소프트웨어는 각 PDF에 동일한 매칭 로직을 실행하고, 매칭된 텍스트를 파일 이름에 사용합니다.
실제 파일이 8자리 숫자가 아니라 다른 규칙이라면, 번호 형식에 따라 표현식을 조정해야 합니다. 예를 들어 번호에 문자, 대시 또는 연도가 포함될 수 있습니다. 하지만 본문의 스크린샷은 8자리 숫자 매칭을 보여주므로 예시는 "\d{8}"을 기준으로 하며, 다른 인터페이스 기능을 꾸며내어 확장하지 않습니다.
5단계: 매칭 결과를 전체 파일 이름 덮어쓰기로 설정
"위치" 영역에서 "전체 파일 이름 덮어쓰기"를 선택합니다. 이렇게 처리하면 원래 파일 이름 본체가 매칭된 번호로 대체되고 파일 확장자명은 계속 pdf로 유지됩니다. 예시 파일의 경우 "1.pdf"는 "10026877.pdf"가 됩니다.
이 설정은 파일 이름을 완전히 표준화하려는 시나리오에 적합합니다. 원래 파일 이름에 보존할 가치가 없다면 전체 파일 이름을 덮어쓰는 것이 가장 명확합니다. 실제 업무에서 원래 이름을 유지해야 한다면 인터페이스에서 제공하는 위치 옵션에 따라 왼쪽 또는 오른쪽에 추가하는 것을 고려할 수 있지만, 본문 예시의 최종 효과는 번호로 완전히 대체하는 것입니다.
6단계: 저장 위치 설정 후 일괄 처리 실행
표현식 및 명명 위치 설정을 완료한 후 "다음"을 클릭합니다. 인터페이스 절차에는 이후 "저장 위치 설정"과 "처리 시작"이 더 있습니다. 마법사 안내에 따라 저장 위치 설정을 완료한 후 처리를 시작하면 됩니다. 처리가 끝나면 대상 폴더를 열어 PDF 파일 이름이 본문 속 8자리 번호로 변경된 것을 확인할 수 있습니다.
중요 자료의 경우 처음부터 모든 파일을 처리하는 것은 권장하지 않습니다. 먼저 대표적인 PDF 몇 개를 선택하여 테스트하고 각 파일에서 올바른 번호가 추출되는지 확인한 후 전체 폴더를 일괄 처리하는 것이 좋습니다. 이렇게 하면 표현식의 정확성을 검증할 수 있을 뿐만 아니라 파일 형식 차이로 인해 명명 결과가 예상과 달라지는 것을 방지할 수 있습니다.
자주 묻는 질문 및 주의사항
1. 표현식이 번호를 매칭하지 못하면 어떻게 합니까?
먼저 PDF 본문의 번호가 인식 가능한 텍스트인지 확인합니다. PDF가 순수 이미지 스캔본이라면 소프트웨어가 그 안의 문자를 직접 읽지 못할 수 있습니다. 다음으로 표현식이 번호 형식과 일치하는지 확인합니다. 예를 들어 번호가 8자리 숫자가 아닌 경우 "\d{8}"이 맞지 않을 수 있습니다.
2. 처리 전에 파일 목록을 확인해야 하는 이유는 무엇입니까?
일괄 처리의 장점은 여러 파일을 한 번에 처리할 수 있다는 점이지만, 이는 오류 또한 일괄적으로 확대될 수 있음을 의미합니다. 관련 없는 PDF가 포함되거나 폴더에 다른 자료가 섞여 있으면 원치 않는 이름 변경 결과를 초래할 수 있습니다. 따라서 첫 번째 단계의 목록에서 이름, 경로 및 레코드 수를 확인하는 것이 매우 중요합니다.
3. "전체 파일 이름 덮어쓰기"는 PDF 확장자를 변경합니까?
예시 결과를 보면 처리 후에도 파일은 여전히 PDF 형식이며 확장자명은 ".pdf"로 유지됩니다. "전체 파일 이름 덮어쓰기"는 주로 파일 이름 본체를 대체하여 원래의 "1", "2", "3"을 매칭된 번호로 만드는 것입니다.
4. 여러 파일에서 동일한 번호가 매칭될 때 주의할 점은 무엇입니까?
서로 다른 PDF에 동일한 번호가 존재하면 파일 이름이 중복되는 상황이 발생할 수 있습니다. 계약, 주문 등 고유 번호 파일을 처리할 때는 사전에 번호 자체의 고유성을 확인해야 합니다. 중복 가능성이 있는 파일의 경우 작은 범위로 먼저 테스트하여 처리 결과가 보관 규칙에 부합하는지 확인하십시오.
5. 이 방법은 PDF에만 적용됩니까?
본문에서 시연한 것은 PDF 파일입니다. 스크린샷의 기능 이름이 명시적으로 "파일 내용을 사용하여 PDF 파일 이름 변경"이기 때문입니다. HeSoft Doc Batch Tool 인터페이스에서는 Word 도구, Excel 도구 등의 분류도 볼 수 있지만, 이 글에서는 다른 형식의 기능까지 확장하지 않습니다. doc, docx, xls, xlsx 등의 사무용 문서는 소프트웨어 내의 해당 기능 입구와 실제 인터페이스에 따라 처리해야 합니다.
요약: PDF 이름 변경을 수동 작업에서 규칙 기반 일괄 처리로 전환
본 예시를 통해 PDF 일괄 이름 변경이 반드시 원본 파일명 수정에만 기반할 수 있는 것이 아니라, PDF 본문 내용을 기반으로 더 의미 있는 새 파일명을 생성할 수도 있음을 알 수 있습니다. 원래 이름은 혼란스럽지만 본문 번호가 정형화된 파일의 경우, 표현식을 사용하여 번호를 추출하는 것은 매우 효율적인 사무 처리 방식입니다.
HeSoft Doc Batch Tool 의 가치는 반복적인 파일 정리 작업을 절차화하는 데 있습니다. 즉, 파일 가져오기, 매칭 규칙 설정, 명명 위치 선택, 일괄 처리 실행입니다. 하나하나 PDF를 열어 수동으로 이름을 변경하는 것과 비교하여, 이 방식은 계약 보관, 주문 정리, 프로젝트 자료 인계 등 빈도가 높은 사무 시나리오에 더 적합합니다.
이름이 혼란스러운 PDF 파일들을 정리 중이라면, 먼저 그중 몇 개를 열어 번호 형식을 확인한 후 본문 방법에 따라 "\d{8}"과 같은 표현식으로 소규모 일괄 테스트를 진행하시기 바랍니다. 효과가 정확함을 확인한 후 전체 폴더를 대상으로 일괄 처리하면, 신속하게 표준화되고 검색 가능하며 공유하기 편리한 PDF 파일 이름을 얻을 수 있습니다.