PDF-Dateien stapelweise umbenennen: Vertragsnummer mit Platzhaltern/regulären Ausdrücken als Dateinamen extrahieren


ÜbersetzungEnglishFrançaisDeutschEspañol日本語한국어Aktualisierungszeit2026-06-05 09:42:45

Erklärung: Alle Bilder, Texte und Videos auf der Website dienen nur als Referenz und sind möglicherweise nicht aktuell, korrekt oder genau. Im Streitfall beziehen Sie sich bitte auf den tatsächlichen Erlebniseffekt!

In diesem Artikel wird erläutert, wie Sie mit HeSoft Doc Batch Tool mehrere PDF-Dateien, die ursprünglich mit bedeutungslosen Namen wie 1.pdf, 2.pdf usw. gespeichert wurden, stapelweise in die Vertragsnummer aus dem Dateiinhalt umbenennen. Über die Funktion „PDF-Dateien anhand des Inhalts umbenennen“ in Verbindung mit dem platzhalterähnlichen regulären Ausdruck \d{8} können automatisch 8-stellige Nummern aus dem PDF-Text erkannt und als neue Dateinamen verwendet werden. Geeignet für Büroszenarien wie Verträge, Bestellungen, Archive, gescannte Dokumente usw., die eine Ablage nach Nummern erfordern.

Im Büroalltag werden viele PDF-Dateien zunächst nur nach der Reihenfolge des Downloads, Scans oder temporären Nummern gespeichert, z. B. 1.pdf, 2.pdf, 3.pdf, 4.pdf. Solche Dateinamen sind zwar für die vorübergehende Speicherung geeignet, erschweren jedoch die spätere Suche, Archivierung und Freigabe. Besonders bei PDF-Dokumenten wie Verträgen, Vereinbarungen, Angeboten, Bestellungen, Rechnungen und Projektunterlagen befinden sich die wirklich wertvollen Informationen häufig im Dateiinhalt, etwa Vertragsnummern, Bestellnummern, Kundennummern oder Projektnummern. Wenn man jede PDF-Datei einzeln öffnet, um die Nummer zu prüfen und dann den Dateinamen manuell zu ändern, ist das nicht nur zeitaufwendig, sondern führt auch leicht zu Kopierfehlern, vergessenen Änderungen oder doppelten Namen.

Dieser Artikel widmet sich genau dieser Problematik: Wie man mit Batch-Verarbeitungsfunktionen in Office-Software mithilfe von Platzhaltern/regulären Ausdrücken festformatierte Nummern aus dem Inhalt vieler PDF-Dateien extrahiert und die PDFs anschließend stapelweise in die entsprechenden Nummern umbenennt. Im Folgenden wird am Beispiel von HeSoft Doc Batch Tool der vollständige Ablauf gezeigt, wie mehrere PDF-Dateien von „1.pdf, 2.pdf…“ in „10026877.pdf, 20036655.pdf…“ umbenannt werden.

Anwendungsszenarien

Diese Methode eignet sich besonders für Batch-Umbenennungen von PDFs, wenn die Dateianzahl hoch ist, die Benennungsregel einheitlich und eine identifizierbare Nummer im Text vorhanden ist. Anders als beim üblichen „Suchen und Ersetzen von Dateinamen“ wird hier nicht der Text im ursprünglichen Dateinamen geändert, sondern ein bestimmter Text aus dem PDF-Inhalt ausgelesen und als neuer Dateiname verwendet.

Typische Szenarien sind:

  • Batch-Umbenennung von Vertrags-PDFs: Extrahieren von Informationen wie Vertrags-Nr., Vertragsnummer, Vereinbarungsnummer von der ersten Seite des Vertrags.
  • Batch-Umbenennung von Bestellungs-PDFs: Extrahieren der Bestellnummer, Einkaufsnummer oder Kundennummer aus dem Bestelltext.
  • Archivierung von gescannten Dokumenten: Gescannte Dateien können Namen wie 1.pdf, 2.pdf, scan001.pdf haben und müssen nach der Nummer im Text archiviert werden.
  • Organisation von Finanzdokumenten: Extrahieren von Nummern aus PDFs wie Rechnungen, Zahlungsanträgen, Spesenabrechnungen als Dateiname.
  • Projektunterlagenverwaltung: Extrahieren von Projektnummer, Aufgabennummer, Auftragsnummer zur einheitlichen Benennung von PDF-Dateien.

Wenn diese Nummern ein relativ festes Format haben, z. B. alle 8-stellig sind, kann ein platzhalterähnlicher Ausdruck für den Abgleich verwendet werden. Der im Screenshot verwendete Vorgang nutzt den regulären Ausdruck „\d{8}“, was bedeutet, dass 8 aufeinanderfolgende Ziffern abgeglichen werden. Für Büroanwender kann man das als präziseren Platzhalterausdruck verstehen: Anstatt jede Nummer manuell anzugeben, lässt man die Software automatisch nach Text suchen, der der Regel entspricht.

Ergebnisvorschau: Vor und nach der Verarbeitung

Vor der Verarbeitung: Dateinamen enthalten nur Nummern, der Inhalt ist nicht ersichtlich

Die ursprünglichen PDF-Dateinamen sind sehr einfach: 1.pdf, 2.pdf, 3.pdf, 4.pdf. Am Dateinamen ist völlig unerkennbar, um welchen Vertrag es sich handelt, und eine Suche nach einer Vertragsnummer über den Dateinamen ist nicht möglich.

image-PDF-Stapelumbenennung,Umbenennung von PDFs mit Platzhalterausdrücken,Extrahieren von PDF-Inhalten mit regulären Ausdrücken,Benennung von Vertragsnummerndateien

Öffnet man eine der PDFs, sieht man im Dokumenteninhalt eine eindeutige Vertragsnummer. Der Screenshot zeigt z. B. auf der Vertragsstartseite hinter „Contract No.“ eine 8-stellige Nummer „10026877“. Genau diesen Inhalt möchten wir extrahieren und als Dateinamen verwenden.

image-PDF-Stapelumbenennung,Umbenennung von PDFs mit Platzhalterausdrücken,Extrahieren von PDF-Inhalten mit regulären Ausdrücken,Benennung von Vertragsnummerndateien

Nach der Verarbeitung: PDF-Dateinamen werden zu den Nummern aus dem Text

Nach Abschluss der Batch-Verarbeitung wurden die ursprünglichen sequenziellen Dateinamen durch die aus dem PDF-Inhalt identifizierten 8-stelligen Nummern ersetzt. Im Beispiel lauten die Dateinamen nun 10026877.pdf, 20036655.pdf, 20100511.pdf, 33952100.pdf. So kann der zugehörige Vertrag am Dateinamen erkannt und gefunden werden, ohne die Datei öffnen zu müssen.

image-PDF-Stapelumbenennung,Umbenennung von PDFs mit Platzhalterausdrücken,Extrahieren von PDF-Inhalten mit regulären Ausdrücken,Benennung von Vertragsnummerndateien

Für Bürodokumente, die langfristig archiviert werden müssen, ist diese Benennungsweise zuverlässiger als einfache Nummern. Ob später lokal, auf einem Netzlaufwerk, in einer Enterprise-Cloud oder einem Dokumentenmanagementsystem gesucht wird, die Datei kann direkt über die Nummer gefunden werden.

Vorgehensweise

Schritt 1: Funktion „PDF-Dateien nach Dateiinhalt umbenennen“ aufrufen

Nach dem Öffnen von HeSoft Doc Batch Tool sehen Sie auf der linken Seite mehrere Kategorien für die Office-Dateiverarbeitung, darunter Dateiname, Ordnername, Dateiorganisation, Word-Tools, Excel-Tools, PDF-Tools usw. Da wir hier PDF-Dateinamen bearbeiten möchten, wählen Sie links die Kategorie „Dateiname“.

Suchen Sie in den Funktionskarten nach „7. PDF-Dateien nach Dateiinhalt umbenennen“. Die Beschreibung dieser Funktion lautet, dass bestimmte Texte aus dem PDF-Dateiinhalt als Dateiname verwendet werden, was genau der Aufgabe entspricht, Vertragsnummern aus Vertrags-PDFs zu extrahieren und umzubenennen.

image-PDF-Stapelumbenennung,Umbenennung von PDFs mit Platzhalterausdrücken,Extrahieren von PDF-Inhalten mit regulären Ausdrücken,Benennung von Vertragsnummerndateien

Ziel dieses Schritts ist der Aufruf des richtigen Batch-Verarbeitungseinstiegspunkts. Anders als beim üblichen Ersetzen von Dateinamen liest diese Funktion den PDF-Inhalt und eignet sich daher für Dokumente mit nichtssagendem Dateinamen, aber gültigen Nummern im Text.

Schritt 2: Die umzubenennenden PDF-Dateien hinzufügen

Auf der Funktionsseite wird oben die aktuelle Funktion „PDF-Dateien nach Dateiinhalt umbenennen“ angezeigt. Der erste Schritt auf der Seite ist „Zu verarbeitende Datensätze auswählen“. PDFs können entweder einzeln über „Dateien hinzufügen“ oder alle PDFs eines Ordners auf einmal über „Dateien aus Ordner importieren“ hinzugefügt werden.

Der Screenshot zeigt, dass bereits 4 PDF-Dateien importiert wurden. Die Liste zeigt Details wie Nummer, Name, Pfad, Erweiterung, Erstellungsdatum, Änderungsdatum. Die Dateinamen sind 1.pdf, 2.pdf, 3.pdf, 4.pdf, die Erweiterung ist jeweils pdf, der Pfad liegt auf dem Testverzeichnis von Laufwerk D.

image-PDF-Stapelumbenennung,Umbenennung von PDFs mit Platzhalterausdrücken,Extrahieren von PDF-Inhalten mit regulären Ausdrücken,Benennung von Vertragsnummerndateien

Dieser Schritt dient dazu, den Umfang der zu verarbeitenden Dateien festzulegen. Nach dem Import wird eine Prüfung der Liste empfohlen: Erstens die korrekte Anzahl der Dateien, zweitens ob die Erweiterung pdf ist, drittens ob keine versehentlich nicht zu verarbeitenden Dateien hinzugefügt wurden. Stellt man fest, dass eine Datei nicht verarbeitet werden soll, kann man den entsprechenden Eintrag über die Löschfunktion in der Liste entfernen.

Schritt 3: Einstellen, welcher Text aus dem PDF-Inhalt extrahiert werden soll

Nach Klick auf „Weiter“ gelangen Sie zu „Verarbeitungsoptionen festlegen“. Dies ist der Kern des gesamten Batch-Umbenennungsprozesses. In der Benutzeroberfläche gibt es die Option „Suchbereich“, im Screenshot ist „Per benutzerdefinierter Formel abgeglichener Text“ ausgewählt. Das bedeutet, die Software übernimmt nicht einfach die erste Textzeile oder eine feste Position, sondern sucht im PDF-Inhalt nach Text, der der von uns eingegebenen Regel entspricht.

Im Eingabefeld „Regulärer Ausdruck“ ist im Beispiel „\d{8}“ eingetragen. Dieser Ausdruck wird verwendet, um 8 aufeinanderfolgende Ziffern zu finden. Da die Vertragsnummer genau 8-stellig ist, sucht die Software im PDF-Inhalt nach Text, der dieser Regel entspricht, und verwendet die gefundene Nummer zur Umbenennung.

image-PDF-Stapelumbenennung,Umbenennung von PDFs mit Platzhalterausdrücken,Extrahieren von PDF-Inhalten mit regulären Ausdrücken,Benennung von Vertragsnummerndateien

Auf derselben Seite gibt es weiter unten die Einstellung „Position“, im Screenshot ist „Gesamten Dateinamen überschreiben“ gewählt. Das bedeutet, der neu extrahierte Nummerntext ersetzt direkt den Hauptteil des ursprünglichen Dateinamens. So wird beispielsweise aus 1.pdf dann 10026877.pdf, anstatt die Nummer vor oder hinter dem alten Dateinamen anzuhängen.

Das erwartete Ergebnis dieses Schritts ist: Die Software kann gemäß der Regel aus jedem PDF eine 8-stellige Nummer identifizieren und diese als neuen Dateinamen für das PDF verwenden. Falls Ihre Nummer nicht 8-stellig ist, muss der Ausdruck an das tatsächliche Format angepasst werden. Bei 6-stelligen Nummern kann z. B. \d{6} verwendet werden, bei 10-stelligen \d{10}. Der konkrete Ausdruck sollte sich jedoch nach Ihrem Dokumentinhalt richten, um den Abgleich irrelevanter Nummern zu vermeiden.

Schritt 4: Speicherort festlegen und Verarbeitung starten

Am oberen Prozess der Benutzeroberfläche ist ersichtlich, dass danach noch die beiden Schritte „Speicherort festlegen“ und „Verarbeitung starten“ folgen. Nachdem die Regeln festgelegt sind, klicken Sie erneut auf „Weiter“ und wählen den Speicherort gemäß den Bildschirmanweisungen aus, um zum Schritt Verarbeitungsstart zu gelangen.

Bei diesem Schritt wird empfohlen, je nach Wichtigkeit der Dateien eine geeignete Speichermethode zu wählen. Bei wichtigen Verträgen oder offiziellen Archiven empfiehlt es sich, die Ausgabe zuerst in einen neuen Ordner zu leiten, das Umbenennungsergebnis zu überprüfen und erst dann zu ersetzen oder zu archivieren. Dies minimiert das Risiko von Fehlbedienungen und erleichtert den Vergleich der Dateien vor und nach der Verarbeitung.

Nach dem Start der Verarbeitung liest die Software stapelweise den Inhalt der PDFs aus der Liste, findet anhand der „\d{8}“-Regel die entsprechende Nummer und benennt die Datei in diese Nummer um. Nach Abschluss können Sie im Ordner das Ergebnis überprüfen – wie in der Ergebnisvorschau zuvor gezeigt, werden die ursprünglichen Dateien 1.pdf, 2.pdf usw. zu Dateinamen mit den entsprechenden Vertragsnummern.

Konzept der Platzhalter/regulären Ausdrücke

Viele Benutzer bezeichnen solche Regeln als Platzhalterausdrücke. Genau genommen heißt das Eingabefeld im Screenshot „Regulärer Ausdruck“, der sich besser als gewöhnliche Platzhalter für die Verarbeitung festformatierter Texte eignet. Platzhalter werden üblicherweise für einfache Abgleiche verwendet, z. B. steht ein Sternchen für beliebige Zeichen; ein regulärer Ausdruck kann dagegen präziser Regeln beschreiben wie „mehrere aufeinanderfolgende Ziffern“, „Nummer nach einem bestimmten Präfix“ oder „Codes mit Buchstaben und Ziffern“.

In diesem Beispiel ist die Vertragsnummer eine 8-stellige Zahlenfolge, daher wird \d{8} verwendet. Dabei steht \d für Ziffer und {8} für 8-maliges aufeinanderfolgendes Auftreten. Zusammen bedeutet dies, 8 aufeinanderfolgende Ziffern zu finden. Der Vorteil dieser Regel für die Batch-Umbenennung von PDFs ist: Die spezifische Nummer in jeder Datei muss nicht bekannt sein, solange das Nummernformat einheitlich ist, kann die Software sie einzeln identifizieren.

Zu beachten ist, dass die Software bei mehreren 8-stelligen Ziffernfolgen in einer PDF möglicherweise einen der passenden Texte findet. Daher empfiehlt es sich, vor der offiziellen Batch-Verarbeitung mit wenigen Stichproben zu testen, ob das Extraktionsergebnis tatsächlich die Vertragsnummer ist und nicht etwa ein Datum, eine Telefonnummer, ein Geldbetragscode oder eine andere Zahl. Bei mehreren ähnlichen Zahlen im Dokument kann die Regel spezifischer gestaltet werden, indem z. B. fester Text vor und nach der Nummer in den Abgleich einbezogen wird, was jedoch anhand des tatsächlichen Dokumentinhalts entworfen werden muss.

Häufige Fragen und wichtige Hinweise

1. Warum vor der Verarbeitung die PDF öffnen und das Nummernformat prüfen?

Weil die Batch-Umbenennung von der Regel für den Inhaltsabgleich abhängt. Indem Sie zuerst ein oder zwei Probe-PDFs öffnen und prüfen, ob die Vertragsnummern alle 8-stellig sind, ob sie immer im Dokument erscheinen und ob es andere gleich lange Zahlen gibt, können Sie einen treffenderen Ausdruck wählen und Fehlbenennungen nach der Batch-Verarbeitung vermeiden.

2. Wenn die PDF ein gescanntes Bild ist, kann die Nummer direkt erkannt werden?

Die gezeigten Screenshots zeigen sichtbaren Text im PDF-Reader und die Umbenennung mittels Textabgleich. Ist die PDF nur ein reiner Bildscan, hängt es davon ab, ob bereits eine erkennbare Textebene in der Datei vorhanden ist. Vor der Verarbeitung kann man versuchen, die Nummer in der PDF zu kopieren. Gelingt dies nicht, muss möglicherweise zuerst eine OCR-Texterkennung durchgeführt werden, bevor die Umbenennung nach Inhalt verwendet werden kann.

3. Bleiben die ursprünglichen Namen wie 1, 2, 3 erhalten?

Im Screenshot wurde bei „Position“ die Option „Gesamten Dateinamen überschreiben“ gewählt. Daher wird der Hauptteil des ursprünglichen Dateinamens durch die extrahierte Nummer ersetzt. Die Dateierweiterung pdf bleibt erhalten, das Ergebnis ist daher von der Form 10026877.pdf und nicht etwa 10026877 oder 10026877.pdf.pdf.

4. Sollte vor der Batch-Verarbeitung ein Backup gemacht werden?

Ein Backup wird empfohlen. Batch-Verarbeitung kann die Effizienz erheblich steigern, bei offiziellen Dokumenten wie Verträgen, Finanz- oder Archivunterlagen ist es jedoch am besten, zunächst ein Testverzeichnis zu kopieren und die Regel zu bestätigen, bevor die offiziellen Dateien verarbeitet werden. Alternativ kann man zuerst wenige PDFs für einen Probelauf auswählen, um zu bestätigen, dass die Dateinamen den Erwartungen entsprechen.

5. Gilt diese Methode nur für PDFs?

Dieser Artikel demonstriert die Funktion „PDF-Dateien nach Dateiinhalt umbenennen“, die für PDF-Dateien geeignet ist. In der Softwareoberfläche sind auch Verarbeitungskategorien wie Word-Tools, Excel-Tools für andere Office-Dateien sichtbar. Für die Verarbeitung von Dateien wie doc, docx, xls, xlsx sollte der entsprechende Funktionseinstieg gewählt werden. Mischen Sie nicht verschiedene Formate in derselben PDF-Verarbeitungsaufgabe.

Zusammenfassung

Mit HeSoft Doc Batch Tool lässt sich die manuelle Arbeit des Öffnens, Ansehens, Kopierens und Umbenennens von PDFs in eine regelbasierte Batch-Operation umwandeln. Für Vertrags-PDFs gilt: Solange im Text stabile Vertragsnummern vorhanden sind, kann man mit der Funktion „PDF-Dateien nach Dateiinhalt umbenennen“ und dem platzhalterähnlichen regulären Ausdruck \d{8} die Nummern schnell extrahieren und die ursprünglichen Dateinamen ersetzen.

Der Kernnutzen dieser Methode liegt in der Reduzierung von Routinearbeiten, der Senkung manueller Benennungsfehler und der Steigerung der Effizienz bei der Dateisuche. Vor der Verarbeitung großer PDF-Mengen empfiehlt es sich, einige Beispieldateien auszuwählen, um den Ausdruck und das Benennungsergebnis zu testen. Nach der Bestätigung der Korrektheit können Sie den gesamten Ordner stapelweise importieren. Für langfristig zu archivierende Verträge, Bestellungen und Scans wird dies die tägliche Büroeffizienz spürbar steigern.


SchlüsselwortPDF-Stapelumbenennung , Umbenennung von PDFs mit Platzhalterausdrücken , Extrahieren von PDF-Inhalten mit regulären Ausdrücken , Benennung von Vertragsnummerndateien
Erstellungszeit2026-06-05 09:42:29

Erklärung: Alle Bilder, Texte und Videos auf der Website dienen nur als Referenz und sind möglicherweise nicht aktuell, korrekt oder genau. Im Streitfall beziehen Sie sich bitte auf den tatsächlichen Erlebniseffekt!

Verwandte Artikel

Fehlt Ihnen die gewünschte Funktion?

Geben Sie uns Ihr Feedback zu Ihren Anforderungen, und nach der Bewertung setzen wir es kostenlos um!