Wenn Vertrags-PDFs mit Nummern wie 1.pdf, 2.pdf gespeichert werden, führt dies später zu Problemen bei der Suche und Archivierung. In diesem Artikel wird anhand eines Szenarios zur Extraktion von Vertragsnummern erläutert, wie Sie in HeSoft Doc Batch Tool die Funktion "PDF-Dateien anhand des Dateiinhalts umbenennen" verwenden können. Durch die mit einer benutzerdefinierten Formel abgeglichenen Texte und den regulären Ausdruck \d{8} werden die Vertragsnummern (Contract No.) im PDF-Haupttext stapelweise ausgelesen und als neue PDF-Dateinamen übernommen. Das Tutorial enthält eine Ergebnisvorschau, detaillierte Schritte und Hinweise und eignet sich für Büroszenarien wie Vertragsverwaltung, juristische Archivierung und Projektdokumentenorganisation.
Die elektronische Verwaltung von Vertragsdaten leidet am meisten unter uneinheitlichen Dateinamen. Viele Vertrags-PDFs werden beim Scannen, Herunterladen oder Exportieren als 1.pdf, 2.pdf, 3.pdf benannt oder erhalten einen systemseitig vergebenen Standardnamen. Kurzfristig scheint das kein Problem zu sein, aber wenn die Anzahl der Verträge zunimmt, muss man zum Auffinden eines bestimmten Vertrags jedes PDF einzeln öffnen, um die Nummer zu überprüfen – das ist sowohl zeitaufwendig als auch fehleranfällig.
Wenn der Vertragstext bereits eine „Contract No.“ oder „Vertragsnummer“ enthält, ist es sinnvoller, diese Nummer direkt als Dateinamen zu verwenden. So entspricht jede PDF-Datei im Ordner einer Geschäftsnummer, was die spätere Archivierung, Suche, das Hochladen in Systeme oder den Abgleich mit Excel-Tabellen erheblich erleichtert.
Dieser Artikel zeigt anhand eines Vertrags-PDFs im Screenshot, wie Sie mit HeSoft Doc Batch Tool mithilfe von Platzhaltern/regulären Ausdrücken die 8-stellige Vertragsnummer im PDF-Text abgleichen und mehrere PDF-Dateien stapelweise umbenennen können. Diese Methode eignet sich besonders für Positionen in der Rechtsabteilung, Verwaltung, im Projektmanagement, Einkauf, Finanzwesen und anderen Bereichen, die große Mengen an Vertrags- oder Vereinbarungs-PDFs verwalten müssen.
Anwendungsszenario: Verträge, Vereinbarungen, Bestell-PDFs nach Textnummer benennen
Die in diesem Artikel beschriebene Methode eignet sich für Dokumente, die eine eindeutige Nummer im PDF-Text enthalten. Zum Beispiel die Contract No. in englischen Verträgen, die Vertragsnummer in chinesischen Verträgen, die PO-Nummer in Bestellungen, die Vereinbarungsnummer in Serviceverträgen, die Berichtsnummer in Berichtsdateien usw. Solange diese Nummern aus dem PDF-Text ausgelesen werden können und ein relativ einheitliches Format aufweisen, können sie mit Abgleichregeln stapelweise extrahiert werden.
Die Vertragsnummer im Screenshot-Beispiel ist eine fortlaufende 8-stellige Zahl, daher kann ein regulärer Ausdruck wie \d{8} für den Abgleich verwendet werden. Viele Benutzer bezeichnen diese Regel als Platzhalterausdruck, da beide dazu dienen, „Text nach Muster zu finden“. Da das Eingabefeld in der Software jedoch ausdrücklich als „Regulärer Ausdruck“ gekennzeichnet ist, sollte die Angabe bei der tatsächlichen Einrichtung gemäß der Syntax für reguläre Ausdrücke erfolgen.
Wenn es sich bei Ihren Dateien um Word-Verträge wie docx oder doc, Excel-Tabellen oder txt-Textdateien handelt, müssen Sie das entsprechende Funktionsmodul auswählen. Das Beispiel in diesem Artikel bezieht sich nur auf PDF-Dateien, und der Funktionseinstieg ist ebenfalls „PDF-Dateien mit Dateiinhalt umbenennen“.
Ergebnisvorschau: Die Vertragsnummer wird zum Dateinamen
Vor der Verarbeitung: Im Ordner befinden sich nur nummerierte PDFs
Vor der Verarbeitung sind die 4 PDFs im Ordner als 1.pdf, 2.pdf, 3.pdf, 4.pdf benannt. Anhand dieser Dateinamen allein ist nicht erkennbar, welche Datei zu welcher Vertragsnummer gehört, noch kann ein bestimmter Vertrag schnell gefunden werden.

Öffnet man das PDF, sieht man oben auf der Seite das Feld für die Vertragsnummer. Im Screenshot zeigt der rote Pfeil auf „10026877“; diese Nummer steht hinter „Contract No.“. Für die Vertragsverwaltung ist diese Nummer wichtiger als der ursprüngliche Dateiname und eignet sich besser als Archiv-Dateiname.

Nach der Verarbeitung: Jedes PDF ist mit der Vertragsnummer benannt
Nach der Stapelverarbeitung wurden die ursprünglichen nummerierten Dateinamen durch die Nummern aus dem PDF-Text ersetzt. Im Ordner werden die Ergebnisse als 10026877.pdf, 20036655.pdf, 20100511.pdf, 33952100.pdf angezeigt.

Dieses Ergebnis ist sehr übersichtlich: Der Dateiname selbst ist die Vertragsnummer. Wenn später jemand die Vertragsnummer 10026877 angibt, genügt eine Suche nach dieser Nummer im Ordner, um das entsprechende PDF schnell zu finden.
Vorgehensweise: Contract No. aus PDF-Inhalt extrahieren und stapelweise umbenennen
Schritt 1: Kategorie Dateiname öffnen
Nach dem Start von HeSoft Doc Batch Tool sehen Sie sich zunächst die Funktionsnavigation auf der linken Seite an. Im Screenshot ist die Kategorie „Dateiname“ ausgewählt. Da es bei dieser Aufgabe um die stapelweise Änderung von PDF-Dateinamen geht, sollten Sie diese Kategorie aufrufen und nicht andere Kategorien wie PDF-Tools oder Dateiordnung.
Suchen Sie in der Funktionsliste unter Dateiname den Punkt „7. PDF-Dateien mit Dateiinhalt umbenennen“. Die Beschreibung unter dieser Funktionskarte lautet: „Bestimmten Text im Inhalt von PDF-Dateien stapelweise als Dateinamen verwenden“. Dieser Beschreibung ist zu entnehmen, dass es sich genau um die Funktion handelt, um Vertragsnummern aus dem PDF-Text zu extrahieren und als neuen Dateinamen zu verwenden.

Nach dem Klick auf diese Funktion gelangt man in eine assistentengeführte Bearbeitungsoberfläche. Der Vorteil eines Assistenten ist, dass der Zweck jedes Schrittes klar ist, was eine schrittweise Überprüfung vor Stapelaufgaben ermöglicht und Fehlbedienungen reduziert.
Schritt 2: Vertrags-PDF-Dateien importieren
Nach dem Aufruf der Funktion ist der erste Schritt „Zu verarbeitende Datensätze auswählen“. Oben rechts auf der Seite befinden sich Schaltflächen wie „Dateien hinzufügen“, „Dateien aus Ordner importieren“, „Leeren“, „Mehr“ usw. Für die Vertragsarchivierung empfiehlt es sich in der Regel, die zu verarbeitenden PDFs zunächst in einem Ordner zu sammeln und dann „Dateien aus Ordner importieren“ zu verwenden, um das versehentliche Übersehen von Dateien zu vermeiden.
Im Screenshot wurden bereits 4 PDFs importiert, die Liste zeigt Dateiname, Pfad, Erweiterung, Erstellungs- und Änderungsdatum. Die Dateinamen lauten 1.pdf, 2.pdf, 3.pdf, 4.pdf, die Erweiterung ist jeweils pdf. Unten wird die Anzahl der Datensätze mit 4 angezeigt.

Der entscheidende Punkt in diesem Schritt ist die Bestätigung der zu verarbeitenden Objekte. Die stapelweise Umbenennung wirkt sich gleichzeitig auf mehrere Dateien aus, daher sollte man nicht voreilig zum nächsten Schritt übergehen. Es wird empfohlen, den Dateipfad zu überprüfen und sicherzustellen, dass sich keine irrelevanten PDFs in der Liste befinden. Falls ein Importfehler festgestellt wird, kann man die Löschfunktion in der Liste nutzen oder über „Leeren“ einen Neuimport durchführen.
Schritt 3: Von benutzerdefinierter Formel gefundenen Text auswählen
Nachdem die Dateiliste bestätigt wurde, klicken Sie auf „Weiter“, um zu den „Verarbeitungsoptionen“ zu gelangen. Im Bereich „Suchbereich“ bietet die Oberfläche mehrere Optionen. Im Screenshot ist „Von benutzerdefinierter Formel gefundener Text“ ausgewählt.
Warum nicht „Erste Textzeile“? Weil die Vertragsnummer nicht immer in der ersten Zeile steht und die erste Zeile eine Überschrift, Leerzeile oder anderer Inhalt sein kann. Warum nicht „Erstes Barcode-Bild“? Weil das Ziel in diesem Beispiel der Zifferntext im PDF-Text ist und kein Barcode. Daher eignet sich der Abgleich mit einer benutzerdefinierten Formel besser für den aktuellen Bedarf.

Nach Auswahl dieser Option sucht die Software anhand des unten ausgefüllten regulären Ausdrucks im PDF-Inhalt nach Text, der der Regel entspricht, und verwendet das Abgleichergebnis für die anschließende Benennung.
Schritt 4: Ausdruck zum Abgleich der 8-stelligen Vertragsnummer eingeben
Geben Sie im Eingabefeld „Regulärer Ausdruck“ Folgendes ein:
\d{8}
Diese Regel bedeutet den Abgleich von 8 aufeinanderfolgenden Ziffern. Die Vertragsnummer 10026877 im Screenshot sowie die Ergebnisse 20036655, 20100511, 33952100 entsprechen alle dieser Regel. Somit kann die Software die entsprechende Nummer in jedem PDF finden.
In vielen Büroszenarien sprechen Benutzer davon, „mit Platzhaltern Nummern abzugleichen“. Hier ist eine kleine Unterscheidung nötig: Platzhalter sind in der Regel einfache Abgleichsymbole wie Sternchen oder Fragezeichen, während reguläre Ausdrücke besser geeignet sind, komplexe Regeln wie Ziffernlänge, Buchstabenbereiche oder Wiederholungsanzahl zu beschreiben. Die Benutzeroberfläche von HeSoft Doc Batch Tool verwendet „Reguläre Ausdrücke“, daher muss die Eingabe gemäß der Regex-Syntax erfolgen.
Wenn Ihre Vertragsnummer keine 8-stellige Zahl ist, können Sie dieses Beispiel nicht direkt übernehmen. Wenn die Nummer beispielsweise HT20260001 lautet, muss die Regel Buchstaben- und Ziffernkombinationen berücksichtigen; ist die Länge der Nummer nicht fest, ist ein flexiblerer Ausdruck erforderlich. Es ist sehr wichtig, vor der eigentlichen Verarbeitung Beispieldateien zu untersuchen.
Schritt 5: Abgleichergebnis als gesamten Dateinamen übernehmen
Wählen Sie im Bereich „Position“ die Option „Gesamten Dateinamen überschreiben“. Diese Option bewirkt, dass die abgeglichene Vertragsnummer den ursprünglichen Dateinamenstamm ersetzt. Aus 1.pdf wird 10026877.pdf, aus 2.pdf wird die entsprechende Vertragsnummer.pdf usw.
Die Oberfläche bietet auch die Optionen „Links vom Dateinamen“ und „Rechts vom Dateinamen“. Wenn Sie den ursprünglichen Dateinamen beibehalten möchten, können Sie die Nummer links oder rechts hinzufügen. Für die Vertragsarchivierung ist es jedoch übersichtlicher, die Vertragsnummer direkt als Dateinamen zu verwenden, was die Suche und Sortierung erleichtert.
Klicken Sie nach der Einstellung auf „Weiter“ am unteren Seitenrand, um zum nächsten Schritt zu gelangen.
Schritt 6: Speicherort festlegen und Verarbeitung starten
Am Fortschrittsbalken oben auf der Seite ist zu erkennen, dass als Nächstes „Speicherort festlegen“ und „Verarbeitung starten“ folgen. Bevor die Stapelverarbeitung tatsächlich gestartet wird, empfiehlt es sich, ein klares Ausgabeziel zu wählen, z. B. einen neuen Ordner „Nach Vertragsnummer benannt“ anzulegen, in dem die verarbeiteten PDFs gespeichert werden.
Der Vorteil ist, dass die Originaldateien erhalten bleiben und ein Vergleich zur Kontrolle möglich ist. Nach Abschluss der Verarbeitung kann anhand des Ergebnisses entschieden werden, ob der Originalordner ersetzt wird. Bei wichtigen Dokumenten wie Verträgen, Vereinbarungen und Rechtsdokumenten ist die Aufbewahrung des Originals eine sicherere Arbeitsweise.
Nach Bestätigung des Speicherorts gelangen Sie zum Schritt Verarbeitung starten. Öffnen Sie nach Abschluss den Ausgabeordner und überprüfen Sie, ob die Dateinamen der Erwartung entsprechen. Dem Beispielergebnis zufolge sollten die 4 PDFs in Dateien mit den entsprechenden 8-stelligen Nummern umbenannt worden sein.
Häufige Fragen und wichtige Hinweise
1. Was tun, wenn der reguläre Ausdruck eine falsche Nummer findet?
Wenn das PDF neben der Vertragsnummer noch andere 8-stellige Zahlen enthält, könnte \d{8} einen falschen Inhalt abgleichen. Der Lösungsansatz ist, die Regel spezifischer zu machen, z. B. den Abgleich mit dem umgebenden Text „Contract No.“ zu kombinieren oder vorher zu prüfen, ob das PDF nur eine 8-stellige Zahl enthält. Testen Sie vor der Stapelverarbeitung einige Dateien, um größere Fehler effektiv zu vermeiden.
2. Muss die Nummer im PDF auswählbar sein?
Wenn die Nummer im PDF-Text mit der Maus ausgewählt und kopiert werden kann, ist die Wahrscheinlichkeit höher, dass sie von der Inhaltsabgleich-Funktion gelesen werden kann. Handelt es sich bei dem PDF um einen reinen Bildscan und die Nummer ist nur Teil des Bildes, kann sie möglicherweise nicht direkt anhand von Textregeln extrahiert werden. Prüfen Sie in solchen Fällen die Textebene des PDFs.
3. Wird der PDF-Inhalt durch die Verarbeitung verändert?
Ziel dieses Vorgangs ist die Umbenennung der Datei, d. h. die Änderung des Dateinamens, nicht die Bearbeitung des PDF-Textinhalts. Der Funktionsname „PDF-Dateien mit Dateiinhalt umbenennen“ zeigt an, dass Text aus dem Inhalt als Dateiname verwendet, aber nicht der Vertragstext selbst geändert wird.
4. Kann man viele PDFs auf einmal verarbeiten?
Diese Funktion ist für die Stapelverarbeitung ausgelegt und eignet sich zum gleichzeitigen Import mehrerer PDFs. Die tatsächlich zu verarbeitende Menge hängt von der Dateigröße, der Komplexität des PDF-Inhalts und der Computerleistung ab. Bei besonders wichtigen oder sehr großen Ordnern empfiehlt es sich, zuerst einen kleinen Stapel zu testen und erst dann alle Dateien zu verarbeiten.
5. Wie kann man die Ergebnisse nach der Umbenennung überprüfen?
Es wird empfohlen, die Dateien nach der Verarbeitung nach Namen zu sortieren, einige PDFs stichprobenartig zu öffnen und zu prüfen, ob die Nummer im Dateinamen mit der Nummer im Text übereinstimmt. Wenn eine Excel-Vertragsliste vorhanden ist, kann die Liste der Dateinamen auch mit den Nummern in der Liste abgeglichen werden. Die Stapelverarbeitung steigert die Effizienz, vor der endgültigen Archivierung ist jedoch eine notwendige Prüfung anzuraten.
Fazit: Mit Stapelverarbeitungstools die Effizienz der PDF-Vertragsarchivierung steigern
Die Benennung von Vertrags-PDFs nach Nummer ist ein grundlegender, aber wichtiger Schritt im Dateimanagement. Manuelles Umbenennen ist zwar einfach, kostet aber bei steigender Dateianzahl viel Zeit. Mit Hilfe von HeSoft Doc Batch Tool können Sie über die Funktion „PDF-Dateien mit Dateiinhalt umbenennen“ die Contract No.-Nummer automatisch aus dem PDF-Text extrahieren und stapelweise einen standardisierten Dateinamen erstellen.
Das Beispiel in diesem Artikel verwendet \d{8}, um eine fortlaufende 8-stellige Vertragsnummer abzugleichen, und wählt „Gesamten Dateinamen überschreiben“, um letztendlich bedeutungslose Dateinamen wie 1.pdf, 2.pdf in nummerierte Dateinamen wie 10026877.pdf umzuwandeln. Für Büromitarbeiter, die große Mengen an Verträgen, Vereinbarungen, Bestellungen oder Berichten als PDF verwalten müssen, kann diese Methode wiederholte Arbeitsschritte reduzieren und die Archivierungsgenauigkeit erhöhen. Es wird empfohlen, die Regel zunächst mit wenigen Beispieldateien zu testen und die gesamte Stapelverarbeitung erst nach erfolgreicher Prüfung durchzuführen.