Wenn die PDF-Datei einen internen Barcode mit Nummer enthält, der Dateiname aber immer noch eine nichtssagende Bezeichnung wie „1.pdf“ oder „2.pdf“ ist, können Sie mit HeSoft Doc Batch Tool eine stapelweise Umbenennung anhand des Dateiinhalts vornehmen. Dieser Artikel erläutert am Szenario „Extrahieren des Barcode-Textes aus PDFs als Dateiname“ die Ergebnisse vor und nach der Verarbeitung, die geeigneten Geschäftsanwendungen und den detaillierten Arbeitsablauf. Der Benutzer muss lediglich die PDF-Dateien importieren, in den Verarbeitungsoptionen „Erstes Barcode-Bild“ auswählen und die Einstellung zum Überschreiben des gesamten Dateinamens festlegen, damit die PDFs automatisch mit der Barcode-Nummer benannt werden. Dies steigert die Effizienz bei der Dateiablage und -suche.
Viele Büroszenarien stoßen auf dasselbe Problem: Die tatsächliche Nummerierung der PDF-Datei befindet sich im Seiteninhalt, während der Dateiname nur eine vom System automatisch generierte fortlaufende Nummer ist. Beispielsweise enthalten gescannte Verträge, Expressfrachtbriefe, Berichte, Archivdeckblätter oder Ein- und Auslagerungsbelege möglicherweise klare Barcodes und Nummern auf der PDF-Seite. Im Ordner sieht man jedoch nur 1.pdf, 2.pdf, 3.pdf. Um diese PDFs in recherchierbare Unterlagen zu verwandeln, besteht die herkömmliche Methode darin, jede PDF einzeln zu öffnen, den Barcode-Text zu prüfen und dann im Ordner den Dateinamen zu ändern. Dieser Prozess erscheint einfach, ist aber tatsächlich sehr zeitaufwendig, insbesondere wenn die Anzahl der Dateien steigt und die Genauigkeit der manuellen Bearbeitung abnimmt.
Dieser Artikel stellt eine Methode vor, die besser für die Stapelverarbeitung im Büro geeignet ist: Extrahieren Sie den Barcode-Text aus der PDF als Dateinamen und benennen Sie PDF-Dateien automatisch im Stapel. Mithilfe von HeSoft Doc Batch Tool kann das erste Barcode-Bild im PDF-Inhalt als Erkennungsquelle verwendet werden, um die erkannte Barcode-Nummer direkt als Ersatz für den ursprünglichen Dateinamen zu verwenden. Auf diese Weise werden die ursprünglich unstrukturierten PDF-Namen stapelweise in Geschäftsnummern geändert, was die spätere Archivierung, Suche, Prüfung und Bereitstellung erleichtert.
Anwendungsszenario: Dateibenennung durch Extraktion der Barcode-Nummer aus dem PDF-Inhalt
Diese Methode ist besonders geeignet, wenn die Datei selbst bereits eine eindeutige Nummer enthält, der Dateiname diese Nummer aber nicht wiedergibt. Häufige Beispiele sind PDFs von Logistikbelegen, Bestellbelegen, Prüfberichten, Anlagenunterlagen, Zertifikaten, Lageretiketten, Prüfungs- oder Schulungsmaterialien usw. Solange jede PDF einen erkennbaren Barcode enthält und die entsprechende Textnummer als Dateiname verwendet werden kann, ist diese Methode der Stapelumbenennung möglich.
Im Screenshot vor der Verarbeitung ist zu sehen, dass der Ordner 4 PDF-Dateien mit sehr einfachen Namen enthält: 1.pdf, 2.pdf, 3.pdf, 4.pdf. Solche Dateinamen sind in einer temporären Bearbeitungsphase vielleicht akzeptabel, sobald sie jedoch offiziell archiviert werden oder man in einer großen Menge von Unterlagen eine bestimmte PDF suchen muss, sind sie sehr unpraktisch. Der Nutzer kann am Dateinamen nicht erkennen, welche Nummer zu welcher PDF gehört, und kann die Zieldatei auch nicht direkt anhand der Geschäftsnummer suchen.

Beim Öffnen einer der PDFs ist zu sehen, dass sich oben rechts auf der PDF-Seite ein Barcode befindet, unter dem die Nummer 20036655 angezeigt wird. Dies zeigt, dass der PDF-Inhalt bereits die Schlüsselinformation zur Identifizierung der Datei enthält, diese Information jedoch noch nicht im Dateinamen erscheint. Das Ziel der in diesem Artikel beschriebenen Vorgehensweise ist es, diesen Barcode-Text zu extrahieren, sodass der PDF-Dateiname automatisch in eine Form wie 20036655.pdf geändert wird.

Ergebnisvorschau: Nach automatischer Benennung sind PDFs leichter auffindbar
Nach Abschluss der Stapelverarbeitung werden die PDF-Dateinamen von den ursprünglichen fortlaufenden Nummern in Barcode-Nummern geändert. Im Screenshot nach der Verarbeitung ist zu sehen, dass die ursprünglichen 4 PDFs nun zu 10026877.pdf, 20036655.pdf, 20100511.pdf und 33952100.pdf geworden sind. Jeder Dateiname ist keine bedeutungslose Sequenz mehr, sondern entspricht direkt der Barcode-Nummer im PDF-Inhalt.

Die Vorteile dieser Benennungsart liegen auf der Hand. Erstens werden die Dateinamen lesbar, recherchierbar und überprüfbar, sodass der Nutzer weiß, zu welcher Nummer die Datei gehört, ohne sie öffnen zu müssen. Zweitens kommuniziert der Dateiname selbst wichtige Informationen, wenn die PDFs in ein Geschäftssystem hochgeladen oder an Kollegen übergeben werden, was den Kommunikationsaufwand reduziert. Drittens: Soll später nach einer bestimmten Nummer gesucht werden, kann die Datei einfach durch Suche nach der Barcode-Ziffer im Ordner gefunden werden, ohne jede PDF einzeln öffnen zu müssen.
Schritte: Stapelweises Extrahieren von PDF-Barcode-Text und Umbenennen
Im Folgenden wird anhand von Software-Screenshots erläutert, wie HeSoft Doc Batch Tool für diese Aufgabe verwendet wird. Bei dieser Software handelt es sich um ein Stapelverarbeitungswerkzeug für Bürodokumente, das sich für die Verarbeitung großer Mengen wiederkehrender Dateiorganisationsanforderungen eignet, wie z. B. stapelweises Umbenennen von Dateien, Benennung nach Inhalt, Ordnerverwaltung und stapelweise Verarbeitung verschiedener Bürodokumenttypen. Dieser Artikel konzentriert sich auf die damit verbundenen Funktionen zur Dateinamensverarbeitung für PDFs.
Schritt 1: Finden der PDF-Inhaltsumbenennung im Dateinamen-Werkzeug
Öffnen Sie die Software und wählen Sie in der linken Navigationsleiste "Dateinamen". Der Hauptbereich zeigt mehrere Funktionen zur Dateinamenverarbeitung an, z. B. Schlüsselwörter im Dateinamen ersetzen, Text einfügen, Präfixe/Suffixe hinzufügen, Umbenennen anhand des Dateiinhalts usw. Für diesen Artikel wird "PDF-Dateien anhand des Dateiinhalts umbenennen" benötigt. Im Screenshot ist diese Funktionskarte ausgewählt, mit der Beschreibung "Bestimmten Text aus dem Inhalt von PDF-Dateien stapelweise als Dateinamen verwenden".

Der Grund für die Wahl dieser Funktion ist: Die Barcode-Nummer befindet sich nicht im ursprünglichen Dateinamen, sondern im Inhalt der PDF-Seite. Wenn man nur den bestehenden Dateinamen sucht und ersetzt, erhält man die interne Barcode-Nummer der PDF nicht. Daher muss der Ansatz "Umbenennen anhand des Dateiinhalts" verwendet werden, bei dem die Software die Informationen aus der PDF liest und einen neuen Dateinamen generiert.
Schritt 2: Importieren der automatisch zu benennenden PDF-Dateien
Nach dem Aufrufen der Funktion zeigt der obere Seitenbereich "PDF-Dateien anhand des Dateiinhalts umbenennen" an und gliedert sich in vier Phasen: Auswahl der zu verarbeitenden Datensätze, Einstellen der Verarbeitungsoptionen, Festlegen des Speicherorts, Verarbeitung starten. Die Aufgabe der ersten Phase ist der Import der zu verarbeitenden PDFs. Oben rechts in der Oberfläche befinden sich die Schaltflächen "Dateien hinzufügen" und "Dateien aus Ordner importieren". Der Nutzer kann die Importmethode je nach Dateianzahl wählen.

Nach dem Import zeigt die Liste den Namen, Pfad, die Erweiterung, das Erstellungsdatum und das Änderungsdatum jeder PDF an. Im Screenshot ist zu sehen, dass die vier Dateien 1.pdf, 2.pdf, 3.pdf, 4.pdf importiert wurden, alle mit der Erweiterung pdf. Der Zusammenfassungsbereich unten zeigt eine Datensatzanzahl von 4, was bedeutet, dass diesmal 4 PDFs stapelweise verarbeitet werden. Nachdem bestätigt wurde, dass keine falschen Dateien importiert wurden, klicken Sie unten auf der Seite auf "Weiter", um zu den Optionseinstellungen zu gelangen.
Der Schlüssel in diesem Schritt ist die Sicherstellung, dass die Liste der zu verarbeitenden Dateien korrekt ist. Wenn sich im Ordner PDFs befinden, die nicht umbenannt werden sollen, sollten diese vor Beginn der Verarbeitung ausgeschlossen werden. Falls Dateien fehlen, sollten diese hinzugefügt werden. Die Effizienz eines Stapelwerkzeugs ergibt sich aus der einmaligen Verarbeitung, vorausgesetzt, die Eingabeliste ist korrekt.
Schritt 3: Auswahl von "Erstes Barcode-Bild" im Suchbereich
Im zweiten Schritt "Verarbeitungsoptionen einstellen" muss der Software mitgeteilt werden, aus welcher Position oder welcher Art von Inhalt in der PDF der Dateiname extrahiert werden soll. Der Screenshot zeigt, dass es im "Suchbereich" drei Optionen gibt: Erste Textzeile, Erstes Barcode-Bild, Durch benutzerdefinierte Formel gefundener Text. Dieses Tutorial soll den PDF-Barcode-Text extrahieren, daher sollte "Erstes Barcode-Bild" gewählt werden.

Nach Auswahl dieser Option verwendet die Software das erste Barcode-Bild in jeder PDF als Erkennungsobjekt und verwendet den entsprechenden Inhalt zur Benennung. In Übereinstimmung mit der vorherigen PDF-Vorschau, wo sich unter dem Barcode die Nummer 20036655 befindet, wird die entsprechende Datei im Verarbeitungsergebnis also in 20036655.pdf umbenannt. Für Unterlagen, bei denen die Barcode-Position festgelegt ist und jede PDF nur einen Haupt-Barcode enthält, kann diese Option die manuelle Erkennungsarbeit effektiv reduzieren.
Wenn die erste Textzeile Ihrer PDF-Seite die Nummer ist, können Sie "Erste Textzeile" wählen. Wenn die Nummer anhand eines bestimmten festen Formats aus dem Textkörper abgeglichen werden muss, können Sie "Durch benutzerdefinierte Formel gefundener Text" in Betracht ziehen. Aber im aktuellen, im Screenshot gezeigten Barcode-Benennungsszenario ist "Erstes Barcode-Bild" die den Anforderungen am besten entsprechende Einstellung.
Schritt 4: Festlegen der Position der Barcode-Nummer im Dateinamen
Auf derselben Seite gibt es auch die "Position"-Einstellung mit den drei Optionen "Gesamten Dateinamen überschreiben", "Links vom Dateinamen" und "Rechts vom Dateinamen". Im Screenshot ist "Gesamten Dateinamen überschreiben" ausgewählt, was bedeutet, dass die erkannte Barcode-Nummer den ursprünglichen Hauptteil des Dateinamens direkt ersetzt.
Lautet der ursprüngliche Dateiname beispielsweise 2.pdf und die Barcode-Nummer in der PDF 20036655, dann lautet der neue Dateiname nach dem Überschreiben des gesamten Dateinamens 20036655.pdf. Diese Methode eignet sich für Archivierungsszenarien, in denen die Barcode-Nummer als eindeutige Dateikennung dient – der Dateiname ist kurz und einheitlich und die spätere Suche ebenfalls einfach. Wenn der Nutzer den ursprünglichen Dateinamen beibehalten möchte, kann er je nach tatsächlichem Bedarf die Einstellung wählen, mit der der erkannte Inhalt links oder rechts vom Dateinamen platziert wird. Das in diesem Artikel gezeigte Endergebnis verwendet jedoch vollständig die Barcode-Nummer zur Benennung.
Schritt 5: Weiter zum nächsten Schritt, Speicherort bestätigen und Verarbeitung ausführen
Nachdem der Suchbereich und die Positionseinstellungen abgeschlossen sind, klicken Sie auf "Weiter". In der Prozessleiste ist zu sehen, dass die nachfolgenden Schritte "Speicherort festlegen" und "Verarbeitung starten" umfassen. Obwohl die Screenshots die letzten beiden Seiten nicht zeigen, muss der Nutzer gemäß dem Oberflächen-Workflow den Anweisungen der Software folgen, um den Speicherort der Ergebnisse zu bestätigen und dann die Stapelverarbeitung zu starten.
Vor der tatsächlichen Ausführung wird empfohlen, einige Punkte zu überprüfen: Ist die Anzahl der PDFs in der Importliste korrekt? Wurde im Suchbereich "Erstes Barcode-Bild" ausgewählt? Steht die Position auf "Gesamten Dateinamen überschreiben"? Entspricht der Speicherort Ihren eigenen Dateiverwaltungsgewohnheiten? Die Bestätigung vor dem Start der Verarbeitung kann Nacharbeit reduzieren.
Nach Abschluss der Verarbeitung zeigen Sie die Dateien am Speicherort an. Das erwartete Ergebnis entspricht dem Ergebnis-Screenshot: Die PDF-Dateien werden automatisch nach der Barcode-Nummer in ihrem jeweiligen Inhalt benannt, ohne dass sie manuell einzeln geöffnet, angesehen und geändert werden müssen.
Häufig gestellte Fragen und wichtige Hinweise
1. Muss sich der Barcode in der PDF auf der ersten Seite befinden?
Der im Screenshot gezeigte Barcode befindet sich im PDF-Seiteninhalt, und die Funktionsoption ist "Erstes Barcode-Bild". Bei der tatsächlichen Verwendung sollte zunächst sichergestellt werden, dass die Software den von Ihnen gewünschten Barcode erkennen kann. Wenn Position und Reihenfolge der Barcodes in jeder PDF einheitlich sind, werden die Ergebnisse der Stapelverarbeitung stabiler sein.
2. Stimmt die Ziffer unter dem Barcode vollständig mit dem Dateinamen überein?
Den Beispielergebnissen zufolge wird die Barcode-Nummer aus der PDF zur Generierung des Dateinamens verwendet, z. B. wird 20036655 zu 20036655.pdf. Es kann vor der Verarbeitung mit einer kleinen Stichprobe getestet werden, um sicherzustellen, dass das Erkennungsergebnis mit der auf der Seite angezeigten Nummer übereinstimmt, bevor alle PDFs stapelweise verarbeitet werden.
3. Bleibt der ursprüngliche Dateiname erhalten?
Wenn "Gesamten Dateinamen überschreiben" gewählt wird, ersetzt der neue Dateiname den Hauptteil des ursprünglichen Dateinamens durch die erkannte Barcode-Nummer. Wenn die Informationen des ursprünglichen Dateinamens erhalten bleiben sollen, kann der erkannte Inhalt gemäß den Positionsoptionen in der Oberfläche links oder rechts zum Dateinamen hinzugefügt werden. Welche Methode gewählt wird, hängt von Ihren Archivierungsregeln ab.
4. Kann dies für andere Dateiformate verwendet werden?
In diesem Artikel wird die PDF-Datei demonstriert, daher wurde "PDF-Dateien anhand des Dateiinhalts umbenennen" gewählt. Falls Word-Dateien wie z. B. docx- oder doc-Dokumente nach Inhalt umbenannt werden müssen, sollte die entsprechende Word-Inhaltsumbenennungsfunktion in der Software verwendet werden. Für verschiedene Dateitypen sollte das passende Werkzeug gewählt werden, um Funktionsfehler zu vermeiden.
5. Warum wird vor der Stapelverarbeitung ein Test empfohlen?
Die Stapelumbenennung wirkt sich auf einmal auf mehrere Dateien aus. Um sicherzustellen, dass die Benennungsergebnisse den Erwartungen entsprechen, wird empfohlen, zunächst einige repräsentative PDFs zu testen – darunter Dateien mit klaren Barcodes, Dateien mit leicht abweichenden Barcode-Positionen und Dateien, die möglicherweise mehrere Barcodes enthalten. Erst wenn die Testergebnisse korrekt sind, sollte die Stapelverarbeitung für den gesamten Ordner ausgeführt werden.
Zusammenfassung: Verwandeln Sie PDF-Barcode-Nummern in Dateinamen, um die Archivierungseffizienz zu steigern
Wenn PDF-Dateinamen und der Inhalt der Dateien nicht übereinstimmen, werden spätere Organisation und Suche ineffizient. Mit der Funktion "PDF-Dateien anhand des Dateiinhalts umbenennen" von HeSoft Doc Batch Tool kann das erste Barcode-Bild in der PDF als Erkennungsquelle dienen, um den Barcode-Text stapelweise zu extrahieren und als Dateinamen zu verwenden. Nach der Verarbeitung werden die ursprünglichen fortlaufenden Dateien wie 1.pdf, 2.pdf in die entsprechenden Barcode-Nummern-Dateien umgewandelt, was die Dateiverwaltung übersichtlicher macht.
Für Nutzer, die häufig gescannte PDFs, Barcode-Belege, Logistikunterlagen, Prüfberichte und Archivdokumente verarbeiten, kann diese automatische Stapelbenennungsmethode die sich wiederholenden Aufgaben erheblich reduzieren und manuelle Eingabefehler verringern. Es wird empfohlen, solche regelbasierten Dateiorganisationsaufgaben im täglichen Büroalltag einem Stapelverarbeitungswerkzeug zu überlassen und die Zeit für Arbeiten zu nutzen, die mehr Urteilsvermögen und Prüfung erfordern.