Bei der Stapelarchivierung von PDFs ist eine der problematischsten Situationen, dass der Dateiname keine Bedeutung hat, während der Barcode-Text im Dokument die eigentliche Nummer ist. Dieser Artikel erklärt anhand eines praktischen Büroszenarios, wie Sie mit HeSoft Doc Batch Tool den ersten Barcode-Bildtext aus einer PDF extrahieren und diesen als PDF-Dateinamen verwenden. Der Artikel enthält einen Vorher-Nachher-Vergleich, den Funktionszugang, den Dateiimport, die Einstellungen der Verarbeitungsoptionen sowie Hinweise zum Speichern und zur Verarbeitung, um Benutzern bei der automatischen Umbenennung von PDFs zu helfen.
In der Dateiverwaltung erscheint das Umbenennen einfach, ist aber oft einer der zeitaufwändigsten Schritte. Insbesondere bei einer großen Anzahl von PDF-Dateien, deren Dateinamen nur systemgenerierte Sequenznummern wie 1.pdf, 2.pdf, 3.pdf sind, kann der Inhalt nicht direkt beurteilt werden. Viele Benutzer müssen die PDFs einzeln öffnen, die Barcode-Nummer auf der Seite finden und dann den Dateinamen manuell ändern. Dieser Prozess ist repetitiv, ineffizient und kann aufgrund von Zahlendrehern zu Inkonsistenzen zwischen Dateiname und Inhalt führen.
Wenn die PDF-Seite selbst bereits einen Barcode enthält und der dem Barcode entsprechende Text die Geschäftsnummer ist, besteht ein effizienterer Weg darin, die Bürosoftware diese Informationen automatisch auslesen und die Datei-Umbenennung stapelweise durchführen zu lassen. Dieser Artikel verwendet HeSoft Doc Batch Tool als Beispiel, um zu erklären, wie man stapelweise PDF-Barcode-Texte extrahiert und Dateien umbenennt, sodass die PDFs im Ordner von temporären Namen zu identifizierbaren und durchsuchbaren nummerierten Namen werden.
Anwendungsszenario: Benennung basierend auf PDF-Inhalt statt ursprünglichem Dateinamen
Diese Verarbeitungsmethode eignet sich für alle Szenarien, in denen der PDF-Inhalt als Grundlage für die Benennung dient, insbesondere bei Materialien mit Barcodes oder Barcode-Nummern auf den Seiten. Beispielsweise müssen Logistik- und Lagerabteilungen möglicherweise Belege nach Barcode-Nummern sortieren; Qualitätsprüfabteilungen müssen PDFs möglicherweise nach Berichtsnummern archivieren; Aus- und Weiterbildungseinrichtungen müssen Dokumente möglicherweise nach Materialnummern verwalten; Verwaltungs- oder Archivmitarbeiter müssen gescannte PDFs möglicherweise nach Barcode-Nummern einpflegen.
Im Gegensatz zur gewöhnlichen stapelweisen Umbenennung wird beim Extrahieren von PDF-Barcode-Text und Umbenennen nicht einfach ein Präfix oder Suffix zum Dateinamen hinzugefügt oder bestimmte Zeichen im Dateinamen ersetzt. Der Schlüssel liegt darin, die Benennungsinformationen aus dem inneren Inhalt der PDF zu beziehen. Die von HeSoft Doc Batch Tool bereitgestellte Funktion zum Umbenennen von PDF-Dateien anhand des Dateiinhalts ist genau für diese Art von Anforderungen an die stapelweise Dateiverarbeitung konzipiert.
Wenn die Anzahl der Dateien gering ist, ist die manuelle Bearbeitung noch akzeptabel; aber wenn die Anzahl mehrere Dutzend oder Hunderte erreicht, ist die manuelle Umbenennung nicht nur zeitaufwändig, sondern erhöht auch die Fehlerquote. Durch den Einsatz von Stapelverarbeitungssoftware können manuelle, sich wiederholende Vorgänge in eine einmalige Regeleinstellung umgewandelt werden, die dann von der Software liste für liste abgearbeitet wird.
Ergebnisvorschau: Barcode-Text wird zum PDF-Dateinamen
Betrachten wir zunächst den Zustand vor der Verarbeitung. Im Ordner befinden sich 4 PDF-Dateien mit den Namen 1.pdf, 2.pdf, 3.pdf, 4.pdf. Diese Namen geben nur die Dateisortierung wieder, nicht den Dateiinhalt, und sind auch nicht leicht zu durchsuchen.

Öffnet man die PDF, sieht man im oberen rechten Bereich der Seite einen Barcode, unter dem der Nummerntext angezeigt wird. Die Nummer im Screenshot lautet 20036655. Das Ziel dieses Artikels ist es, diese Art von Barcode-Text automatisch zu extrahieren und als neuen Dateinamen für die entsprechende PDF zu verwenden.

Nach Abschluss der Verarbeitung wurden die PDF-Namen im Ordner in 10026877.pdf, 20036655.pdf, 20100511.pdf, 33952100.pdf geändert. Es ist zu erkennen, dass jede PDF keine bedeutungslose Sequenznummer mehr verwendet, sondern mit dem aus dem Dateiinhalt extrahierten Barcode-Text benannt ist.

Schritt 1: Wählen Sie "PDF-Dateien anhand des Dateiinhalts umbenennen"
Nach dem Start von HeSoft Doc Batch Tool navigieren Sie zur Kategorie Dateiname auf der linken Seite. Diese Kategorie enthält mehrere stapelweise Verarbeitungsfunktionen im Zusammenhang mit Dateinamen, z. B. Suchen und Ersetzen von Schlüsselwörtern in Dateinamen, Einfügen von Text in Dateinamen, Hinzufügen von Präfix und Suffix zu Dateinamen, Hinzufügen der Gesamtseitenzahl des Dokuments zum Dateinamen usw.
Diesmal sollen PDF-Dateien verarbeitet werden, und die Benennungsquelle stammt aus dem PDF-Inhalt, daher sollte die Option PDF-Dateien anhand des Dateiinhalts umbenennen gewählt werden. Im Screenshot ist die Karte dieser Funktion ausgewählt, was darauf hinweist, dass ihr Zweck darin besteht, bestimmte Texte aus dem Inhalt von PDF-Dateien stapelweise als Dateinamen für diese Dateien zu verwenden.

Die Auswahl der richtigen Funktion ist wichtig. Wenn nur der bestehende Dateiname regelbasiert geändert werden soll, muss der ursprüngliche Dateiname nützliche Informationen enthalten; im vorliegenden Beispiel bestehen die ursprünglichen Dateinamen jedoch nur aus 1, 2, 3, 4 und bieten keinen extrahierbaren Wert. Daher muss der neue Dateiname durch Erkennung des PDF-Inhalts gewonnen werden.
Schritt 2: Fügen Sie die zu verarbeitenden PDFs zur Aufgabenliste hinzu
Nach dem Betreten der Funktionsseite zeigt die Benutzeroberfläche als ersten Schritt die Auswahl der zu verarbeitenden Datensätze an. Oben sind Schaltflächen wie Dateien hinzufügen, Dateien aus Ordner importieren, Leeren und Mehr zu sehen. Befinden sich die zu verarbeitenden PDFs alle im selben Verzeichnis, ist die Verwendung von Dateien aus Ordner importieren in der Regel bequemer; wenn nur einige verstreute Dateien verarbeitet werden sollen, kann Dateien hinzufügen verwendet werden.
Nach Abschluss des Imports listet die Aufgabentabelle Informationen wie Dateiname, Pfad, Erweiterung, Erstellungszeit, Änderungszeit usw. auf. Im Screenshot sind 4 PDFs importiert worden, mit den Dateinamen 1.pdf, 2.pdf, 3.pdf, 4.pdf, alle mit der Erweiterung pdf, die Anzahl der Datensätze beträgt 4.

Der Zweck dieses Schrittes besteht darin, der Software die Objekte für diese stapelweise Verarbeitung eindeutig zu machen. Überprüfen Sie nach dem Import, ob die Liste vollständig ist, die Pfade korrekt sind und die Erweiterungen alle pdf lauten. Wenn nicht benötigte Dateien importiert wurden, können Sie das Löschsymbol in der Aktionsspalte verwenden, um sie zu entfernen; wenn der gesamte Import fehlerhaft ist, können Sie auf Leeren klicken und dann erneut auswählen.
Klicken Sie nach Bestätigung der Richtigkeit auf Weiter. Damit ist der erste Schritt abgeschlossen, und die Software geht zur Phase der Festlegung der Verarbeitungsregeln über.
Schritt 3: Legen Sie den Suchbereich auf das erste Barcode-Bild fest
Auf der Seite Optionen für Verarbeitung festlegen ist der Suchbereich das Wichtigste. Im Screenshot sind drei auswählbare Optionen zu sehen: Erste Textzeile, Erstes Barcode-Bild, Durch benutzerdefinierte Formel abgeglichener Text. In diesem Artikel soll der dem Barcode entsprechende Text extrahiert werden, daher wählen wir Erstes Barcode-Bild.

Nach Auswahl dieser Option verwendet die Software das Barcode-Bild im PDF als Erkennungsziel und liest den entsprechenden Textinhalt des Barcodes aus. Für das PDF-Beispiel befindet sich der Barcode oben rechts auf der Seite, darunter wird die Ziffernnummer angezeigt, was der Verarbeitungslogik der Benennung nach Barcode entspricht.
Auf derselben Seite muss auch die Position festgelegt werden. Im Screenshot ist Gesamten Dateinamen ersetzen ausgewählt, was bedeutet, dass der Barcode-Text direkt zum neuen Hauptteil des Dateinamens wird. Wird beispielsweise 20036655 erkannt, lautet der Dateiname 20036655.pdf. Diese Einstellung eignet sich für Szenarien, in denen der ursprüngliche Dateiname bedeutungslos ist und nur die Geschäftsnummer beibehalten werden soll.
Soll der ursprüngliche Name in der Praxis erhalten bleiben, kann Links vom Dateinamen oder Rechts vom Dateinamen gewählt werden, um den erkannten Barcode-Text als zusätzliche Information hinzuzufügen. In diesem Fallbeispiel ergibt Gesamten Dateinamen ersetzen jedoch das prägnanteste und für die Archivierung am besten geeignete Ergebnis.
Schritt 4: Folgen Sie dem Prozess, legen Sie den Speicherort fest und starten Sie die Verarbeitung
Nachdem die Verarbeitungsoptionen festgelegt sind, klicken Sie weiter auf Weiter. Der Benutzeroberflächenprozess zeigt, dass anschließend noch Speicherort festlegen und Verarbeitung starten folgen. Der Speicherort bestimmt, wohin die verarbeiteten Dateien ausgegeben werden. Obwohl der Screenshot den genauen Inhalt der Seite Speicherort nicht zeigt, ist anhand des Prozessablaufs vernünftig zu schließen, dass der Benutzer in diesem Schritt die Einstellungen zum Ausgabeort vornehmen muss.
Bei wichtigen Dateien wird empfohlen, nicht direkt am einzigen Original zu arbeiten. Erstellen Sie zunächst eine Kopie in einem Testordner oder speichern Sie die Verarbeitungsergebnisse in einem separaten Verzeichnis und ersetzen Sie die offiziellen Dateien erst, nachdem die korrekten Dateinamen bestätigt wurden. So kann man sowohl die Effizienz der Stapelverarbeitung nutzen als auch die Datensicherheit gewährleisten.
Nach dem Start der Verarbeitung führt die Software die Erkennung und Benennung für die PDFs in der Liste einzeln gemäß den zuvor festgelegten Regeln durch. Überprüfen Sie nach Abschluss der Verarbeitung den Ausgabeordner, um zu bestätigen, dass die Dateinamen wie erwartet anhand des Barcode-Textes generiert wurden. Wenn die Ergebnisse den Erwartungen entsprechen, kann der gleiche Prozess stapelweise für weitere PDFs durchgeführt werden.
Häufige Fragen und Hinweise
1. Muss die PDF ein erkennbares Barcode-Bild sein?Ja, die in diesem Beispiel verwendete Regel ist das erste Barcode-Bild. Wenn der Barcode in der PDF zu klein, unscharf, verzerrt oder verdeckt ist, kann dies das Erkennungsergebnis beeinträchtigen. Es ist am besten, vor der Verarbeitung einige Stichproben-PDFs zu überprüfen.
2. Ist die Barcode-Nummer dem Dateinamen eins zu eins zugeordnet?Unter normalen Umständen wird der Barcode-Text in jeder PDF zum neuen Namen dieser PDF. Um doppelte Dateinamen zu vermeiden, wird empfohlen, zu bestätigen, ob die Barcode-Nummern in verschiedenen PDFs eindeutig sind.
3. Warum hat der Dateiname nach der Verarbeitung die Endung .pdf?Die Software benennt den Hauptteil des Dateinamens um, die Erweiterung der PDF-Datei bleibt weiterhin pdf erhalten, sodass sich der Dateityp nicht ändert und die Datei weiterhin mit einem PDF-Reader geöffnet werden kann.
4. Kann die Nummer nur angehängt werden, ohne den ursprünglichen Dateinamen zu überschreiben?Wie im Screenshot ersichtlich, enthalten die Positionsoptionen Links vom Dateinamen und Rechts vom Dateinamen. Wenn der ursprüngliche Dateiname aus geschäftlichen Gründen erhalten bleiben muss, kann die Anhängemethode gewählt werden; wird nur die Barcode-Nummer benötigt, wählt man Gesamten Dateinamen ersetzen.
5. Wie kann man das Risiko vor der Stapelverarbeitung reduzieren?Es wird empfohlen, zunächst eine kleine Stichprobe zu verarbeiten, um zu bestätigen, dass das erste Barcode-Bild die Zielnummer ist, und die Korrektheit des Ausgabenamens zu überprüfen. Nachdem die Regel als stabil bestätigt wurde, kann der gesamte Ordner für die Stapelverarbeitung importiert werden.
Zusammenfassung: Verwandeln Sie wiederholtes Umbenennen mit Bürosoftware in einen automatisierten Prozess
Das stapelweise Extrahieren von PDF-Barcode-Text und Umbenennen von Dateien kann effektiv die Probleme bedeutungsloser PDF-Dateinamen, zeitaufwändiger manueller Sortierung und leicht fehlerhafter Nummerneingabe lösen. Es verwandelt den manuellen Prozess des Öffnens von Dateien und Überprüfens von Nummern in einen automatisierten Prozess des Importierens von Dateien, Festlegens von Regeln und Startens der Verarbeitung.
Der Wert von HeSoft Doc Batch Tool in diesem Szenario liegt in der Kombination von PDF-Inhaltserkennung und stapelweiser Dateinamenverarbeitung. Für Benutzer, die häufig mit Bürodateien wie PDFs, Word-Dokumenten (docx oder doc), Excel-Tabellen, Bildmaterialien usw. arbeiten, können Stapelverarbeitungswerkzeuge den sich wiederholenden Arbeitsaufwand erheblich reduzieren. Wenn Sie auf PDF-Materialien mit Barcodes stoßen, können Sie den Schritten in diesem Artikel folgen, um PDF-Dateien anhand des Dateiinhalts umbenennen auszuwählen, Erstes Barcode-Bild und Gesamten Dateinamen ersetzen einzustellen und schnell standardisierte, nummerierte PDF-Dateinamen zu erhalten.