Tutorial zum Umbenennen von Dateien im Batch nach den 8-stelligen Nummern im PDF-Text mit Platzhalter-Matching-Regeln


ÜbersetzungEnglishFrançaisDeutschEspañol日本語한국어Aktualisierungszeit2026-06-08 09:23:40

Erklärung: Alle Bilder, Texte und Videos auf der Website dienen nur als Referenz und sind möglicherweise nicht aktuell, korrekt oder genau. Im Streitfall beziehen Sie sich bitte auf den tatsächlichen Erlebniseffekt!

Wenn der PDF-Dateiname aus bedeutungslosen Ziffern besteht, wird sowohl die Ablage als auch das Wiederfinden erschwert. Dieser Artikel stellt eine Methode vor, wie man Dateien stapelweise nach dem Inhalt des PDF-Textes umbenennen kann: Verwenden Sie die PDF-Inhaltsumbenennungsfunktion in HeSoft Doc Batch Tool , importieren Sie mehrere PDFs und wählen Sie die benutzerdefinierte Formel zum Abgleichen von Text. Geben Sie im regulären Ausdruck \d{8} ein, um die 8-stellige Nummer aus dem Fließtext zu extrahieren und den ursprünglichen Dateinamen zu überschreiben. Der Artikel kombiniert Bearbeitungsvorher- und -nachher-Vergleiche sowie Bedien-Screenshots und eignet sich für Büromitarbeiter, die PDF-Materialien wie Verträge, Vereinbarungen, Bestellungen und Berichte organisieren müssen.

Bei der Organisation von elektronischen Verträgen, Vereinbarungen, Auftragsbestätigungen, Prüfberichten oder Projektdokumenten stehen viele Unternehmen vor dem gleichen Problem: Die PDF-Datei selbst enthält eine vollständige Nummer, aber der Dateiname besteht nur aus einfachen Ziffern oder Export-Sequenznummern. Im Ordner werden beispielsweise 1.pdf, 2.pdf, 3.pdf, 4.pdf angezeigt, und man muss jede Datei einzeln öffnen, um zu wissen, welche Vertragsnummer zu welcher Datei gehört. Solche Dateien lassen sich kurzfristig noch mühsam verwalten, aber sobald die Anzahl steigt, werden Suchen, Abgleichen, Archivieren und Übergaben sehr ineffizient.

Die in diesem Artikel beschriebene Methode besteht darin, die Bürosoftware die Nummer automatisch aus dem PDF-Text auslesen zu lassen und den Zieltext mithilfe von Platzhalter-/regulären Ausdrucksregeln zu extrahieren, um die ursprünglichen Dateinamen stapelweise zu ersetzen. Im Screenshot-Beispiel enthält die erste Seite jeder PDF eine 8-stellige Vertragsnummer, und der endgültige Dateiname wird von der ursprünglichen Sequenznummer in die Nummer selbst geändert, z. B. 10026877.pdf. Der gesamte Ablauf ist für Nicht-Entwickler geeignet; man muss lediglich das Nummernformat verstehen und den entsprechenden Übereinstimmungsausdruck in die Software eingeben.

Anwendungsszenario: Nummer aus PDF-Inhalt als Dateinamen extrahieren

Die Umbenennung nach PDF-Textinhalt eignet sich am besten für die Verarbeitung von Materialien mit "regelmäßigem Dateiinhalt, aber unregelmäßigen Dateinamen". Zum Beispiel, wenn im Vertrags-PDF-Text "Contract No." oder eine Vertragsnummer steht, in der Bestell-PDF eine Bestellnummer, im Prüfbericht eine Berichtsnummer, in Archivmaterialien eine Personalnummer oder in Finanzunterlagen eine Belegnummer. Solange das Nummernformat relativ stabil ist, z. B. aufeinanderfolgende 8 Ziffern, ein fester Buchstabenpräfix plus Ziffern oder Datum plus laufende Nummer, kann eine regelbasierte Übereinstimmung in Betracht gezogen werden.

Der Wert dieser Methode liegt in der Reduzierung sich wiederholender Arbeit. Der traditionelle Ansatz ist: erste PDF öffnen, Nummer finden, kopieren, schließen, umbenennen; dann die zweite PDF öffnen und denselben Vorgang wiederholen. Bei 100 Dateien muss dies 100 Mal wiederholt werden. Der Ansatz des Stapelverarbeitungstools ist: Zuerst die Regel einrichten, dann die Software denselben Regelsatz auf alle Dateien anwenden lassen.

Das in diesem Artikel verwendete Beispiel sind PDF-Dateien. Wenn Ihre Büromaterialien Word-Dokumente sind, z. B. docx, doc, oder Textdateien, können Sie das Verarbeitungsobjekt auch entsprechend der Dokumentinhalts-Umbenennungsfunktion in der Software auswählen. Die Einstiegspunkte für verschiedene Formate können unterschiedlich sein, aber der Grundgedanke "Extrahieren von Schlüsseltext basierend auf dem Inhalt und Generieren eines Dateinamens" ist derselbe.

Ergebnisvorschau: Von bedeutungslosen Sequenznummern zu durchsuchbaren Nummern

Vorher: Dateiname spiegelt PDF-Inhalt nicht wider

Im Screenshot vor der Verarbeitung befinden sich 4 PDF-Dateien im Ordner mit den Namen 1.pdf, 2.pdf, 3.pdf, 4.pdf. Diese Namenskonvention ist zwar einfach, kann aber keine Geschäftsinformationen transportieren. Sowohl Vertragsmanager, Projektassistenten als auch Finanzmitarbeiter müssen die Datei öffnen, um den Inhalt zu beurteilen.

image-Inhalt des PDF-Textes extrahieren,PDF-Dateinamen stapelweise ändern,PDF mit regulären Ausdrücken umbenennen

Nach dem Öffnen einer der PDFs sieht man oben auf der Seite das Feld "Contract No.", gefolgt von einer 8-stelligen Nummer. Der rote Rahmen und der Pfeil markieren die Nummer 10026877. Genau diese Nummer ist die wertvollste Information für die Dateiablage, da sie direkt dem Vertragsregister oder den Datensätzen im Geschäftssystem zugeordnet werden kann.

image-Inhalt des PDF-Textes extrahieren,PDF-Dateinamen stapelweise ändern,PDF mit regulären Ausdrücken umbenennen

Nachher: Dateiname wird zur Vertragsnummer aus der PDF

Nach Abschluss der Stapelumbenennung haben sich die PDF-Namen im Ordner geändert in 10026877.pdf, 20036655.pdf, 20100511.pdf, 33952100.pdf. Jetzt kann die entsprechende Nummer direkt am Dateinamen erkannt werden, ohne die Datei öffnen zu müssen.

image-Inhalt des PDF-Textes extrahieren,PDF-Dateinamen stapelweise ändern,PDF mit regulären Ausdrücken umbenennen

Dieses Ergebnis eignet sich hervorragend für die anschließende Archivierung. Ob Sortieren nach Nummer, Suchen im Ordner, Hochladen in ein System oder Abgleich mit einer Excel-Liste – es ist zuverlässiger als die ursprünglichen 1.pdf, 2.pdf.

Bedienungsschritte: PDF-Stapelumbenennung mit HeSoft Doc Batch Tool durchführen

Schritt 1: PDF-Inhaltsumbenennung im Dateinamen-Tool finden

Öffnen Sie HeSoft Doc Batch Tool . Auf der linken Seite der Software befinden sich mehrere Kategorien, darunter Startseite, Aufgabenablauf, Alle Werkzeuge, Dateiname, Ordnername, Dateiordner, Word-Werkzeuge, Excel-Werkzeuge, PowerPoint-Werkzeuge, PDF-Werkzeuge usw. Da es bei dieser Aufgabe um die Änderung von Dateinamen geht, wählen Sie links "Dateiname".

Nachdem Sie die Kategorie "Dateiname" aufgerufen haben, finden Sie in den Funktionskarten "7. PDF-Dateien anhand des Dateiinhalts umbenennen". Die Kartenbeschreibung zeigt, dass diese Funktion "Bestimmte Texte aus dem Inhalt von PDF-Dateien stapelweise als Dateinamen dieser Dateien verwenden" kann. Dies bedeutet, dass nicht einfach der vorhandene Dateiname ersetzt wird, sondern der interne PDF-Text gelesen und der gefundene Inhalt für die Umbenennung verwendet wird.

image-Inhalt des PDF-Textes extrahieren,PDF-Dateinamen stapelweise ändern,PDF mit regulären Ausdrücken umbenennen

Das erwartete Ergebnis dieses Schritts ist das Aufrufen der speziell für die PDF-Inhaltsumbenennung vorgesehenen Assistenten-Oberfläche. Für eine große Anzahl von PDF-Verträgen, Bestellungen und Berichten ist dies der wichtigste Funktionszugang.

Schritt 2: Umzubenennende PDF-Dateien importieren

Nach Aufruf der Funktion zeigt der Seitentitel "PDF-Dateien anhand des Dateiinhalts umbenennen" an. Die Fortschrittsleiste zeigt 4 Schritte: Zu verarbeitende Datensätze auswählen, Verarbeitungsoptionen einstellen, Speicherort einstellen, Verarbeitung starten. Sie befinden sich derzeit in Schritt 1.

Oben rechts auf der Seite werden "Datei hinzufügen" und "Dateien aus Ordner importieren" angeboten. Wenn sich die Zieldateien an verschiedenen Orten befinden, können Sie "Datei hinzufügen" verwenden; wenn alle PDFs in einem Verzeichnis abgelegt sind, ist der Import aus dem Ordner bequemer. Im Screenshot wurden bereits 4 PDFs importiert, die Liste zeigt Name, Pfad, Erweiterung, Erstellungszeit und Änderungszeit an.

image-Inhalt des PDF-Textes extrahieren,PDF-Dateinamen stapelweise ändern,PDF mit regulären Ausdrücken umbenennen

Prüfen Sie nach dem Import bitte besonders drei Punkte: Erstens, ob die Erweiterung durchgehend pdf ist; zweitens, ob die Anzahl der Datensätze korrekt ist; drittens, ob der Pfad das zur Verarbeitung vorgesehene Verzeichnis ist. Am unteren Rand des Screenshots wird die Datensatzanzahl mit 4 angezeigt, was bedeutet, dass diesmal 4 PDFs umbenannt werden. Klicken Sie nach Bestätigung auf "Weiter" am unteren Rand.

Schritt 3: Suchbereich auf benutzerdefinierten Formel-Übereinstimmungstext setzen

Im zweiten Schritt "Verarbeitungsoptionen einstellen" müssen Sie der Software mitteilen, woher sie den Dateinamen in der PDF nehmen soll. Der "Suchbereich" in der Oberfläche bietet mehrere Optionen, darunter "Erste Textzeile", "Erstes Barcode-Bild" und "Mit benutzerdefinierter Formel gefundener Text". In diesem Beispiel soll die 8-stellige Vertragsnummer aus dem PDF-Text extrahiert werden, daher wählen Sie "Mit benutzerdefinierter Formel gefundener Text".

Der Zweck dieser Auswahl besteht darin, die Extraktion nicht auf die erste Zeile zu beschränken und sich nicht auf Barcodes zu stützen, sondern anhand von Regeln den passenden Inhalt im PDF-Text zu suchen. Für Texte mit festem Format wie Vertragsnummern ist dies die flexiblere Methode.

image-Inhalt des PDF-Textes extrahieren,PDF-Dateinamen stapelweise ändern,PDF mit regulären Ausdrücken umbenennen

Schritt 4: Ausdruck für die Übereinstimmung mit 8 Ziffern eingeben

Geben Sie im Eingabefeld "Regulärer Ausdruck" \d{8} ein. Dieser Ausdruck wird verwendet, um aufeinanderfolgende 8 Ziffern zu finden. Die Vertragsnummer 10026877 im Screenshot besteht genau aus 8 Ziffern, wird daher gefunden und zur Generierung des Dateinamens verwendet.

Wenn man es als Platzhalterregel versteht, kann man es sich so merken: \d steht für eine Ziffer, {8} steht für die Anzahl 8. Im Vergleich zu gewöhnlichen Sternchen- oder Fragezeichen-Platzhaltern können reguläre Ausdrücke das Nummernformat genauer beschreiben. Für die Stapelumbenennung gilt: Je genauer die Regel, desto stabiler das Ergebnis.

Vor dem Ausfüllen des Ausdrucks wird empfohlen, einige Beispiel-PDFs zu beobachten, um zu bestätigen, dass alle Zielnummern die gleiche Länge haben. Wenn einige Vertragsnummern 8-stellig und andere 10-stellig sind, kann nicht einfach dieselbe \d{8}-Regel verwendet werden, sondern sie muss an das tatsächliche Format angepasst werden.

Schritt 5: Überschreiben des gesamten Dateinamens auswählen

In der Einstellung "Position" zeigt der Screenshot die Optionen "Gesamten Dateinamen überschreiben", "Am linken Rand des Dateinamens", "Am rechten Rand des Dateinamens". Diesmal sollen die alten Namen wie 1.pdf, 2.pdf vollständig durch die Vertragsnummer ersetzt werden, daher wählen Sie "Gesamten Dateinamen überschreiben".

Nach der Auswahl verwendet die Software die gefundene Nummer als Hauptbestandteil des neuen Dateinamens und behält die PDF-Erweiterung bei. Das heißt, wenn 10026877 gefunden wird, lautet der ausgegebene Dateiname 10026877.pdf. Diese Benennung ist am kürzesten und eignet sich am besten für die Suche nach Nummern.

Wenn Ihre tatsächliche Anforderung darin besteht, den ursprünglichen Dateinamen beizubehalten, können Sie die Nummer auch links oder rechts hinzufügen. Zum Beispiel die Vertragsnummer vor dem ursprünglichen Dateinamen einfügen, um eine Struktur wie "10026877_1.pdf" zu bilden. Im Beispiel dieses Artikels wird jedoch vollständig überschrieben, daher ist die Auswahl von "Gesamten Dateinamen überschreiben" passender.

Schritt 6: Zum Speicherort navigieren und Verarbeitung starten

Nachdem Sie die Übereinstimmungsregeln und die Benennungsposition eingestellt haben, klicken Sie auf "Weiter". Entsprechend der Fortschrittsleiste müssen Sie als Nächstes den Speicherort einstellen und dann die Verarbeitung starten. Obwohl der Screenshot die spezifische Seite für den Speicherort nicht zeigt, kann man anhand des Assistentenablaufs vernünftigerweise schlussfolgern, dass der Benutzer in den folgenden Schritten die Speichermethode für die verarbeiteten Dateien bestätigen muss.

Bei wichtigen PDFs wird empfohlen, das Verarbeitungsergebnis zunächst in einem separaten Verzeichnis zu speichern und nach der Bestätigung der korrekten Dateinamen die formelle Ersetzung oder Archivierung durchzuführen. So werden die Originaldateien nicht beeinträchtigt, selbst wenn die Ausdruckseinstellungen nicht den Erwartungen entsprechen. Bestätigen Sie und rufen Sie "Verarbeitung starten" auf, und warten Sie, bis die Software die Stapelaufgabe abgeschlossen hat.

Häufige Fragen und Hinweise

Ist der Ausdruck \d{8} für alle PDFs geeignet?

Nicht unbedingt. Er ist nur geeignet, wenn die Zielnummer aus aufeinanderfolgenden 8 Ziffern besteht. Wenn Ihre Vertragsnummer Buchstaben, Bindestriche oder ein Datum enthält, z. B. HT-20260601-001, müssen Sie einen diesem Format entsprechenden Ausdruck verwenden. Vor der Stapelverarbeitung sollte die Nummernregel unbedingt geklärt werden.

Was, wenn eine PDF mehrere 8-stellige Nummern enthält – wird dann die falsche genommen?

Das ist möglich. Wenn der Textkörper gleichzeitig Daten, Telefonnummern, Betrags-Transaktionsnummern usw. mit 8 Ziffern enthält, könnte die Software einen Nicht-Zielinhalt finden. Daher wird empfohlen, vor der formellen Verarbeitung mit einer kleinen Stichprobe zu testen. Falls nötig, sollte die Regel spezifischer gestaltet werden, z. B. durch Einbeziehung des festen Textes vor oder nach der Nummer, um den Zielbereich einzugrenzen.

Was tun bei doppelten Dateinamen?

Wenn in verschiedenen PDFs dieselbe Nummer gefunden wird, kann das Problem doppelter Dateinamen auftreten. Theoretisch sollten Nummern in Verträgen, Bestellungen usw. eindeutig sein, aber in der Praxis kann es zu Doppelscans oder Doppelexporten kommen. Überprüfen Sie vor der Verarbeitung die Stichproben und nach der Verarbeitung, ob die Anzahl der Dateien übereinstimmt.

Warum wird die Nummer in manchen PDFs nicht erkannt?

Mögliche Gründe sind, dass die PDF ein reiner Bildscan ist, die Nummer nicht zum extrahierbaren Text gehört, das Nummernformat nicht mit dem Ausdruck übereinstimmt oder die Nummer in der PDF an einer speziellen Position steht. Öffnen Sie in solchen Fällen zuerst die PDF und versuchen Sie, den Nummerntext auszuwählen. Wenn dies nicht möglich ist, handelt es sich möglicherweise nicht um eine normale Textebene.

Kann dies auch für Word-, docx-, doc-Dateien verwendet werden?

Dieser Artikel bezieht sich auf PDF-Dateien. Für Word-Dokumente wie docx, doc müssen Sie die entsprechende Inhaltsumbenennungsfunktion für Word-Dateien in der Software auswählen. Verwenden Sie die PDF-Funktion nicht direkt für Word-Dateien; bestätigen Sie vor dem Import, dass Erweiterung und Funktionstyp übereinstimmen.

Zusammenfassung: PDF-Dateinamen automatisch an Geschäftsnummern anpassen

Mit HeSoft Doc Batch Tool kann die sich wiederholende Arbeit "PDF öffnen, Nummer ansehen, manuell umbenennen" in einen automatisierten Prozess aus "Dateien importieren, Ausdruck einstellen, stapelweise ausführen" umgewandelt werden. Für PDF-Materialien wie Verträge, Bestellungen, Berichte und Akten kann die stapelweise Umbenennung nach Textnummer die Effizienz der Dateiablage erheblich steigern und das Risiko menschlicher Kopierfehler reduzieren.

Wenn Ihre PDF-Dateinamen immer noch aus bedeutungslosen Sequenznummern bestehen, empfiehlt es sich, mit einigen Stichproben zu testen. Nachdem Sie das Nummernformat bestätigt haben, wählen Sie in "PDF-Dateien anhand des Dateiinhalts umbenennen" die Option "Mit benutzerdefinierter Formel gefundener Text", geben Sie den passenden regulären Ausdruck ein und verarbeiten Sie dann den gesamten Ordner stapelweise. So können Sie sowohl kontrollierbare Ergebnisse sicherstellen als auch eine große Anzahl von PDFs schnell und einheitlich benennen.


SchlüsselwortInhalt des PDF-Textes extrahieren , PDF-Dateinamen stapelweise ändern , PDF mit regulären Ausdrücken umbenennen
Erstellungszeit2026-06-08 09:23:24

Erklärung: Alle Bilder, Texte und Videos auf der Website dienen nur als Referenz und sind möglicherweise nicht aktuell, korrekt oder genau. Im Streitfall beziehen Sie sich bitte auf den tatsächlichen Erlebniseffekt!

Verwandte Artikel

Fehlt Ihnen die gewünschte Funktion?

Geben Sie uns Ihr Feedback zu Ihren Anforderungen, und nach der Bewertung setzen wir es kostenlos um!