Projektmaterialien, Kundendokumente, Prüfberichte und aus Systemen exportierte Daten werden oft mit Nummern am Dateinamenanfang benannt. Wenn alle in einem einzigen Verzeichnis abgelegt werden, werden spätere Suche und Archivierung ineffizient. Dieser Artikel zeigt am Beispiel von Dateien mit den Nummern 101, 102, 103, wie Sie mit HeSoft Doc Batch Tool durch Dateinamenklassifizierung und benutzerdefinierte reguläre Ausdrücke zur Nummernextraktion Dateien stapelweise in entsprechende Ordner verschieben können, geeignet für verschiedene Bürodateitypen wie txt, docx, xlsx, pdf.
In Büroszenarien wie Projektmanagement, Kundenaktenarchivierung, Finanzbelegsortierung und Verteilung von Prüfberichten enthalten Dateinamen häufig Nummern. Beispielsweise erscheinen Projektnummer 101, Kundennummer 102 oder Chargennummer 103 am Anfang des Dateinamens. Diese Namensgebung soll eigentlich die Identifikation erleichtern, doch wenn alle Dateien im selben Ordner gespeichert werden, wird der Ordner mit zunehmender Anzahl immer unübersichtlicher.
Viele greifen zur direktesten Methode: Nach Namen sortieren, Dateien mit 101 am Anfang in den 101-Ordner ziehen, Dateien mit 102 am Anfang in den 102-Ordner. Das Problem dabei ist, dass diese Methode auf manueller Beurteilung beruht. Bei einigen Dutzend Dateien mag das noch gehen, bei Hunderten wird es jedoch deutlich ineffizient. Erschwerend kommt hinzu, dass bei gemischten Dateitypen – beispielsweise gleichzeitig txt, docx, doc, xlsx, xls, pdf und Bilder – die manuelle Ablage noch fehleranfälliger wird.
Für solche Aufgaben mit „regelbasierten Dateinamen und sich wiederholenden Sortiervorgängen" kann Bürosoftware für die Stapelverarbeitung genutzt werden. Dieser Artikel erläutert anhand von Screenshots die Vorgehensweise mit HeSoft Doc Batch Tool : Über die Funktion „Dateien nach Dateiname klassifizieren", Auswahl der Klassifizierung per benutzerdefiniertem regulärem Ausdruck, Extrahieren der ersten drei Ziffern des Dateinamens und stapelweises Sortieren der Dateien in Ordner wie 101, 102, 103 usw.
Anwendungsszenarien: Projektnummer, Kundennummer, Chargennummer als Klassifizierungsbasis
Das Beispiel in diesem Artikel extrahiert die ersten drei Ziffern des Dateinamens, diese stehen aber nicht unbedingt nur für die Zahlen selbst. In der Praxis kann diese Nummer eine klare geschäftliche Bedeutung haben:
- Projektnummer: 101 steht für Projekt A, 102 für Projekt B, 103 für Projekt C.
- Kundennummer: Verträge, Anhänge, Angebote verschiedener Kunden werden nach Nummer archiviert.
- Abteilungsnummer: Von verschiedenen Abteilungen eingereichte Unterlagen werden nach Abteilungscode getrennt gespeichert.
- Chargennummer: Prüfberichte, Produktionsaufzeichnungen, Logistikdaten werden nach Charge sortiert.
- Regionscode: Datendateien verschiedener Regionen werden nach Regionscode gruppiert.
Solange die Klassifizierungsinformation stabil im Dateinamen enthalten ist, kann sie regelbasiert extrahiert werden. Im Vergleich zur manuellen Sortierung liegt der Vorteil von Platzhaltern oder regulären Ausdrücken in der Wiederverwendbarkeit: Ist die Regel einmal eingerichtet, kann sie für nachfolgende gleichartige Dateien direkt übernommen werden, ohne jedes Mal neu entscheiden zu müssen.
Ergebnisvorschau: Von ungeordneten Dateien zur nummernbasierten Archivierung
Vor der Verarbeitung: Unterschiedliche Dateinamen-Präfixe, aber alle zusammen abgelegt
Im Screenshot vor der Verarbeitung erscheint die Dateiliste bereits nach Namen sortiert, aber Dateien, die mit 101, 102, 103 beginnen, befinden sich noch im selben Verzeichnis. Die roten Pfeile markieren diese Nummern und zeigen, dass der Dateiname selbst bereits die Klassifizierungsbasis liefert.

Handelt es sich hier um ein Projektverzeichnis, könnten Dateien, die mit 101 beginnen, zu einem Projekt gehören, Dateien mit 102 zu einem anderen und Dateien mit 103 zu einem dritten Projekt. Die Vermischung erschwert die spätere Suche und ist auch für die projektbezogene Paketierung und Lieferung ungeeignet.
Nach der Verarbeitung: Jede Nummer entspricht einem Ordner
Der Screenshot nach der Verarbeitung zeigt, dass die Dateien in die drei Ordner 101, 102 und 103 einsortiert wurden. Dieses Ergebnis entspricht unserer Erwartung: Dateien, deren Dateinamenanfang mit derselben Nummer übereinstimmt, werden in denselben Klassifizierungsordner gelegt.

Nach einer solchen Sortierung ist die Verzeichnisstruktur besser für die Teamzusammenarbeit geeignet. Projektleiter können direkt den entsprechenden Projektordner einsehen, Kundendaten können nach Kundennummer ausgeliefert werden, und das Archivpersonal kann schnell prüfen, ob die Dateien unter jeder Nummer vollständig sind.
Vorgehensschritte: Nummer mit regulärem Ausdruck extrahieren und stapelweise klassifizieren
Schritt 1: Dateiverwaltungswerkzeug öffnen und Klassifizierung nach Dateiname wählen
Öffnen Sie HeSoft Doc Batch Tool und klicken Sie in der linken Funktionsnavigation auf „Dateien ordnen". Rechts werden mehrere Funktionen rund um die Dateiverwaltung angezeigt. Da die Archivierung diesmal nach der Projekt- oder Kundennummer im Dateinamen erfolgen soll, wählen Sie „Dateien nach Dateiname klassifizieren".

Beachten Sie, dass hier die Klassifizierung nach Dateiname gewählt wird, nicht nach Erweiterung. Die Klassifizierung nach Erweiterung eignet sich, um txt, docx, pdf usw. nach Typ zu trennen; die Klassifizierung nach Dateiname hingegen, um Geschäftsnummern wie 101, 102, 103 zu trennen. Beide lösen unterschiedliche Probleme. Machen Sie sich vor der Auswahl klar, nach welchem Kriterium Sie ordnen möchten.
Schritt 2: Zu verarbeitende Dateien importieren und Liste prüfen
Nach Aufruf der Funktion besteht der erste Schritt darin, die zu verarbeitenden Einträge auszuwählen. Sie können auf „Dateien hinzufügen" klicken, um einzelne Dateien hinzuzufügen, oder auf „Dateien aus Ordner importieren", um alle Dateien eines Verzeichnisses stapelweise zu importieren. Im Beispiel-Screenshot sind die Dateien bereits in die Liste importiert, und Name, Pfad, Erweiterung, Erstellungs- und Änderungsdatum sind übersichtlich dargestellt.

In der Tabelle sind Dateinamen wie 101LON05417.txt, 101LON09060.txt usw. zu sehen, der Pfad ist D:\test, die Erweiterung txt. Die Datensatzanzahl unten zeigt 20 an, was bedeutet, dass insgesamt 20 Dateieinträge auf die Verarbeitung warten. Der Zweck der Listenprüfung besteht darin, sicherzustellen, dass der Umfang der stapelweise zu verarbeitenden Dateien korrekt ist. Falls sich temporäre Dateien, irrelevante Dateien oder Dateien mit abweichender Namensgebung im Verzeichnis befinden, empfiehlt es sich, diese vorher auszuschließen, um das Klassifizierungsergebnis nicht zu beeinträchtigen.
Nachdem Sie die Dateiliste überprüft haben, klicken Sie auf „Weiter", um zu den Verarbeitungsoptionen zu gelangen.
Schritt 3: Klassifizierung nach benutzerdefiniertem regulärem Ausdruck wählen
Auf der Seite zur Einstellung der Verarbeitungsoptionen bietet die Oberfläche verschiedene Klassifizierungsmethoden. Für einfache Szenarien kann nach dem ersten Zeichen, der ersten Ziffer oder den ersten Zeichen klassifiziert werden; für flexiblere Büroregeln empfiehlt sich die Option „Nach benutzerdefiniertem regulärem Ausdruck klassifizieren". Im Screenshot ist diese Option bereits ausgewählt.

Die Regel in diesem Beispiel lautet, die ersten drei Ziffern des Dateinamens zu extrahieren. Geben Sie daher im Eingabefeld für den regulären Ausdruck ein: ^\d{3}. Dies lässt sich in drei Teile zerlegen: ^ steht für den Anfang des Dateinamens, \d für eine Ziffer, {3} für die Übereinstimmung mit drei Zeichen. Das Extraktionsergebnis sind schließlich 101, 102, 103.
Im Vergleich zu normalen Platzhaltern eignen sich reguläre Ausdrücke besser, um zu beschreiben, „wo begonnen wird, welche Zeichen genommen werden, wie viele Zeichen genommen werden". Wenn Sie vor komplexeren Dateinamenregeln stehen, beispielsweise zwei Anfangsbuchstaben plus drei Ziffern, können Sie den Ausdruck entsprechend anpassen, sobald Sie die Regel verstanden haben. In diesem Beispiel ist ^\d{3} jedoch bereits ausreichend präzise.
Weiter unten auf der Seite gibt es die Einstellung „Umwandlung Groß-/Kleinschreibung" mit den Optionen Standard, In Großbuchstaben umwandeln, In Kleinbuchstaben umwandeln. Da die Klassifizierungsbasis in diesem Beispiel Zahlen sind und keine Änderung der Groß-/Kleinschreibung betrifft, belassen Sie es bei der Standardeinstellung. Klicken Sie nach der Einrichtung auf „Weiter".
Schritt 4: Speicherort wählen und Verarbeitung starten
Dem Seitenablauf folgend muss anschließend der „Speicherort festlegen" und die „Verarbeitung starten" ausgeführt werden. Es wird empfohlen, als Speicherort ein neues Zielverzeichnis zu wählen, insbesondere bei der ersten Nutzung einer Regex-Regel, um den Abgleich zwischen Originaldateien und Verarbeitungsergebnis zu erleichtern. Überschreiben oder vermischen Sie keine wichtigen Verzeichnisse willkürlich, um die Überprüfung nicht zu erschweren.
Nach dem Start der Verarbeitung analysiert die Software die Dateiliste einzeln, extrahiert die übereinstimmenden Nummern und erstellt oder verwendet Klassifizierungsordner entsprechend der Nummern. Für die Beispieldateien werden Dateien, die mit 101 beginnen, in den Ordner 101 einsortiert, solche mit 102 in den Ordner 102 und solche mit 103 in den Ordner 103. Nach Abschluss der Verarbeitung können Sie die endgültige Ordnerstruktur im Ausgabeverzeichnis einsehen.
Häufige Fragen und Hinweise
1. Kann die Regex-Regel nur für txt-Dateien verwendet werden?
Nein. Die Beispieldateien sind txt, weil die Daten in den Screenshots so übersichtlicher darstellbar sind. Die Klassifizierung nach Dateiname liest nicht den Dateiinhalt. Daher können für Word-Dokumente (docx/doc), Excel-Tabellen (xlsx/xls), PDF-Dateien, Präsentationen (pptx/ppt) sowie Bilddateien ähnliche Regeln verwendet werden, solange der Name der Regel entspricht.
2. Was tun, wenn der Dateiname nicht mit drei Ziffern beginnt?
Der Ausdruck muss an die tatsächliche Namensgebung angepasst werden. Beginnt er beispielsweise mit einer vierstelligen Projektnummer, kann ^\d{4} verwendet werden; beginnt er mit zwei Buchstaben, könnte eine Regel zur Übereinstimmung mit Buchstaben in Betracht gezogen werden. Entscheidend ist, dass die Regel mit der Dateinamenstruktur übereinstimmt.
3. Warum könnten einige Dateien nicht im erwarteten Ordner landen?
Ein häufiger Grund ist, dass der Dateiname nicht dem Ausdruck entspricht. Beispielsweise wenn vor dem Dateinamen Leerzeichen, Unterstriche, chinesische Beschreibungen stehen oder die Nummer nicht am Anfang steht. Es wird empfohlen, vor der Anwendung die Dateiliste zu prüfen und die Namensstruktur zu bestätigen. Zeigt sich, dass die Regeln nicht einheitlich sind, können Sie zuerst die Dateinamen bereinigen und dann die Stapelklassifizierung durchführen.
4. Welche Vorbereitungen sollten vor der Stapelsortierung getroffen werden?
Es wird empfohlen, wichtige Dateien vorher zu sichern oder das Ausgabeziel auf ein neues Verzeichnis zu setzen; testen Sie zudem den regulären Ausdruck zuerst mit einer kleinen Auswahl an Beispieldateien; prüfen Sie abschließend, ob die Namen der Ergebnisordner der Erwartung entsprechen. So kann das Risiko von Fehlbedienungen durch die Stapelverarbeitung reduziert werden.
Fazit: Regelbasierte Dateien mit Bürosoftware in eine Standardverzeichnisstruktur ordnen
Das stapelweise Ordnen von Dateien nach Projekt- oder Kundennummer besteht im Kern darin, die Regelinformationen im Dateinamen in eine Ordnerstruktur umzuwandeln. HeSoft Doc Batch Tool ermöglicht durch die Funktion „Dateien nach Dateiname klassifizieren", dass solche wiederkehrenden Aufgaben mit einer einmaligen Einrichtung erledigt werden können. Nach dem Import der Dateien wählen Sie „Nach benutzerdefiniertem regulärem Ausdruck klassifizieren", geben ^\d{3} ein, legen den Speicherort fest und starten die Verarbeitung, um Dateien mit Nummern wie 101, 102, 103 automatisch in die entsprechenden Ordner zu archivieren.
Wenn Sie in Ihrer Arbeit häufig Projektunterlagen, Kundendateien, Chargenberichte oder systemgenerierte Exportdaten ordnen müssen, wird empfohlen, vorrangig diese Methode der Stapelverarbeitung zu nutzen. Sie spart nicht nur die Zeit für das manuelle Erstellen von Ordnern und Ziehen von Dateien, sondern sorgt auch für einheitlichere Archivierungsstandards, reduziert Fehlablagen und Auslassungen und lässt das Dateimanagement wirklich zur Steigerung der Büroeffizienz beitragen.