Wenn ein Ordner eine große Anzahl von Dateien enthält, die mit Nummern beginnen, ist es sehr zeitaufwändig und fehleranfällig, manuell neue Ordner zu erstellen und jede Datei einzeln per Drag & Drop zuzuordnen. Dieser Artikel erläutert am Beispiel von Dateinamen, die mit 101, 102, 103 beginnen, wie Sie mit HeSoft Doc Batch Tool über die Klassifizierungsfunktion nach Dateinamen und reguläre Ausdrücke eine große Anzahl von txt-, doc-, docx-, pdf- und anderen Dateien automatisch nach Dateinamenpräfix in die entsprechenden Ordner sortieren können.
Im Büroalltag sind viele Dateien nicht völlig unstrukturiert. Beispielsweise tragen Verkaufsaufträge, Prüfberichte, Protokolldateien, Kundendaten oder Projektdokumente häufig eine Nummer am Anfang des Dateinamens: 101LON05417.txt, 101SYD26137.txt, 102NYC53821.txt, 103PAR08578.txt ... Diese Nummern können für Abteilungen, Projekte, Kunden, Regionen oder Chargen stehen. Wenn es nur wenige Dateien sind, mag es noch akzeptabel sein, die Ordner 101, 102, 103 manuell zu erstellen und die Dateien hineinzuziehen; enthält ein Verzeichnis jedoch Hunderte oder Tausende von txt-, Word-Dokumenten (docx/doc), Excel-Tabellen (xlsx/xls) oder PDF-Dateien, ist die manuelle Sortierung nicht nur langsam, sondern auch anfällig für Auslassungen und Fehlzuordnungen.
Das Problem, das dieser Artikel lösen soll, ist klar definiert: Nutzung der Stapelverarbeitungsfunktionen von Office-Software, um über Platzhalterkonzepte und Regeln für reguläre Ausdrücke viele Dateien anhand fester Präfixe im Dateinamen stapelweise zu klassifizieren und automatisch zusammenzuführen. Im Beispiel sollen Dateien, deren erste drei Ziffern gleich sind, in einen gleichnamigen Ordner einsortiert werden – etwa Dateien, die mit 101 beginnen, in den Ordner 101, mit 102 beginnende in den Ordner 102 und mit 103 beginnende in den Ordner 103.
Die Software im Screenshot ist HeSoft Doc Batch Tool . Sie ist für büroorientierte Stapelverarbeitungsaufgaben positioniert und eignet sich für die Bearbeitung stark repetitiver Dateiordnungsaufgaben mit klaren Regeln. Im Folgenden wird anhand von Vorher-Nachher-Screenshots und der Bedienoberfläche Schritt für Schritt erklärt, wie das gelingt.
Anwendungsszenarien: Welche Dateien eignen sich für die stapelweise Klassifizierung nach Dateinamen per Regex?
Der Schlüssel zur Klassifizierung nach Dateiname liegt darin, dass der Dateiname extrahierbare Klassifizierungsinformationen enthalten muss. Häufige Fälle sind:
- Die ersten Stellen des Dateinamens sind eine Projektnummer, z. B. 101, 102, 103, A01, B02.
- Der Dateiname enthält einen Kundencode, z. B. KundeA_Vertrag.docx, KundeB_Angebot.xlsx.
- Der Dateiname enthält einen Regions- oder Filialcode, z. B. SH_Tagesbericht.pdf, BJ_Tagesbericht.pdf.
- Der Dateiname enthält Chargennummer, Datum, Abteilungsabkürzung, z. B. 202606_Statistik.xlsx, HR_Einstellungsunterlagen.doc.
- Viele txt-Protokolle, Scans und Berichtsdateien müssen nach Nummern-Präfix archiviert werden.
Wenn Ihre Dateinamen bereits eine einheitliche Struktur wie „101LON05417.txt“ aufweisen, eignen sie sich hervorragend dazu, die ersten drei Ziffern mit einem regulären Ausdruck zu extrahieren. So muss nicht jede Datei einzeln beurteilt werden – die Software erstellt oder verwendet automatisch den entsprechenden Klassifizierungsordner basierend auf dem Abgleich des Dateinamens.
Ergebnisvorschau: Vor der Verarbeitung liegen die Dateien gemischt, danach sind sie nach Nummern gruppiert
Vor der Verarbeitung: Dateien, die mit 101, 102, 103 beginnen, liegen im selben Verzeichnis
Im „Vorher“-Screenshot ist zu sehen, dass das aktuelle Verzeichnis txt-Dateien mit verschiedenen numerischen Präfixen enthält. Die ersten drei Zeichen der Dateinamen lauten 101, 102, 103, doch sie liegen alle gemischt in einem Ordner. Obwohl das Präfix, das im roten Rahmen markiert ist, mit bloßem Auge erkennbar ist, wird die manuelle Auswahl bei steigender Dateianzahl sehr ineffizient.

In diesem Beispiel ist die Klassifizierungsgrundlage des Dateinamens sehr eindeutig: Man nehme die ersten 3 Ziffern des Dateinamens. 101LON05417.txt, 101LON09060.txt, 101SYD26137.txt sollten in den Ordner 101; 102LON48897.txt, 102NYC53821.txt in den Ordner 102; 103LON23328.txt, 103PAR08578.txt in den Ordner 103.
Nach der Verarbeitung: Die Ordner 101, 102, 103 wurden automatisch generiert
Nach Abschluss der Verarbeitung sieht man, dass im Verzeichnis die drei Ordner 101, 102, 103 entsprechend den Nummern erstellt wurden. Dateien mit demselben Präfix wurden zentral in den entsprechenden Ordnern zusammengefasst. Die Dateistruktur ist übersichtlicher, was das spätere Suchen, Packen, Bereitstellen oder Archivieren erleichtert.

Der Effizienzvorteil dieser Organisationsmethode wird bei großen Dateimengen besonders deutlich. Vorgänge, die ursprünglich wiederholtes Suchen, Auswählen und Ziehen erforderten, können durch einmaliges Einrichten einer Regel erledigt werden. Dies ist besonders geeignet für Büroangestellte, die regelmäßig gleichartige Dateien bearbeiten.
Arbeitsschritte: Mit HeSoft Doc Batch Tool nach Dateinamen-Präfix klassifizieren
Schritt 1: Dateiordnung aufrufen und „Dateien nach Dateiname klassifizieren“ wählen
Nach dem Öffnen von HeSoft Doc Batch Tool wählen Sie in der linken Funktionsleiste „Dateiordnung“. In der rechten Werkzeugliste sehen Sie Funktionen wie „Dateien nach Dateiname klassifizieren“, „Dateien nach Erweiterung klassifizieren“ oder „Basierend auf vorhandenen Ordnern neue Ordner erstellen“. Da hier nach dem Nummernpräfix im Dateinamen klassifiziert werden soll, wählen Sie „Dateien nach Dateiname klassifizieren“.

Ziel dieses Schritts ist es, in das Funktionsmodul zu gelangen, das Dateien nach Regeln im Dateinamen ordnet. Es geht nicht um die einfache Unterscheidung nach Erweiterung wie txt, docx, pdf, sondern darum, Klassifizierungskriterien anhand eines bestimmten Inhalts im Dateinamen zu generieren. Für Szenarien, in denen das Dateinamenpräfix eine Geschäftsnummer darstellt, ist diese Funktion passender.
Schritt 2: Zu verarbeitende Dateien importieren und die Listeneinträge prüfen
Nach Aufruf von „Dateien nach Dateiname klassifizieren“ bietet der obere Bereich Schaltflächen wie „Dateien hinzufügen“ oder „Aus Ordner importieren“. Im Screenshot wurden bereits Dateien aus dem Verzeichnis D:\test importiert. Die Liste zeigt Informationen wie laufende Nummer, Name, Pfad, Erweiterung, Erstellungs- und Änderungsdatum und fasst unten die Datensatzanzahl zusammen.

In diesem Schritt empfiehlt es sich, drei Dinge besonders zu prüfen: Erstens, ob alle Dateien importiert wurden. Zweitens, ob die Dateinamen der erwarteten Regel entsprechen. Drittens, ob die Erweiterungen dem diesmal zu ordnenden Dateityp entsprechen. Im Beispiel ist die Erweiterung txt, aber derselbe Ansatz kann auch für Office-Dateien wie doc, docx, xls, xlsx, ppt, pptx, pdf verwendet werden, solange die Dateinamenregel einheitlich ist.
Sollten nicht benötigte Dateien in der Liste enthalten sein, können diese vorab im Quellordner sortiert und dann importiert werden, oder Sie entfernen die nicht benötigten Einträge über die von der Oberfläche bereitgestellten Löschvorgänge. Nach Bestätigung klicken Sie unten auf „Weiter“, um zur Einstellung der Verarbeitungsoptionen zu gelangen.
Schritt 3: „Nach benutzerdefiniertem regulären Ausdruck klassifizieren“ wählen und Regel eingeben
Auf der Seite „Verarbeitungsoptionen festlegen“ sehen Sie verschiedene Klassifizierungsmethoden, z. B. nach erstem Zeichen, erster Ziffer, erstem englischen Buchstaben, letzten Zeichen, ersten Zeichen oder Zeichen in einem benutzerdefinierten Bereich – sowie „Nach benutzerdefiniertem regulären Ausdruck klassifizieren“. Um in diesem Beispiel präzise die ersten drei Ziffern des Dateinamens zu extrahieren, wählen Sie „Nach benutzerdefiniertem regulären Ausdruck klassifizieren“.

Geben Sie im Eingabefeld „Regulärer Ausdruck“ Folgendes ein: ^\d{3}. Die Bedeutung dieses Ausdrucks ist:
- ^ kennzeichnet den Abgleich ab dem Anfang des Dateinamens.
- \d steht für ein Ziffernzeichen.
- {3} bedeutet, dass 3 aufeinanderfolgende Ziffern abgeglichen werden.
Somit gleicht ^\d{3} aus 101LON05417.txt die 101 ab, aus 102NYC53821.txt die 102 und aus 103LON23328.txt die 103. Die Software verwendet den abgeglichenen Inhalt als Klassifizierungsnamen und legt Dateien mit demselben Abgleichergebnis im selben Ordner ab.
Wenn Ihr Dateinamenpräfix keine drei Ziffern hat, können Sie die Regel entsprechend anpassen. Z. B. für die ersten zwei Ziffern ^\d{2}, für eine vierstellige Projektnummer ^\d{4}. Beginnt der Name mit Buchstaben, können Sie eine Regel wie ^[A-Za-z]+ verwenden. Nach der Einstellung belassen Sie die Groß-/Kleinschreibungskonvertierung auf dem Standardwert und klicken auf „Weiter“.
Schritt 4: Speicherort festlegen und Verarbeitung starten
Gemäß dem Ablauf der Oberfläche ist der dritte Schritt „Speicherort festlegen“ und der vierte Schritt „Verarbeitung starten“. In diesem Schritt muss angegeben werden, wohin die verarbeiteten Dateien gespeichert werden. Es wird ein leeres Verzeichnis oder ein spezielles Ausgabeverzeichnis empfohlen, um die Ergebnisse leichter prüfen zu können und eine Vermischung mit den Originaldateien zu vermeiden.
Sobald der Speicherort bestätigt ist, beginnt die Verarbeitungsphase. Die Software gleicht jeden Dateinamen mit dem zuvor definierten regulären Ausdruck ab und sortiert Dateien mit demselben Ergebnis in die entsprechenden Ordner. Für dieses Beispiel entstehen letztlich die Ordner 101, 102, 103 usw., und die txt-Dateien mit demselben Dateinamenpräfix werden zentral im entsprechenden Verzeichnis abgelegt.
Häufige Fragen und Hinweise
1. Warum muss der reguläre Ausdruck auf den Anfang abgestimmt sein?
Weil sich das Klassifizierungsmerkmal im Beispiel am Anfang des Dateinamens befindet. Würde man nur \d{3} schreiben, könnte dies theoretisch auch eine dreistellige Zahl an anderer Stelle im Dateinamen erfassen. Mit ^ wird explizit gefordert, vom Dateinamenanfang zu extrahieren, was stabilere Ergebnisse liefert.
2. Was passiert, wenn Dateinamen uneinheitlich sind?
Wenn ein Teil der Dateinamen nicht mit drei Ziffern beginnt, werden diese möglicherweise nicht wie erwartet klassifiziert. Daher empfiehlt es sich, vor der Stapelverarbeitung die Dateiliste zu sichten und die Benennungsregel zu prüfen. Bei chaotisch benannten Dateien können diese entweder separat behandelt oder zunächst mit einer Funktion zur stapelweisen Dateinamensänderung vereinheitlicht werden.
3. Können auch Word-, Excel- und PDF-Dateien verarbeitet werden?
Ja. Das Beispiel hier verwendet txt-Dateien, aber die Klassifizierung basiert auf dem Dateinamen und nicht auf dem Dateiinhalt. Daher können, solange die Dateinamen der Regel entsprechen, Word-Dokumente (docx/doc), Excel-Tabellen (xlsx/xls), PowerPoint-Dateien (pptx/ppt), PDF-Dateien sowie Bilder und Textdateien mit ähnlichen Methoden geordnet werden.
4. Es wird empfohlen, zuerst mit wenigen Dateien zu testen
Reguläre Ausdrücke sind sehr flexibel, und es ist wichtig, dass die Regel korrekt geschrieben ist. Bei der ersten Verwendung empfiehlt es sich, zunächst eine kleine Auswahl an Beispieldateien zu importieren und das Ergebnis zu testen. Erst wenn die Ordnernamen und Klassifizierungsergebnisse den Erwartungen entsprechen, sollten alle Dateien verarbeitet werden.
Fazit: Wiederholtes Ziehen durch Regeln ersetzen und die Effizienz der Dateiordnung steigern
Der Kernvorteil der stapelweisen Klassifizierung nach Dateiname liegt darin, die repetitive manuelle Beurteilung und das Ziehen von Dateien der Office-Software zu überlassen. Für Unterlagen mit einem regelmäßigen Präfix im Dateinamen, wie die nummerierten Dateien 101, 102, 103, müssen Sie nur in HeSoft Doc Batch Tool die Dateien importieren, „Nach benutzerdefiniertem regulären Ausdruck klassifizieren“ wählen, ^\d{3} eingeben, den Speicherort festlegen und die Verarbeitung starten, um schnell die entsprechenden Ordner zu generieren und die Archivierung abzuschließen.
Wenn Sie oft mit großen Mengen an txt-, docx-, doc-, xlsx-, pdf-Dateien usw. konfrontiert sind, die Sie nach Projekt-, Kunden-, Abteilungs- oder Chargennummer sortieren müssen, empfiehlt es sich, vorrangig diese Methode der Stapelverarbeitung mit regulären Ausdrücken zu testen. Sie kann repetitive Arbeit reduzieren, die Fehleranfälligkeit durch manuelle Bearbeitung verringern und die Dateiarchivierung vom „Einzelverschieben“ zum „Einmal Einrichten, Stapelweise Erledigen“ transformieren.