Wenn Dateinamen große Mengen an Nummern, Kundencodes, Regionalcodes oder Projektkürzeln enthalten, ist das manuelle Erstellen von Ordnern und das anschließende Verschieben der Dateien sehr zeitaufwendig. Dieser Artikel zeigt am Beispiel der Dateinamen-Anfänge 101, 102, 103, wie Sie die Funktion "Dateien nach Dateinamen sortieren" in HeSoft Doc Batch Tool nutzen. Mit dem benutzerdefinierten regulären Ausdruck ^\d{3} extrahieren Sie die ersten drei Ziffern des Dateinamens und erstellen stapelweise entsprechende Sortierordner, um gleichartige Dateien zusammenzuführen.
Im Büroalltag sind viele Dateien nicht völlig unstrukturiert abgelegt, sondern ihre Dateinamen enthalten bereits Informationen, die zur Kategorisierung genutzt werden können. Bei Dateien wie 101LON05417.txt, 102NYC53821.txt, 103PAR08578.txt können die Ziffern 101, 102, 103 am Anfang für Abteilungen, Kunden, Chargen, Städte, Projekte oder Auftragstypen stehen. Das Problem: Wenn die Anzahl der Dateien von einigen Dutzend auf Hunderte oder Tausende ansteigt, ist das manuelle Prüfen von Dateinamen, Erstellen von Ordnern und Verschieben per Drag-and-drop nicht nur ineffizient, sondern auch fehleranfällig.
Dieser Artikel befasst sich mit diesem typischen Problem der stapelweisen Klassifizierung von Dateien nach Dateinamen. Wir verwenden die Dateiorganisationsfunktion der Bürosoftware „ HeSoft Doc Batch Tool “, um mit einem benutzerdefinierten regulären Ausdruck die ersten drei Ziffern des Dateinamens zu extrahieren und die Software dann automatisch die Dateien in die entsprechenden Ordner einsortieren zu lassen. Im Beispiel werden Dateien, deren Name mit 101 beginnt, in den Ordner 101 verschoben, mit 102 beginnende in den Ordner 102 und mit 103 beginnende in den Ordner 103. Dieser Ansatz eignet sich nicht nur für TXT-Textdateien, sondern auch für Word-Dokumente (doc, docx), Excel-Tabellen (xls, xlsx), PDFs, Bilder, komprimierte Archive und andere gängige Bürodateien, solange eine stabile Klassifizierungsregel im Dateinamen vorhanden ist.
Anwendungsszenarien: Welche Dateien eignen sich für die stapelweise Klassifizierung nach Dateinamen mit regulären Ausdrücken
Die „Klassifizierung nach Dateinamen“ eignet sich für die Verarbeitung von Materialien, deren Dateinamen festen Mustern folgen. Zum Beispiel, wenn der Dateiname mit einer Kundennummer beginnt, gefolgt von Geschäftstyp und laufender Nummer; wenn die ersten Stellen eine Projektnummer sind, gefolgt von Stadtkürzel oder Datum; wenn das Dateiname-Ende Versionsnummern, Monate oder Jahre enthält; oder wenn sich in der Mitte des Dateinamens ein Abteilungscode an fester Position befindet. Solange diese Informationen durch Platzhalter oder reguläre Ausdrücke erfasst werden können, können sie als Grundlage für die Klassifizierung dienen.
Nehmen wir die TXT-Dateien im Screenshot dieses Artikels als Beispiel, so ist die Struktur des Dateinamens ungefähr wie folgt: drei Ziffern am Anfang + Buchstabencode + numerische ID + Erweiterung. Die benötigte Klassifizierungsgrundlage sind genau die ersten drei Ziffern des Dateinamens, daher kann der reguläre Ausdruck ^\d{3} verwendet werden. „^“ bedeutet, dass die Übereinstimmung am Anfang des Dateinamens beginnen muss, „\d“ steht für eine Ziffer und „{3}“ für drei aufeinanderfolgende Ziffern. Das bedeutet, die Software extrahiert die ersten 3 Ziffern jedes Dateinamens als Namen für den Klassifizierungsordner.
Diese Methode eignet sich besonders für folgende Büroszenarien: Archivierung von Finanzbelegen nach Lieferantencode, Archivierung von Prüfberichten nach Gerätenummer, Archivierung von Geschäftsanhängen nach Kundennummer, Archivierung von Projektdaten nach Projektcode, Archivierung von Fotos oder Scans nach Chargennummer, Archivierung von Logdateien nach Server- oder Modulcode. Im Vergleich zur manuellen Sortierung reduziert die Stapelverarbeitung sich wiederholende Arbeiten, macht die Ordnerstruktur übersichtlicher und erleichtert das spätere Suchen, Sichern und Übergeben.
Ergebnisvorschau: Vor der Verarbeitung liegen die Dateien gemischt in einem Verzeichnis
Vor der Verarbeitung befinden sich alle Dateien im selben Ordner. Obwohl am Anfang der Dateinamen bereits die drei Gruppen 101, 102 und 103 zu erkennen sind, sind sie dennoch alle vermischt. Bei vielen Dateien muss man sich zum Auffinden aller Materialien einer bestimmten Nummer auf Sortierung, Suche oder manuelles Aussortieren verlassen.

Im Screenshot vor der Verarbeitung sind die ersten drei Ziffern links neben dem Dateinamen markiert. Beispielsweise gehören 101LON05417.txt und 101SYD26137.txt zu 101; 102LON48897.txt und 102NYC53821.txt zu 102; 103LON23328.txt und 103PAR08578.txt zu 103. Das Muster ist natürlich auch manuell erkennbar, aber das Problem ist, dass der manuelle Aufwand bei steigender Anzahl rapide zunimmt. Der Nutzen der Stapelverarbeitung mit der Software liegt genau darin: Die Software führt wiederholte Aktionen nach Regeln aus, der Benutzer muss die Klassifizierungsregel nur einmal festlegen.
Ergebnisvorschau: Nach der Verarbeitung werden automatisch die Ordner 101, 102, 103 generiert
Nach Abschluss der Verarbeitung werden die ursprünglich gemischten Dateien gemäß den ersten drei Ziffern des Dateinamens in die entsprechenden Ordner einsortiert. Im Beispielergebnis ist zu sehen, dass die Software drei Ordner erstellt hat: 101, 102, 103, die die drei aus den Dateinamen extrahierten Klassifizierungswerte darstellen.

Dieses Ergebnis ist sehr intuitiv: Um die Dateien für 101 anzusehen, muss man nur den Ordner 101 betreten; für 102 oder 103 kann man ebenfalls direkt in das entsprechende Verzeichnis wechseln. Für langfristig zu pflegende Materialsammlungen ist eine solche Verzeichnisstruktur einfacher zu verwalten als ein großer Ordner mit einer Vielzahl von Dateien.
Schritte: Dateien mit HeSoft Doc Batch Tool nach regulärem Ausdruck klassifizieren
Schritt 1: „Dateien organisieren“ aufrufen und „Dateien nach Dateinamen klassifizieren“ wählen
Wählen Sie nach dem Öffnen von HeSoft Doc Batch Tool in der linken Funktionsleiste Dateien organisieren. Auf der Seite „Dateien organisieren“ sehen Sie mehrere Tools zur Dateiablage, wie z. B. Klassifizierung nach Dateiname, Klassifizierung nach Erweiterung, stapelweises Erstellen neuer Ordner basierend auf vorhandenen Ordnern usw. In diesem Artikel verwenden wir die erste Funktion: Dateien nach Dateinamen klassifizieren.

Dieser Schritt dient dazu, der Software mitzuteilen, dass wir nicht umbenennen oder das Format konvertieren, sondern eine Klassifizierungsbeziehung basierend auf einem bestimmten Teil des Dateinamens herstellen möchten. Nach der Auswahl dieser Funktion wechselt die Software in einen schrittweisen Verarbeitungsablauf, in dem nacheinander der Dateiimport, die Einstellung der Klassifizierungsregeln, die Einstellung des Speicherorts und der Start der Verarbeitung erfolgen.
Schritt 2: Zu klassifizierende Dateien hinzufügen oder aus einem Ordner importieren
Nach dem Aufruf der Funktion „Dateien nach Dateinamen klassifizieren“ sehen Sie oben Schaltflächen wie Dateien hinzufügen, Aus Ordner importieren, Leeren, Mehr. Wenn die Dateien verstreut sind, verwenden Sie „Dateien hinzufügen“; wenn sie bereits in einem bestimmten Verzeichnis zentralisiert sind, ist „Aus Ordner importieren“ besser geeignet.

Nach dem Import zeigt die Software eine Liste der zu verarbeitenden Dateien mit deren Nummer, Name, Pfad, Erweiterung, Erstellungs- und Änderungsdatum an. Im Screenshot ist zu sehen, dass sich die Dateien im Verzeichnis D:\test befinden, die Erweiterung txt ist und der Datensatz 20 beträgt. In diesem Schritt kann der Benutzer überprüfen, ob die importierten Dateien korrekt sind, um versehentlich nicht zu verarbeitende Dateien in den Stapelauftrag aufzunehmen. Sollte eine Datei nicht verarbeitet werden, kann sie über die Aktionsspalte entfernt werden; bei einem falschen Import kann über „Leeren“ oben eine erneute Auswahl getroffen werden.
Das erwartete Ergebnis dieses Schritts: Alle zu klassifizierenden Dateien erscheinen in der Liste und das Namensschema entspricht dem Klassifizierungsziel. Da in diesem Artikel nach den ersten drei Ziffern klassifiziert werden soll, sollten die importierten Dateinamen mit dreistelligen Ziffern wie 101, 102, 103 beginnen.
Schritt 3: In den Verarbeitungsoptionen „Nach benutzerdefiniertem regulärem Ausdruck klassifizieren“ wählen
Klicken Sie nach der Überprüfung der Dateiliste unten auf Weiter, um die „Verarbeitungsoptionen einstellen“ aufzurufen. Dies ist der entscheidende Punkt für die Stapelklassifizierung. Die Oberfläche bietet verschiedene Klassifizierungsmethoden: nach erstem Zeichen, nach erster Ziffer, nach erstem Buchstaben, nach den letzten Zeichen, nach den ersten Zeichen, nach Zeichen in einer benutzerdefinierten Position sowie nach benutzerdefiniertem regulärem Ausdruck.

In unserem Beispiel wählen wir Nach benutzerdefiniertem regulärem Ausdruck klassifizieren und geben im Eingabefeld für reguläre Ausdrücke Folgendes ein:
^\d{3}
Dieser Ausdruck bedeutet: Beginne am Anfang des Dateinamens und finde 3 aufeinanderfolgende Ziffern. Für 101LON05417.txt lautet das Ergebnis 101; für 102NYC53821.txt lautet es 102; für 103LON23328.txt lautet es 103. Die Software verwendet den gefundenen Inhalt als Klassifizierungsordnernamen und archiviert so die Dateien stapelweise nach ihrem Dateinamen-Präfix.
Weiter unten bietet die Oberfläche Optionen zur Groß-/Kleinschreibung von Buchstaben: Standard, In Großbuchstaben umwandeln, In Kleinbuchstaben umwandeln. Da unsere Klassifizierung auf Ziffern basiert, können wir die Standardeinstellung beibehalten. Wenn Ihre Klassifizierungsgrundlage Buchstaben sind, der Dateiname also in verschiedenen Schreibweisen wie abc, ABC, Abc vorkommt, können Sie je nach Bedarf die Groß-/Kleinschreibung vereinheitlichen, um doppelte Klassifizierungsordner zu vermeiden.
Schritt 4: Speicherort festlegen und Verarbeitung starten
Nach der Einstellung des regulären Ausdrucks klicken Sie erneut auf Weiter, um zum Schritt „Speicherort festlegen“ zu gelangen. Hier legen Sie fest, wohin die klassifizierten Dateien gespeichert werden. Es wird empfohlen, ein leicht erkennbares neues Verzeichnis zu wählen, um die Ergebnisse nach der Verarbeitung leichter prüfen zu können. Bei wichtigen Daten kann auch zuerst ein Testlauf in einem Testverzeichnis durchgeführt werden, um die Regeln zu überprüfen, bevor die eigentlichen Dateien verarbeitet werden.
Nachdem der Speicherort festgelegt wurde, gelangen Sie zum Schritt „Verarbeitung starten“. Nun erstellt die Software automatisch die entsprechenden Klassifizierungsordner basierend auf der zuvor importierten Dateiliste und den Regeln des regulären Ausdrucks und legt die Dateien mit übereinstimmendem Klassifizierungswert zusammen ab. Nach Abschluss der Verarbeitung sehen Sie eine Ordnerstruktur mit Ordnern wie 101, 102, 103.
Das erwartete Ergebnis dieses Schritts: Kein manuelles Anlegen von Ordnern und kein Verschieben einzelner Dateien – die Software erledigt die Stapelsortierung anhand der Übereinstimmungen im Dateinamen. Bei einer großen Anzahl von TXT-, docx-, xlsx-, PDF- und anderen Dateien reduziert dies den sich wiederholenden Arbeitsaufwand erheblich.
Erklärung des regulären Ausdrucks: Warum ^\d{3} verwenden
Viele Benutzer empfinden „reguläre Ausdrücke“ als kompliziert, tatsächlich genügen bei der Stapeldatei-Organisation oft einige wenige gängige Schreibweisen. Das hier verwendete ^\d{3} ist eine sehr typische Regel für die Übereinstimmung mit einem Dateinamenpräfix.
Dabei steht „^“ für den Beginn des Dateinamens. Ohne dieses Symbol könnte der Ausdruck an beliebiger Stelle im Dateinamen nach drei Ziffern suchen; mit dem „^“ wird nur der Anfang geprüft. So wird vermieden, eine spätere Nummerierung fälschlicherweise als Klassifizierungsbasis zu verwenden. „\d“ steht für eine beliebige Ziffer von 0 bis 9. „{3}“ bedeutet, dass das vorangehende Zeichen dreimal hintereinander vorkommt. Der gesamte Ausdruck lautet also: Finde drei Ziffern am Anfang des Dateinamens.
Sollten die ersten vier Stellen Ihres Dateinamens eine Jahreszahl oder Nummer sein, kann die Regel zu ^\d{4} geändert werden; für einen Ländercode an den ersten beiden Stellen zu ^\d{2}. Beginnt der Dateiname mit Buchstaben, z. B. ABC001.docx, könnte eine Regex-Schreibweise für den übereinstimmenden Anfangsbuchstaben erwogen werden. Welche Regel konkret anzuwenden ist, hängt von Ihrem Dateinamenschema ab.
Häufige Fragen und Hinweise
1. Können Dateien auch stapelweise klassifiziert werden, wenn der Dateiname keinem festen Muster folgt?
Wenn der Dateiname völlig unstrukturiert ist, kann kaum ein Stapel-Tool zuverlässig den richtigen Zielordner bestimmen. Beobachten Sie zuerst, ob stabile Informationen im Dateinamen vorhanden sind, wie eine Nummer am Anfang, ein Datum, ein Kundencode, eine Abteilungskürzel oder feste Trennzeichen. Sobald ein Muster gefunden ist, kann versucht werden, es mit einer vorhandenen Klassifizierungsmethode der Software oder mit einem benutzerdefinierten regulären Ausdruck zu extrahieren.
2. Können auch andere Dateien als TXT auf diese Weise organisiert werden?
Ja. Das Beispiel zeigt zwar TXT-Dateien, aber die Klassifizierung basiert auf dem Dateinamen, nicht auf dem Dateiinhalt. Daher können Word-Dokumente (doc, docx), Excel-Tabellen (xls, xlsx), PowerPoint-Dateien (ppt, pptx), PDFs, Bilder, Audio- und Videodateien auf ähnliche Weise stapelweise organisiert werden, sofern ihr Dateiname der Regel entspricht.
3. Was passiert, wenn der reguläre Ausdruck falsch ist?
Wenn der Ausdruck nicht das Gewünschte findet, kann das Klassifizierungsergebnis von den Erwartungen abweichen. Daher empfiehlt es sich, zuerst Tests mit wenigen Dateien durchzuführen. Importieren Sie z. B. 10 bis 20 Beispieldateien, und stellen Sie sicher, dass die Ordner 101, 102, 103 korrekt erstellt werden, bevor Sie größere Datenmengen verarbeiten. Bei wichtigen Dateien wird zudem eine Sicherung vor der Verarbeitung empfohlen.
4. Was ist zu beachten, wenn das Klassifizierungsmerkmal Groß- und Kleinbuchstaben enthält?
Enthält der Klassifizierungswert im Dateinamen Buchstaben, kann die Groß-/Kleinschreibung zu verschiedenen Ordnern führen. Beispielsweise könnten abc und ABC als unterschiedliche Kategorien behandelt werden. Die Verarbeitungsoptionen im Screenshot bieten eine Einstellung zur Umwandlung der Buchstabengröße. Der Benutzer kann die Standardeinstellung beibehalten oder eine Vereinheitlichung in Groß- oder Kleinbuchstaben wählen, um das Klassifizierungsergebnis zu standardisieren.
Zusammenfassung: Die Software nach Regeln Routineaufgaben erledigen lassen für effizientere Dateiablage
Der Kern der stapelweisen Dateiorganisation liegt nicht darin, dem Benutzer mehr Klicks abzuverlangen, sondern die sich wiederholenden, mechanischen und fehleranfälligen Aktionen an die Bürosoftware zu delegieren. Im Beispiel dieses Artikels hat HeSoft Doc Batch Tool durch die Funktion „Dateien nach Dateinamen klassifizieren“ in Verbindung mit dem benutzerdefinierten regulären Ausdruck ^\d{3} die Werte 101, 102, 103 aus dem Dateinamenanfang extrahiert und automatisch entsprechende Ordner zur Archivierung erstellt.
Sollten auch Ihre Dateinamen Kunden-, Projekt- oder Abteilungsnummern, Daten oder Chargenbezeichnungen enthalten, empfiehlt es sich, zuerst das stabilste Namensmuster zu identifizieren und dann die Stapelklassifizierungsfunktion zur Organisation zu nutzen. Für Benutzer, die häufig Bürodateien wie TXT, docx, xlsx und PDF bearbeiten, kann diese Methode die Zeit für manuelles Filtern und Drag-and-drop deutlich reduzieren, die Materialverwaltung standardisieren und das spätere Auffinden von Dateien erleichtern.