Viele Klassifizierungsinformationen von Bürodokumenten befinden sich nicht im Ordner, sondern sind im Dateinamen enthalten, etwa ein dreistelliger Städtecode nach der Seriennummer. Dieser Artikel erklärt am Beispiel der Zeichen an Position 4 bis 6, wie Sie mit HeSoft Doc Batch Tool mittlere Zeichen aus Dateinamen stapelweise extrahieren und automatisch Klassifizierungsordner wie LON, NYC, PAR, SYD, TYO erstellen, um Benutzern die schnelle Ablage von Dateien zu erleichtern.
In der Dateiverwaltung kommt es häufig vor, dass Dateinamen bereits Klassifizierungsinformationen enthalten, aber alle Dateien dennoch im selben Verzeichnis gestapelt sind. Zum Beispiel gehören „128LON75957.txt“, „284LON76499.txt“ zu LON, „307TYO91489.txt“, „615TYO56029.txt“ zu TYO und „378PAR56483.txt“ zu PAR. Der Klassifizierungscode befindet sich in der Mitte des Dateinamens und erscheint sehr regelmäßig, doch bei manueller Organisation muss man dennoch wiederholt die Dateinamen überprüfen und Dateien verschieben.
Dieser Artikel stellt eine Methode vor, die sich besser für die Massenverarbeitung im Büro eignet: Verwenden Sie HeSoft Doc Batch Tool , um nach Zeichen in einem festen Bereich im Dateinamen zu klassifizieren. Die Software kann die Zeichen an der 4. bis 6. Stelle des Dateinamens extrahieren, automatisch entsprechende Ordner erstellen und dann Dateien mit denselben Zeichen zusammenführen. Auf diese Weise können, egal ob TXT-Textdateien, Word-Dokumente (DOCX/DOC), Excel-Tabellen (XLSX/XLS), PDFs oder Bilder, alle mit derselben Methode in einem Massenarchivierungsvorgang verarbeitet werden, solange die Benennungsregeln einheitlich sind.
Anwendungsszenario: Feste Klassifizierungsfelder in der Mitte des Dateinamens
Das Kernmerkmal dieser Art von Anforderung ist: Das Klassifizierungsfeld erscheint an einer festen Position im Dateinamen, nicht am Anfang oder Ende des Dateinamens. Die Dateinamenstruktur in den Screenshots lässt sich verallgemeinern als „dreistellige Nummer + dreibuchstabiger Code + fünfstellige Nummer + Erweiterung“. Der dreibuchstabige Code ist hierbei das Klassifizierungskriterium, wie z. B. LON, NYC, PAR, SYD, TYO.
Wenn Ihre Dateien ähnlichen Regeln folgen, eignen sie sich hervorragend für die Klassifizierung nach einem benutzerdefinierten Positionsbereich. Beispielsweise geben die Zeichen 6 bis 8 im Vertragsdateinamen die Region an, das 4. bis 5. Zeichen im Scan-Namen die Abteilung, das 10. bis 12. Zeichen im Bildmaterialnamen das Projekt und einige Zeichen im Logdateinamen die Gerätenummer. Solange diese Zeichenpositionen stabil bleiben, müssen Sie nicht einzeln filtern, sondern können die Software die Massenverarbeitung direkt durchführen lassen.
Im Vergleich zur Klassifizierung nach Erweiterung ist die Klassifizierung nach Zeichen in der Mitte des Dateinamens feingranularer. Die Erweiterung unterscheidet nur Dateitypen wie TXT, DOCX, PDF, JPG, während der Code im Dateinamen normalerweise geschäftliche Bedeutung hat und sich daher besser für Projekt-, Regional-, Kunden- und Chargen-Datenarchivierung eignet.
Ergebnisvorschau: Vor der Verarbeitung in Dateinamen versteckte Klassifizierungsinformationen
In der Dateiliste vor der Verarbeitung befinden sich alle TXT-Dateien im selben Verzeichnis. Die rot markierten Stellen zeigen den dreibuchstabigen Code im Dateinamen – das Klassifizierungsfeld, das wir extrahieren möchten. Obwohl die Namen auf unterschiedliche Kategorien hinweisen, existieren im Dateisystem noch keine entsprechenden Klassifizierungsordner.

In diesem Zustand kann der Benutzer Dateien einer Kategorie normalerweise nur durch Stichwortsuche oder manuelles Sortieren finden. Bei wenigen Dateien ist das Problem nicht offensichtlich, aber sobald die Dateien kontinuierlich zunehmen, wird das Verzeichnis immer unübersichtlicher. Besonders in kollaborativen Szenarien, wenn jeder anders organisiert, leiden spätere Suchvorgänge und Übergaben.
Ergebnisvorschau: Nach der Verarbeitung gleiche Dateien im gleichnamigen Ordner
Nach Abschluss der Massenverarbeitung erstellt die Software Ordner basierend auf den extrahierten Zeichen. Im Beispiel wurden schließlich die fünf Ordner LON, NYC, PAR, SYD, TYO generiert. Jeder Ordnername stammt von den Zeichen an Position 4 bis 6 des Dateinamens, Dateien mit gleichem Code werden in denselben Ordner sortiert.

Dieses Ergebnis ist ideal für die nachfolgende Verwaltung. Müssen z. B. LON-bezogene Dateien an den zuständigen Ansprechpartner gesendet werden, genügt es, den LON-Ordner zu komprimieren; soll die Anzahl SYD-bezogener Dateien ermittelt werden, kann der SYD-Ordner direkt eingesehen werden. Mit einer klaren Klassifizierungsstruktur werden Dateisuche, -verpackung, -sicherung und -freigabe effizienter.
Arbeitsschritte: Massenextraktion von Zeichen in der Mitte des Dateinamens zur Klassifizierung
Schritt 1: Dateiorganisationsmodul öffnen
Wählen Sie nach dem Start von HeSoft Doc Batch Tool links zunächst „Dateien organisieren“. Die Software ist auf die Massenverarbeitung von Bürodateien ausgelegt und eignet sich für sich wiederholende Aufgaben wie Dateiumbenennung, Dateiorganisation und Dokumentenverarbeitung. Dieses Mal geht es darum, viele Dateien nach Dateiname zu klassifizieren. Navigieren Sie daher zu „Dateien organisieren“ und wählen Sie die Funktionskarte „Dateien nach Dateiname klassifizieren“.

Die Wahl der richtigen Funktion ist sehr wichtig. „Dateien nach Dateiname klassifizieren“ konzentriert sich auf den Zeicheninhalt des Dateinamens, nicht auf die Dateierweiterung oder den Dateiinhalt selbst. Für Fälle wie diesen, mit Stadt-, Abteilungs- oder Projektcodes in der Mitte des Dateinamens, sollte diese Funktion verwendet werden.
Schritt 2: Zu organisierende Dateien importieren
Nach Aufruf der Aufgabe fordert die Software zunächst zur Auswahl der zu verarbeitenden Datensätze auf. Oben im Interface sind Schaltflächen wie „Dateien hinzufügen“, „Dateien aus Ordner importieren“, „Leeren“ zu sehen. Befinden sich alle zu organisierenden Dateien bereits in einem Ordner, empfiehlt es sich, auf „Dateien aus Ordner importieren“ zu klicken, um alle Dateien des Verzeichnisses auf einmal zu laden; sollen nur bestimmte Dateien verarbeitet werden, kann „Dateien hinzufügen“ genutzt werden.

Nach dem Import listet die Tabelle Dateiname, Speicherpfad, Erweiterung, Erstellungs- und Änderungsdatum auf. Im Screenshot ist der Dateipfad D:\test\ zu sehen, die Datensatzanzahl beträgt 20. Es empfiehlt sich nun, die Liste zu überprüfen und sicherzustellen, dass alle Dateinamen die gleiche Struktur aufweisen. Sollten bestimmte Dateien nicht Gegenstand dieser Organisation sein, können sie vor Beginn der Verarbeitung entfernt werden, um die Erstellung unerwünschter Klassifizierungsordner zu vermeiden.
Schritt 3: „Nach Zeichen im benutzerdefinierten Positionsbereich klassifizieren“ wählen
Klicken Sie auf „Weiter“, um die Verarbeitungsoptionen einzustellen. Der Bereich „Klassifizierungsart“ bietet mehrere Regeln, darunter Klassifizierung nach dem ersten Zeichen, der ersten Ziffer, dem ersten englischen Buchstaben, den letzten Zeichen, den ersten Zeichen, benutzerdefiniertem regulärem Ausdruck usw. Der Klassifizierungscode in diesem Beispiel befindet sich in der Mitte des Dateinamens, daher muss „Nach Zeichen im benutzerdefinierten Positionsbereich klassifizieren“ gewählt werden.

Nach der Auswahl geben Sie im Feld „Bereich“ „4:6“ ein. Diese Einstellung weist die Software an: Ab dem 4. Zeichen des Dateinamens bis einschließlich zum 6. Zeichen wird der Inhalt als Ordnername verwendet. Am Beispiel „200LON66460.txt“ ergibt Position 4 bis 6 „LON“, die Datei gelangt also in den LON-Ordner; bei „943PAR93548.txt“ ist es „PAR“, die Datei kommt in den PAR-Ordner.
Liegt Ihr Klassifizierungsfeld nicht an Position 4 bis 6, passen Sie den Bereich entsprechend an. Liegt das Feld z. B. an Position 2 bis 4, geben Sie „2:4“ ein; an Position 8 bis 10 geben Sie „8:10“ ein. Übernehmen Sie nicht mechanisch die Zahlen aus dem Beispiel – entscheidend ist, zunächst die Position des Klassifizierungsfelds im Dateinamen zu kennen.
Schritt 4: Groß-/Kleinschreibung beibehalten und fortfahren
Im Screenshot ist bei „Konvertierung Groß-/Kleinschreibung“ die Option „Standard“ gewählt. Wenn die Codes im Dateinamen bereits einheitlich großgeschrieben sind, kann die Standardeinstellung beibehalten werden. Die generierten Ordner behalten dann die ursprüngliche Code-Form, z. B. LON, NYC, PAR. Bei gemischter Groß-/Kleinschreibung im tatsächlichen Dateinamen kann der Benutzer je nach Organisationsstandard entscheiden, ob eine Konvertierung nötig ist – in diesem Beispiel ist keine zusätzliche Anpassung erforderlich.
Klicken Sie nach Abschluss der Einstellungen für Klassifizierungsart und Bereich unten auf „Weiter“. Der Software-Workflow zeigt als Nächstes „Speicherort festlegen“ und „Verarbeitung starten“. Es wird empfohlen, das Ausgabeverzeichnis auf einen neuen Ordner festzulegen, um das Endergebnis leichter überprüfen und die ursprüngliche Dateiverzeichnisstruktur schützen zu können.
Schritt 5: Speicherort festlegen und Massenverarbeitung ausführen
Wählen Sie im Schritt zum Speicherort das Zielverzeichnis für die Verarbeitungsergebnisse aus. Starten Sie nach Bestätigung die Verarbeitung. Die Software liest die Dateiliste einzeln durch, bestimmt die Klassifizierung anhand des 4. bis 6. Zeichens des Dateinamens und erstellt automatisch die entsprechenden Ordner. Schließlich landen Dateien mit gleichem Code im selben Ordner und bilden eine übersichtliche Archivstruktur.
Der gesamte Vorgang erfordert kein manuelles Anlegen der Ordner LON, NYC, PAR, SYD, TYO und auch kein einzelnes Ziehen von Dateien. Für ein Testverzeichnis mit 20 Datensätzen erfolgt dies nahezu augenblicklich; bei mehr Dateien wird der Effizienzvorteil der Massenverarbeitung noch deutlicher.
Häufige Fragen oder Hinweise
1. Beinhaltet das Klassifizierungsfeld die Erweiterung?
Bei der Bereichsfestlegung konzentriert man sich normalerweise auf die Zeichen des Hauptdateinamens. Das „4:6“ im Beispiel extrahiert die Zeichen LON, TYO usw. des Dateinamens vor der Erweiterung, nicht die Erweiterung TXT selbst. Legen Sie den Bereich anhand des Hauptdateinamens fest und vermeiden Sie es, den Punkt oder die Erweiterung in das Klassifizierungsfeld einzubeziehen.
2. Was tun, wenn der Dateiname chinesische Zeichen enthält?
Befinden sich chinesische Zeichen ebenfalls an festen Positionen, können sie theoretisch ebenso als Klassifizierungskriterium dienen. Enthält der Dateiname z. B. an Position 4 bis 5 „财务“ oder „人事“, kann nach diesem Bereich klassifiziert werden. Zu beachten ist jedoch, dass die Namenslänge und Zeichenposition verschiedener Dateien einheitlich sein müssen, da das Klassifizierungsergebnis sonst ungenau sein kann.
3. Können Dateien mit unterschiedlichen Erweiterungen gleichzeitig organisiert werden?
Aus logischer Sicht importiert die Software Dateidatensätze, die Erweiterung wird in der Tabelle angezeigt. Solange die Dateinamenregeln für Dateien unterschiedlicher Erweiterungen einheitlich sind, können sie auch anhand derselben Zeichenposition klassifiziert werden. Enthalten z. B. dieselben Projektdaten sowohl DOCX-, XLSX- als auch PDF-Dateien und die Zeichen 4 bis 6 sind stets der Projektcode, kann nach dem Projektcode archiviert werden.
4. Sollte vor der Verarbeitung eine Sicherung erstellt werden?
Bei wichtigen Daten wird empfohlen, zuerst eine Sicherung zu erstellen oder das Ergebnis in ein neues Verzeichnis auszugeben. Der Vorteil der Massenverarbeitung ist die Geschwindigkeit, aber das bedeutet auch, dass eine fehlerhafte Regel schnell viele Dateien beeinträchtigt. Die stabilere Vorgehensweise ist, zunächst mit einer kleinen Stichprobe zu testen, ob „4:6“ korrekt ist.
Fazit: Manuelle Beurteilung durch Regeln ersetzen, um die Dateiorganisation stabiler zu machen
Wenn Dateinamen mittig einen festen Klassifizierungscode enthalten, ist die effektivste Organisationsmethode nicht das manuelle Verschieben einzelner Dateien, sondern die Umwandlung der Code-Position in eine Massenverarbeitungsregel. HeSoft Doc Batch Tool kann über die Funktion „Dateien nach Dateiname klassifizieren“ Zeichen anhand eines benutzerdefinierten Bereichs extrahieren und automatisch Klassifizierungsordner erstellen und Dateien archivieren.
Wenn sich die Klassifizierungsinformationen Ihrer Bürodateien – wie im Beispiel – an Position 4 bis 6 des Dateinamens befinden, können Sie die hier beschriebene Einstellung „4:6“ direkt übernehmen. Für viele TXT-, DOC-, DOCX-, XLS-, XLSX-, PDF- und andere Dateien kann diese Methode die sich wiederholende Arbeit erheblich reduzieren, die Fehlklassifizierungsrate senken und die Dateiverwaltung von einem chaotischen Verzeichnis in eine klare Struktur verwandeln.