Wenn die tatsächliche Nummerierung, Vertragsnummern, Studentennamen oder Projektnamen einer Charge von Word-Dokumenten im Textkörper steht, die Dateinamen jedoch unübersichtlich sind, ist es sehr zeitaufwendig, sie einzeln zu öffnen, zu kopieren und umzubenennen. Dieser Artikel nimmt HeSoft Doc Batch Tool als Beispiel, um zu erklären, wie man bestimmten Text, z. B. eine Dokumenten-ID, aus dem Word-Textkörper extrahiert und docx- sowie doc-Dateien automatisch entsprechend umbenennt. Geeignet für die Archivierung, Ablage und standardisierte Benennung vor der Dokumentenübergabe.
Bei der Organisation von Word-Dokumenten kommt es häufig vor, dass der Dateiname ein temporärer Name, ein englischer Titel oder ein unsystematischer Name ist, die eigentlich passenden Informationen für den Dateinamen jedoch im Dokumententext stehen, wie z. B. Dokumentennummer, Vertragsnummer, Kundenname, Studentenname, Projektcode usw. Wenn man docx- oder doc-Dateien einzeln öffnet, den Text aus dem Inhalt kopiert und dann im Ordner manuell umbenennt, ist das nicht nur zeitaufwendig, sondern es passieren auch leicht Kopierfehler, Auslassungen oder uneinheitliche Benennungen.
Dieser Artikel stellt eine effizientere Methode vor: die Funktion „Word-Dateien mit Dateiinhalt umbenennen“ in der Bürosoftware „ HeSoft Doc Batch Tool “, um bestimmte Texte aus Word-Dateien stapelweise auszulesen und diese Texte automatisch als neue Dateinamen zu verwenden. Im Folgenden wird anhand des Ablaufs in den Screenshots die vollständige Vorgehensweise von der Vorbereitung der Dateien über das Festlegen der Extraktionsregeln bis zur stapelweisen Umbenennung beschrieben.
Anwendungsszenarien: Welche Word-Dateien eignen sich zur automatischen Umbenennung mit dem Textinhalt
„Word-Datei mit Textinhalt automatisch umbenennen“ eignet sich für Dokumente, in denen Informationen in einem festen Format im Text vorhanden sind. Solange in jeder Datei ein identifizierbarer Text vorhanden ist, kann dieser per Regel extrahiert und als Dateiname verwendet werden.
- Benennung mit Dokumentennummer: Der Text enthält Document ID, Archivnummer, Berichtsnummer, Antragsnummer usw., die als Dateiname verwendet werden sollen.
- Ablage von Verträgen oder Bestellungen: Word-Verträge enthalten Vertragsnummern, Kundennamen, Bestellnummern und sollen einheitlich benannte Dateinamen erhalten.
- Organisation von Aus- und Weiterbildungsmaterialien: docx- oder doc-Dateien enthalten Studentennamen, Klassen, Themennamen und sollen zur leichteren Suche stapelweise umbenannt werden.
- Projektdokumentenbereitstellung: Der Dokumenteninhalt enthält bereits den Projektcode oder Titel, der Dateiname soll mit den Schlüsselinformationen des Texts übereinstimmen.
- Nachbereitung von stapelweise empfangenen Unterlagen: Nach Erhalt vieler Word-Dateien sind die ursprünglichen Dateinamen unklar, der Text enthält jedoch Standardfelder, die automatisch extrahiert und umbenannt werden können.
Bei dieser Art von repetitiver Dateiorganisation liegt der Kernwert von HeSoft Doc Batch Tool darin: Mehrere Word-Dateien auf einmal importieren, einheitliche Extraktionsregeln festlegen und die Umbenennung stapelweise abschließen, um die repetitive Arbeit des manuellen Öffnens, Kopierens, Einfügens und Umbenennens zu reduzieren.
Ergebnisvorschau: Dateinamenänderungen vor und nach der Bearbeitung
Vorher: Dateiname stimmt nicht mit den Schlüsselinformationen des Texts überein
Die ursprünglichen Word-Dateinamen im Beispielordner lauten:
- Cosmic_Distances.docx
- Galaxies_and_the_Milky_Way.docx
- Planets_and_Orbits.docx
- Stars_and_Life_Cycles.docx
- The_Expanding_Universe.docx
Obwohl diese Dateinamen das Thema grob ausdrücken, muss, wenn die tatsächliche Ablageanforderung eine Verwaltung nach Dokumentennummer verlangt, die Nummer aus dem Word-Text extrahiert werden. Der obere Teil der Word-Dokumente im Screenshot enthält ein Feld wie Document ID: 2JMM01GJ, das den später zu extrahierenden und als Dateinamen zu verwendenden Inhalt darstellt.


Nachher: Automatisch extrahierte Textnummer als Word-Dateiname
Nach der Verarbeitung mit der Funktion „Word-Dateien mit Dateiinhalt umbenennen“ lauten die Dateinamen wie die aus dem Text extrahierten Nummern, z. B.:
- 2JMM01GJ.docx
- 4HE73OR5.docx
- CK83CAEJ.docx
- KR8IHZD6.docx
- R6J2S6E6.docx
Es ist ersichtlich, dass die Dateinamen nach der Verarbeitung nicht mehr auf dem ursprünglichen Titel basieren, sondern automatisch die Document ID aus dem Word-Inhalt verwenden. Für Szenarien, die eine Suche, Ablage und Bereitstellung nach Nummer erfordern, ist diese Benennungsweise genauer und auch für die spätere Verwaltung vorteilhafter.

Vorgehensweise: Stapelweises Umbenennen von docx-Dateien mit Word-Textinhalt
Schritt 1: Werkzeug „Dateiname“ öffnen, Funktion zur Umbenennung mit Word-Inhalt aufrufen
Wählen Sie nach dem Start von HeSoft Doc Batch Tool in der linken Funktionskategorie Dateiname aus. Suchen und klicken Sie in der Funktionsliste auf Word-Dateien mit Dateiinhalt umbenennen.

Der Zweck dieser Funktion ist: Bestimmte Texte aus dem Inhalt von Word-Dateien stapelweise als Dateinamen für diese Dateien zu verwenden. Für Word-Dokumente wie docx, doc eignet sie sich, um Text von einer festen Position oder aus einem festen Format im Text zu extrahieren und zur Benennung zu nutzen.
Nach dem Aufrufen der Funktion zeigt die Oberfläche den aktuellen Aufgabennamen „Word-Dateien mit Dateiinhalt umbenennen“ und ist prozessual in die Schritte „Zu verarbeitende Datensätze auswählen“, „Verarbeitungsoptionen festlegen“, „Speicherort festlegen“ und „Verarbeitung starten“ unterteilt.
Schritt 2: Stapelweise umzubenennende Word-Dateien hinzufügen
Klicken Sie auf der Seite von Schritt 1 „Zu verarbeitende Datensätze auswählen“ oben auf Dateien hinzufügen und wählen Sie die zu verarbeitenden Word-Dokumente aus. Befinden sich die Dateien alle im selben Ordner, können Sie auch Dateien aus Ordner importieren verwenden, um mehrere docx-Dateien auf einmal zu importieren.

Nach dem Import zeigt die Liste die Nummer, den Namen, den Pfad, die Erweiterung, das Erstellungsdatum und das Änderungsdatum der Dateien an. Im Beispiel wurden 5 docx-Dateien auf einmal importiert, darunter Cosmic_Distances.docx, Galaxies_and_the_Milky_Way.docx usw.
Der Zweck dieser Seite ist, den Umfang der an der stapelweisen Umbenennung teilnehmenden Dateien zu bestätigen. Nachdem Sie die Dateiliste überprüft haben, klicken Sie unten auf Nächster Schritt, um die Verarbeitungsregeln festzulegen.
Schritt 3: Suchbereich auswählen, festlegen, welcher Text aus dem Word-Inhalt extrahiert wird
Auf der Seite von Schritt 2 „Verarbeitungsoptionen festlegen“ muss eingestellt werden, an welcher Position im Word-Dokument die Software nach Text sucht. Die Oberfläche zeigt die Optionen für den „Suchbereich“, darunter:
- Erste Textzeile
- Erstes Barcode-Bild
- Per benutzerdefinierter Formel übereinstimmender Text
Im vorliegenden Beispiel ist der Zielinhalt die Nummer nach der Document ID im Text, z. B. Document ID: 2JMM01GJ. Daher wird Per benutzerdefinierter Formel übereinstimmender Text ausgewählt und die Nummer dann über einen regulären Ausdruck präzise extrahiert.

Schritt 4: Regulären Ausdruck eingeben, um die Nummer nach der Document ID zu extrahieren
Geben Sie im Eingabefeld „Regulärer Ausdruck“ die Regel zur Übereinstimmung mit dem Word-Textinhalt ein. Die Beispielregel im Screenshot lautet:
(?<=Document ID:)[0-9A-Z]+
Diese Regel bedeutet: Suche nach fortlaufenden Großbuchstaben und Ziffern, die auf Document ID: folgen, und verwende diesen Inhalt als Text für die Umbenennung. Wenn beispielsweise im Word-Dokument Document ID: 2JMM01GJ erscheint, extrahiert die Software 2JMM01GJ, anstatt das vollständige „Document ID: 2JMM01GJ“ zu extrahieren.
Sollte das Feld in Ihrem Dokument nicht Document ID sein, sondern z. B. „Vertragsnummer:“, „Archivnummer:“, „Nummer:“ usw., können Sie den Ausdruck an das tatsächliche Textformat anpassen. Entscheidend ist, dass das Format des zu extrahierenden Inhalts in jeder Word-Datei möglichst einheitlich ist, damit das Ergebnis der Stapelverarbeitung stabil ist.
Schritt 5: Position für den neuen Dateinamen festlegen
Im Bereich „Position“ derselben Seite können Sie auswählen, wie der extrahierte Text auf den Dateinamen angewendet wird. Die im Screenshot sichtbaren Optionen umfassen:
- Gesamten Dateinamen überschreiben: Den ursprünglichen Dateinamen direkt durch den extrahierten Word-Inhalt ersetzen.
- Links vom Dateinamen: Den extrahierten Inhalt links vom ursprünglichen Dateinamen hinzufügen.
- Rechts vom Dateinamen: Den extrahierten Inhalt rechts vom ursprünglichen Dateinamen hinzufügen.
In diesem Beispiel soll die ursprüngliche Datei Cosmic_Distances.docx direkt in 2JMM01GJ.docx umbenannt werden, daher wird Gesamten Dateinamen überschreiben gewählt. Wenn Sie die Nummer nur vor dem ursprünglichen Dateinamen hinzufügen möchten, können Sie auch „Links hinzufügen“ oder „Rechts hinzufügen“ wählen.
Klicken Sie nach Abschluss der Einstellungen auf Nächster Schritt, um fortzufahren.
Schritt 6: Speicherort festlegen und Verarbeitung starten
Dem Prozess in der Oberfläche folgend gelangen Sie als Nächstes zu Schritt 3 Speicherort festlegen. Hier dient es dazu, den Speichermodus oder -pfad für die Datei(en) nach der stapelweisen Umbenennung zu bestätigen. Es wird empfohlen, vor der formellen Verarbeitung wichtiger Dokumente zunächst Sicherungskopien zu erstellen oder das Verarbeitungsergebnis an einem Ort zu speichern, der eine einfache Überprüfung ermöglicht.
Nach Bestätigung des Speicherorts gelangen Sie zu Schritt 4 Verarbeitung starten. Die Software liest gemäß den zuvor festgelegten Regeln nacheinander den Inhalt jeder Word-Datei, extrahiert den übereinstimmenden Text und generiert den neuen Dateinamen.
Nach Abschluss der Verarbeitung kehren Sie in den Ordner zurück, um das Ergebnis zu überprüfen. Im Beispiel wurden die ursprünglichen 5 docx-Dateien stapelweise in die Document-ID-Nummern aus dem Text umbenannt, wobei die Dateierweiterung .docx erhalten blieb.
Häufige Fragen und Hinweise
1. Das Format der Felder im Word-Text sollte möglichst einheitlich sein
Die automatische stapelweise Umbenennung hängt von erkennbaren Textmustern ab. Wenn in einigen Dateien „Document ID: 2JMM01GJ“ und in anderen „Doc ID-2JMM01GJ“ steht, kann derselbe reguläre Ausdruck möglicherweise nicht alles erfassen. Es wird empfohlen, vor der Verarbeitung stichprobenartig einige Dokumente zu überprüfen und zu kontrollieren, ob Feldbezeichnung, Doppelpunkt, Leerzeichen und Nummernformat einheitlich sind.
2. Der reguläre Ausdruck muss mit dem tatsächlichen Inhalt übereinstimmen
Der Beispielausdruck (?<=Document ID:)[0-9A-Z]+ eignet sich, um Nummern zu extrahieren, die auf „Document ID:“ folgen und aus Ziffern und Großbuchstaben bestehen. Enthält die Nummer Kleinbuchstaben, Bindestriche, Unterstriche oder chinesische Zeichen, muss die Übereinstimmungsregel entsprechend angepasst werden.
3. Das Extraktionsergebnis sollte möglichst keine für Dateinamen unzulässigen Zeichen enthalten
Windows-Dateinamen dürfen bestimmte Sonderzeichen wie Schrägstrich, umgekehrter Schrägstrich, Doppelpunkt, Sternchen, Fragezeichen, Anführungszeichen usw. nicht enthalten. Enthält der aus dem Text extrahierte Inhalt solche Zeichen, kann dies das Umbenennungsergebnis beeinträchtigen. Es wird empfohlen, vorrangig relativ normierte Inhalte wie Nummern, Namen, Projektcodes zu extrahieren.
4. Vor der Stapelverarbeitung empfiehlt es sich, zuerst mit wenigen Dateien zu testen
Wenn Sie die Funktion zur automatischen Umbenennung mit Word-Inhalt zum ersten Mal verwenden, wird empfohlen, zunächst 2 bis 3 Beispieldokumente zu importieren, um die Regel zu testen, und erst nach Bestätigung, dass der Dateiname den Erwartungen entspricht, die Stapelverarbeitung für den gesamten Ordner durchzuführen. So lassen sich die Nacharbeitskosten durch fehlerhafte Regeleinstellungen reduzieren.
5. Sowohl bei docx- als auch bei doc-Dateien sollte überprüft werden, ob der Inhalt normal lesbar ist
Word-Dateien aus unterschiedlichen Quellen können Formatunterschiede aufweisen. Bei gescannten Dokumenten, bildbasierten Inhalten oder geschützten Dokumenten hängt es davon ab, ob lesbarer Text im Dokument vorhanden ist, ob die Software den Zieltext extrahieren kann. Wenn der Textinhalt selbst ein Bild ist, wird empfohlen, zunächst zu prüfen, ob der Text normal ausgewählt und kopiert werden kann.
Fazit: Stapelweises Extrahieren von Word-Inhalten zur Benennung mit Bürosoftware reduziert repetitive Arbeit
Der Kerngedanke bei der automatischen Umbenennung von Dateien mit Textinhalt aus Word besteht darin, die repetitive Abfolge „Dokument öffnen, Nummer finden, Inhalt kopieren, in den Ordner zurückkehren, manuell umbenennen“ an die Bürosoftware zur stapelweisen Ausführung zu übergeben. Mit der Funktion „Word-Dateien mit Dateiinhalt umbenennen“ von HeSoft Doc Batch Tool können mehrere docx- oder doc-Dokumente auf einmal importiert und nach Festlegung der Extraktionsregeln automatisch mit normierten Dateinamen versehen werden.
Für Szenarien wie Archivorganisation, Vertragsablage, Berichtsbereitstellung, Verwaltung von Lehrmaterialien usw. kann diese stapelweise Verarbeitungsmethode den manuellen Arbeitsaufwand erheblich reduzieren, die Fehlerquote bei der Benennung senken und die Dateisuche sowie die nachfolgende Verwaltung übersichtlicher gestalten. Es wird empfohlen, vor der formellen Verarbeitung zunächst das Format der Dokumentfelder zu bestätigen und die Regel mit wenigen Dateien zu testen, und erst nach Bestätigung der Korrektheit die Stapelverarbeitung durchzuführen.