Wenn dasselbe Datum, dieselbe Nummer, derselbe Kundenname oder derselbe alte Text in mehreren PDFs gleichzeitig vorkommt, ist das manuelle Löschen einzeln sehr ineffizient. In diesem Artikel wird eine Methode zum massenweisen Löschen bestimmter Inhalte in PDFs mit HeSoft Doc Batch Tool vorgestellt: Importieren Sie zuerst die zu verarbeitenden PDFs, geben Sie dann die zu löschenden Schlüsselwörter in die Suchliste ein, lassen Sie den ersetzten Inhalt leer und geben Sie abschließend die Verarbeitungsergebnisse einheitlich aus. Diese Methode eignet sich für die Stapelverarbeitung von Berichten, Verträgen und archivierten Unterlagen.
Viele Büroszenarien stehen vor ähnlichen Problemen: Ein Stapel PDF-Berichte ist bereits erstellt, aber das Deckblatt oder der Haupttext enthalten noch alte Daten; mehrere PDF-Verträge enthalten eine Nummer, die nicht nach außen gezeigt werden soll; Archivmaterialien enthalten einen alten Projektnamen, der einheitlich gelöscht werden muss. Eine einzelne Datei zu ändern ist nicht schwierig, schwierig ist die große Anzahl an Dateien. Insbesondere PDFs lassen sich nicht so einfach direkt bearbeiten wie Word, docx oder doc. Das einzelne Öffnen, Suchen, Lokalisieren und Löschen kostet enorm viel Zeit.
Dieser Artikel dreht sich um das "Löschen von Schlüsselwörtern in vielen PDF-Dateien im Stapel" und zeigt, wie Sie mit HeSoft Doc Batch Tool eine einheitliche Bereinigung mehrerer PDFs durchführen können. Es handelt sich um eine Bürosoftware, deren Kernkompetenz die Stapelverarbeitung von Dateien, die Reduzierung von Routineaufgaben und die Steigerung der Effizienz der Dokumentenverarbeitung ist. Die in diesem Artikel verwendete Funktion ist "Suchen und Ersetzen von Schlüsselwörtern in PDFs", wobei durch das Leerlassen der Liste der ersetzten Schlüsselwörter der Effekt des Löschens bestimmter Texte erzielt wird.
Anwendungsszenarien: Welche Probleme lassen sich durch das Löschen bestimmter Texte in PDFs im Stapel lösen
Wenn die Anzahl der PDF-Dateien groß ist und die zu löschenden Inhalte konsistent sind, eignet sich die Stapelverarbeitung hervorragend. Zum Beispiel: Löschen eines bestimmten Datums auf mehreren PDF-Deckblättern; Entfernen alter Jahreszahlen aus Berichten; Bereinigen interner Nummern in Dateien; Löschen von nicht öffentlichen Schlüsselwörtern; Einheitliches Entfernen einer bestimmten Kundenabkürzung, Projektabkürzung oder Versionsmarkierung.
Der Screenshot zeigt ein einfaches, aber typisches Stapelszenario: Im selben Ordner befinden sich die 4 PDF-Dateien 1.pdf, 2.pdf, 3.pdf und 4.pdf. Obwohl das Beispiel nur 4 Dateien zeigt, können es in der Praxis 40 oder 400 sein. Je mehr Dateien, desto deutlicher wird der Vorteil der Stapelverarbeitung.

Wenn Sie mit PDFs, Scanberichten, heruntergeladenem Material, extern zu veröffentlichenden Dateien oder historischen Archivdateien arbeiten, die durchsuchbare Textschlüsselwörter enthalten, können Sie die Methode aus diesem Artikel anwenden. Für Word-Dokumente, docx, doc und ähnliche Formate sollten die entsprechenden Stapelverarbeitungsfunktionen für Word verwendet werden; dieser Artikel konzentriert sich auf PDF.
Ausgangssituation: Auf der PDF-Seite befindet sich ein zu löschender Datumstext
Öffnet man die PDF-Datei vor der Verarbeitung, sieht man Datumsangaben wie "April 13, 2017". Zu löschen sind "April" und "2017", im Screenshot rot markiert. Das heißt, wir löschen nicht den gesamten Datumsbereich, sondern nur die beiden angegebenen Schlüsselwörter.

Diese Anforderung ist bei der Dokumenten-Anonymisierung, der Materialaufbereitung und der Prüfung vor externer Veröffentlichung üblich. Beispielsweise möchte man nur die mittleren Datumsziffern behalten, aber die englische Monatsangabe und die Jahreszahl löschen; oder nur einen bestimmten Namen entfernen, die umgebenden Satzzeichen und sonstigen Texte aber erhalten. Bei der Stapelsuche und -ersetzung kommt es auf die genaue Eingabe der zu löschenden Inhalte an.
Ergebnis nach der Verarbeitung: Schlüsselwörter sind entfernt, anderer Inhalt bleibt erhalten
Nach Abschluss der Verarbeitung und erneuter Ansicht der PDF-Datei ist zu sehen, dass das ursprüngliche April und 2017 verschwunden sind, während der übrige Inhalt der Seite erhalten geblieben ist. Die rot markierte Stelle im Screenshot ist nun leer, was zeigt, dass die Software die angegebenen Schlüsselwörter gemäß der Regel durch nichts ersetzt hat.

Dieses Ergebnis zeigt, dass das Löschen von Schlüsselwörtern in PDFs im Stapel nicht unbedingt eine Neuerstellung der PDF oder eine Konvertierung in Word zur Bearbeitung erfordert. Für klar definierte Textbereinigungsaufgaben ist die direkte Stapelsuche und -ersetzung auf PDF-Ebene oft schneller und besser für viele Dateien geeignet.
Schritt-für-Schritt-Anleitung: Der vollständige Ablauf vom Import der PDF bis zum Löschen der Schlüsselwörter
Schritt 1: PDF-Tool öffnen und die Funktion "Suchen und Ersetzen von Schlüsselwörtern in PDFs" aufrufen
Nach dem Start von HeSoft Doc Batch Tool wählen Sie in der linken Werkzeugkategorie "PDF-Tools". Im Hauptbereich werden mehrere PDF-bezogene Funktionen angezeigt, z. B. PDF verschlüsseln, Wasserzeichen hinzufügen, Seiten löschen, Format konvertieren usw. Hier muss "Suchen und Ersetzen von Schlüsselwörtern in PDFs" ausgewählt werden.

Die Beschreibung dieser Funktion lautet: Stapelsuche und -ersetzung von Schlüsselwörtern im Inhalt von PDF-Dateien. Da "Löschen" als "Ersetzen durch nichts" betrachtet werden kann, eignet es sich auch für das Löschen von PDF-Text im Stapel. Nachdem Sie diese Funktion aufgerufen haben, können Sie mit dem Hinzufügen von Dateien und dem Festlegen der Suchregeln beginnen.
Schritt 2: Die zu verarbeitenden PDFs zur Aufgabenliste hinzufügen
Auf der Funktionsseite sehen Sie oben Schaltflächen wie "Dateien hinzufügen", "Aus Ordner importieren", "Leeren", "Mehr" usw. Bei wenigen PDFs können Sie auf "Dateien hinzufügen" klicken; befinden sich alle PDFs im selben Ordner, empfiehlt sich eher "Aus Ordner importieren", da dies die Auswahlzeit verkürzt.

Im Screenshot enthält die Aufgabenliste bereits 4 Datensätze: 1.pdf, 2.pdf, 3.pdf, 4.pdf, mit Dateipfad und Erweiterung. Nach dem Hinzufügen sollten Sie zunächst überprüfen, ob diese Dateien die zu verarbeitenden Objekte sind. Wurde versehentlich eine Datei hinzugefügt, können Sie den entsprechenden Datensatz über die Aktionsspalte rechts in der Liste entfernen; soll die Liste neu aufgebaut werden, verwenden Sie "Leeren". Klicken Sie nach der Bestätigung auf "Weiter".
Schritt 3: "Exakte Textsuche" wählen und die zu löschenden Schlüsselwörter eingeben
In den Verarbeitungsoptionen legen Sie zunächst die Suchmethode fest. Im Screenshot ist "Exakte Textsuche" gewählt, geeignet zum Löschen von eindeutig vorkommendem Text wie festen Daten, Nummern, englischen Wörtern oder chinesischen Phrasen. Daneben ist auch "Fuzzy-Textsuche mit Formel" zu sehen, aber in diesem Beispiel wird die exakte Suche verwendet, die intuitiver und für den ersten Einsatz besser geeignet ist.

Geben Sie dann in die "Liste der zu suchenden Schlüsselwörter" den zu löschenden Inhalt ein. Im Beispiel wurden zwei Zeilen eingegeben: April und 2017. Die Art der Eingabe ist wichtig, es wird empfohlen, ein Schlüsselwort pro Zeile zu verwenden, damit die Software sie separat verarbeiten kann und die spätere Überprüfung erleichtert wird. Für das Löschen von Daten, Nummern, Namen usw. im Stapel können je nach Bedarf weitere Zeilen hinzugefügt werden.
Schritt 4: Die Liste der ersetzten Schlüsselwörter leer lassen
Auf der rechten Seite befindet sich die "Liste der ersetzten Schlüsselwörter" mit dem deutlichen Hinweis im Screenshot: "Leer lassen bedeutet Löschen". Wenn Ihr Ziel also das Löschen von Schlüsselwörtern in PDFs ist, geben Sie rechts keinen Ersetzungstext ein. Bleibt das Feld leer, ersetzt die Software die links gefundenen Schlüsselwörter durch leeren Inhalt.
Beispiel: Links steht April, rechts ist leer – nach der Verarbeitung wird April in der PDF gelöscht; links steht 2017, rechts ist leer – nach der Verarbeitung wird auch 2017 gelöscht. Wäre rechts ein anderer Inhalt eingetragen, würde es sich um einen Ersetzungs- und nicht um einen Löschvorgang handeln.
Schritt 5: Weiter klicken, Speicherort festlegen und Verarbeitung starten
Am Ablauf der Benutzeroberfläche ist zu erkennen, dass die Aufgabe in die Phasen Datensatzauswahl, Verarbeitungsoptionen festlegen, Speicherort festlegen und Verarbeitung starten unterteilt ist. Klicken Sie nach dem Festlegen der Schlüsselwörter auf "Weiter" und folgen Sie den Anweisungen, um den Speicherort für die verarbeiteten Dateien festzulegen und die Verarbeitung zu starten.
Es wird empfohlen, die Ausgabedateien in einem neuen Ordner zu speichern, um einen Vergleich mit den Original-PDFs zu erleichtern. Öffnen Sie nach Abschluss der Verarbeitung zunächst eine PDF, um den Löscheffekt zu überprüfen, und kontrollieren Sie dann stichprobenartig andere Dateien. Sollte ein Schlüsselwort nicht gelöscht worden sein, muss meist in den Einstellungen überprüft werden, ob die Schreibweise übereinstimmt, die Groß-/Kleinschreibung passt und ob der PDF-Text erkannt werden kann.
Häufige Fragen und Hinweise
1. Können chinesische und englische Schlüsselwörter gleichzeitig gelöscht werden?
Ja, solange der Text in der PDF erkannt werden kann und Sie den entsprechenden Inhalt genau in die Suchliste eintragen, können chinesische, englische, numerische oder gemischte Inhalte verarbeitet werden. Es wird empfohlen, jedes Schlüsselwort in eine eigene Zeile zu schreiben und zu vermeiden, mehrere nicht zusammenhängende Inhalte zu einer Suchbedingung zusammenzufassen.
2. Sollen beim Löschen eines Datums auch die Satzzeichen eingegeben werden?
Das hängt davon ab, was Sie behalten möchten. Im Beispiel wurden April und 2017 gelöscht, sodass die 13 und das Komma dazwischen erhalten blieben. Möchte man das vollständige Datum löschen, muss man das gesamte Datum oder weitere Bestandteile entsprechend dem tatsächlichen Text in der PDF zur Suchliste hinzufügen. Vor dem Vorgang sollte man am besten die Textdarstellung in der PDF überprüfen.
3. Warum lassen sich manche Schlüsselwörter in PDFs nicht löschen?
Mögliche Gründe sind: Die PDF ist ein Bildscan ohne editierbare Textebene; das Schlüsselwort ist in der PDF auf mehrere Textobjekte aufgeteilt; Groß-/Kleinschreibung oder Leerzeichen stimmen nicht überein; der Suchinhalt enthält nicht darstellbare Zeichen. In solchen Fällen kann man zunächst versuchen, das Schlüsselwort im PDF-Reader zu suchen. Findet der Reader es auch nicht, wird die Stapelsuche und -ersetzung in der Regel ebenfalls keinen Treffer erzielen.
4. Ist vor der Stapelverarbeitung eine Sicherung erforderlich?
Eine Sicherung wird empfohlen. Die Stapelverarbeitung ist sehr effizient, aber wenn die Regeln falsch eingestellt sind, kann dies auch mehrere Dateien gleichzeitig betreffen. Sicherheitshalber kopiert man eine zu verarbeitende PDF in einen Testordner, verarbeitet zunächst eine kleine Stichprobe, überprüft das Ergebnis und verarbeitet dann alle Dateien im Stapel.
Fazit: Mit Stapelsuche und -ersetzung die Effizienz der PDF-Bereinigung steigern
Wenn Sie in mehreren PDFs einheitlich Daten, Nummern und bestimmte Texte löschen möchten, besteht der Kernansatz darin, "Löschen" in "Suchen und Ersetzen durch nichts" umzuwandeln. HeSoft Doc Batch Tool bietet einen Stapelsuch- und -ersetzungsprozess für PDF-Dateien, mit dem Sie mehrere PDFs auf einmal importieren, Schlüsselwörter einheitlich festlegen und die Ergebnisse stapelweise ausgeben können.
Wenn Sie bei Ihrer Arbeit häufig PDFs ordnen, alte Informationen bereinigen, sensible Wörter löschen oder Berichtsinhalte einheitlich verarbeiten müssen, empfiehlt es sich, vorrangig die Stapelverarbeitung zu nutzen. Sie spart nicht nur die Zeit für die Bearbeitung einzelner Dateien, sondern macht die Regeln auch einheitlicher und reduziert das Risiko manueller Löschfehler. Wenn Sie das nächste Mal in mehreren PDFs dieselbe Art von Text löschen müssen, können Sie direkt den Schritten in diesem Artikel folgen.