複数のPDFに同じ機密ワード、日付、旧番号、または公開すべきでない情報が含まれている場合、手動で一つずつ削除するのは効率が悪く、漏れも発生しやすいです。この記事では、 HeSoft Doc Batch Tool を使用してPDF内の文字を一括削除する方法を紹介します。まず、PDFツールの検索と置換機能を開き、複数のPDFファイルをインポートし、次に削除したいキーワードを1行ずつ入力し、置換後の内容を空白にします。これにより、PDF内の指定された文字を一括削除でき、レポートの匿名化、資料公開前のチェック、テンプレートのクリーンアップなどのオフィスシーンに適しています。
資料の外部送信、プロジェクトのアーカイブ、契約書の整理、報告書の公開前に、よく直面する厄介な問題があります。それは、複数のPDFに残したくないテキストが含まれていることです。例えば、固定日付、内部コードネーム、機密ワード、顧客名、旧バージョンの年号などです。ファイル数が少なければ、手動でPDFを開き検索機能で該当箇所を特定し、一つずつ処理することも何とか可能です。しかし、ファイル数やページ数が多い場合、手動でPDFのテキストを削除するのは時間がかかるだけでなく、削除漏れが発生し、ファイルのコンプライアンスや納品品質に影響を与える可能性があります。
この記事では、「PDFの機密ワードと日付を一括で消去する方法」を中心に、 HeSoft Doc Batch Tool を使用して、複数のPDF内の指定テキストを一括削除する方法を説明します。このソフトウェアは、オフィスソフトにおける一括ファイル処理ツールに属し、反復的で機械的、ミスが発生しやすい文書処理タスクを集中して完了するのに適しています。この例では、4つのPDFファイルに対して同一のキーワード削除操作を実行し、PDFページ内の「April」と「2017」を消去します。
適用シーン:PDFのマスキング、日付の消去、古い内容の削除
PDFキーワードの一括削除は、例にある英語の日付だけに使えるわけではありません。複数のPDFに同じテキストが存在し、それを統一的に消去したい場合は、すべて同様の方法を採用できます。一般的なシーンは以下の通りです。外部提出資料から内部プロジェクト名を削除する、報告書の表紙やフッターから古い日付を削除する、契約書の添付文書からテスト用フィールドを削除する、公開文書から個人名・電話番号・番号を除去する、アーカイブ前に透かしのようなテキストや固定説明を統一的に消去するなどです。
注意すべき点は、ここで説明するのはPDF内のテキストキーワードの削除であり、PDFページの削除や、PDFをWord、docx、またはdocに変換してから編集することではないということです。PDFの一括処理フロー内で直接検索と置換を完了させる方が、通常は元のPDFフォーマット、ページレイアウト、ファイル構造を維持するのに適しています。
処理前のファイルのスクリーンショットからわかるように、今回処理するのは4つのPDFファイルで、ファイル名はそれぞれ1.pdf、2.pdf、3.pdf、4.pdfです。これらは同じグループのファイルであり、一つずつ処理する場合、開く、検索、修正、保存を4回繰り返す必要があります。一括処理ツールを使用すれば、キーワードルールを一度設定するだけで済みます。

処理前の状態:PDFページ内に消去が必要なテキストが存在する
処理前のPDFを開くと、ページ内に「April 13, 2017」のような日付情報が表示されているのがわかります。スクリーンショットでは赤枠で「April」と「2017」が示され、矢印でこれらが今回消去する対象テキストであることが示唆されています。つまり、日付領域全体を削除するのではなく、指定された二つのキーワードのみを削除するのです。
このようなキーワードによる処理方法は、より細やかです。例えば、状況によっては日付のうち日、句読点、その他のテキストは残す必要があり、月と年だけを削除すればよい場合があります。例では「13,」はキーワードリストに含まれていないため、処理後も保持されます。

処理後の状態:指定テキストが削除され、その他の内容は保持される
処理完了後にPDFを確認すると、元々「April」と「2017」が表示されていた位置が空白になり、間の「13,」は依然として存在していることがわかります。赤枠で示された空白領域は、キーワードが空の内容に置き換えられたことを示しており、これがPDFの指定テキストを一括削除した実際の効果です。
PDFのマスキングが必要なユーザーにとって、この結果は非常に直感的です。機密ワードは消去され、対象外の内容は全体的に削除されていません。手動での範囲選択削除やスクリーンショットでのマスキングと比較して、キーワードの一括空置換は大量ファイルの統一処理により適しています。

操作手順一:PDFツールで検索と置換機能を見つける
HeSoft Doc Batch Tool を起動したら、まず左側のナビゲーションバーからPDF ツールを選択します。インターフェースにはPDF関連の一括処理機能が複数表示されます。今回行うのはPDF内の指定テキストの削除ですので、最初の項目であるPDF内のキーワードを検索して置換を選択します。
この手順の目的は、PDFテキストを認識し、置換ルールを実行できる機能ページに入ることです。「キーワードの削除」は本質的に「キーワードを空に置換する」ことと同じであるため、検索と置換機能を使用するのが要件に最も合致します。スクリーンショットではこの機能カードがハイライトされており、正しい入口にたどり着いたことを示しています。

操作手順二:機密ワードを消去する必要があるPDFファイルをインポートする
機能ページに入ると、ソフトウェア上部にはステップフローが表示されます:処理が必要なレコードの選択、処理オプションの設定、保存場所の設定、処理の開始。まず第1ステップでファイルをインポートします。インターフェース右上にファイルを追加とフォルダからファイルをインポートの二つのボタンがあります。
処理したいPDFが異なる場所に分散している場合は、「ファイルを追加」を使用して個別に選択できます。これらのPDFがすべて同じフォルダにある場合は、「フォルダからファイルをインポート」を使用する方がより早いです。インポート後、ファイルリストには番号、名前、パス、拡張子、作成日時、更新日時などの情報が表示されます。スクリーンショットではすでに4つのPDFファイルが正常にインポートされており、下部のサマリーにはレコード数が4と表示されています。
このステップでは、リスト内のファイル名とパスを慎重に確認し、誤ったファイルがインポートされていないか確認することをお勧めします。一括処理の効率は非常に高いですが、それはルールがリスト内のすべてのファイルに適用されることも意味するため、開始前のファイル確認は非常に重要です。

操作手順三:削除したいPDFテキストをキーワードリストに入力する
ファイルに問題がないことを確認したら、下部の次へをクリックして処理オプションの設定ページに進みます。ここでは「検索方法」「追加オプション」「検索が必要なキーワードリスト」「置換後のキーワードリスト」などのエリアが表示されます。
例では、検索方法としてテキストを正確に検索が選択されています。これは、明確で固定されたテキスト内容を削除するのに適しています。左側の「検索が必要なキーワードリスト」には、Aprilと2017の2行が入力されています。右側の「置換後のキーワードリスト」は空で、インターフェースには「入力しない場合は削除を意味します」というヒントが表示されています。したがって、ソフトウェアは処理時にPDF内でAprilと2017を検索し、それらを空の内容に置換します。
実際に複数の機密ワードを削除する必要がある場合は、それらを左側のリストに1行ずつ記述します。例えば、1行目に顧客名、2行目にプロジェクト番号、3行目に日付を記述します。置換リストを空のままにしておけば、これらの内容をすべて削除することを意味します。削除ではなく他のテキストに置換したい場合は、右側に対応する新しい内容を入力する必要があります。しかし、本チュートリアルの焦点は一括消去ですので、空白のままで問題ありません。

操作手順四:新しい場所に保存し、一括消去を実行する
キーワードを設定したら、引き続き次へをクリックします。インターフェースのフローに従い、その後は保存場所を設定し、処理を開始する必要があります。処理結果は新しい出力フォルダに保存し、元のディレクトリに直接混在させないことをお勧めします。これにより、処理前後のファイルを比較しやすく、問題を発見した場合に元のPDFを保持することもできます。
処理を開始すると、 HeSoft Doc Batch Tool はタスクリスト内のファイル順に従って一括実行します。各PDFに同じキーワード削除ルールが適用されます。処理が完了したら、出力PDFを開き、対象テキストが削除されたかどうかを確認し、異なるファイル、異なるページ番号をランダムにチェックして、一括消去の結果が安定していることを確認します。
よくある質問:PDFテキストを一括消去する前に確認すべきこと
1. PDFキーワードを削除するとページレイアウトが変わりますか?
例の効果から見ると、キーワードがあった場所は空白になり、他のテキストはそのまま残ります。ただし、PDFによってテキスト構造が異なる場合があるため、まずコピーを使ってテストし、ページ表示が予想通りであることを確認してから、正式なファイルを一括処理することをお勧めします。
2. 同じ単語がPDF内に複数回出現する場合、すべて削除されますか?
検索と置換タイプの操作は通常、一致したキーワードに基づいて実行されます。誤削除を避けるため、キーワードはできるだけ具体的にすることをお勧めします。例えば「2017」を削除すると、2017が出現するすべての位置が影響を受けます。特定の固定領域のみを処理したい場合は、事前にファイル内容がグローバルキーワード削除に適しているかどうかを評価する必要があります。
3. 英字の大文字と小文字が異なる場合はどうすればよいですか?
設定ページには「英字の大文字と小文字を区別しない」オプションがあります。April、april、APRILのすべてを認識させたい場合は、必要に応じて有効にすることができます。完全に一致する表記のみを削除したい場合は、正確な検索を維持すれば問題ありません。
4. 一部のPDFでテキストが検索できないのはなぜですか?
一部のPDFはスキャン画像であり、ページ上にはテキストがあるように見えても、実際には編集や検索が可能なテキストレイヤーが存在しません。このようなファイルに遭遇した場合、まずPDFリーダーでキーワードを検索してみてください。検索できなければ、一括検索と置換も直接マッチングできない可能性があります。
5. 最初にWordに変換してから削除するのは適していますか?
固定キーワードを削除するだけであれば、PDF内で直接一括検索と置換を行う方がより簡潔です。Word、docx、またはdocに変換してから編集すると、レイアウトの変更が生じる可能性があります。広範囲にわたって内容を書き換える必要がある場合にのみ、変換編集を検討してください。
まとめ
PDF内の機密ワード、日付、古い番号を一括消去する鍵は、反復操作をルール化することです。 HeSoft Doc Batch Tool を使用する場合、PDFツールに入り、「PDF内のキーワードを検索して置換」を選択し、複数のPDFをインポートして、削除したいテキストをキーワードリストに記述し、置換内容を空に保つだけで、指定テキストを一括削除できます。
この方法は、ファイル数が多く、キーワードが固定されており、PDFフォーマットを維持する必要があるオフィスシーンに特に適しています。正式に処理する前に、まずキーワードリストを整理し、少数のPDFを使ってテストを実行することをお勧めします。効果を確認した後、すべてのファイルに対して一括処理を実行することで、効率を向上させ、人為的な削除漏れのリスクを低減できます。