PDFフォーマットは通常、優れたクロスプラットフォーム表示効果を持っていますが、コンテンツの編集はレイアウト可能なドキュメントほど便利ではありません。複数の類似した表現のキーワードを一括削除する必要があり、ドキュメントの数が多い場合、通常の検索と置換では要件を満たすのが難しいことがあります。そのような場合、あいまい一致の方法を利用して、類似したテキストや数字を持つテキスト断片を識別して削除し、業務におけるドキュメント処理の効率を効果的に向上させることができます。
これから、あいまい一致を利用して PDF 内の類似した文字や数字を一括削除する方法をすばやく実現し、PDF ファイルのクリーンアップ作業を思い通りに行えるようにする方法をご紹介します。ぜひ一緒に試してみましょう!
どのような場合に PDF 内の文字や数字などをあいまい削除する必要があるか?
機密データのクリーンアップ
企業や組織が公開または共有する PDF ファイルに、ユーザーの個人情報、氏名、住所、身分証明書番号、電話番号などが含まれている場合、情報の悪用や漏洩を防ぐためにあいまい削除を行う必要があります。
機密情報の秘匿
企業が PDF の契約書、見積書、商品ファイルなどを公開する際、価格、利益、パートナー情報などが含まれている場合、特定の文字や数字をあいまい削除することで、競合他社が有益な情報を得るのを防ぎ、ファイルの内容を指定された受信者のみが使用できるようにします。
プライバシーコンテンツの保護
古い PDF アーカイブファイルを処理する際、従業員の過去の給与記録、契約番号、期限切れのポリシーなどが存在する場合、一般的にアーカイブの可用性を保つために、一部の機密コンテンツをあいまい削除することが非常に必要です。
PDF 内の複数の番号・番号の一括削除の効果プレビュー
処理前:

処理後:

あいまい一致を利用した PDF 内のキーワードの一括削除操作手順
1、【 HeSoft Doc Batch Tool 】を開き、【PDF ツール】-【PDF 内のキーワードを検索して置換】を選択します。

2、【ファイルを追加】または【フォルダからファイルをインポート】から、キーワードを削除する PDF ファイルを追加する方法を選択するか、ファイルを下に直接ドラッグしてインポートし、「次へ」をクリックします。

3、オプション設定画面で【数式を使用したあいまいテキスト検索】を選択し、下の検索キーワードリストに対応する正規表現の式を入力します(わからない場合は、AI に Microsoft .Net フレームワークを使用した生成を依頼できます)。置換後のキーワードリストの下は空欄のまま入力せず、完了後再度「次へ」をクリックします。次に保存画面に入り、「参照」をクリックし、処理後のファイルの保存場所を選択します。

4、処理が終了するのを待った後、赤いパスをクリックし、フォルダを開いて削除に成功したファイルを確認します。
