複数のWord、docxまたはdoc文書に類似しているが、完全には同一ではない内容が存在する場合、例えば固定フォーマットの英語の略語、番号、数字、コードの断片など、ファイルを一つずつ開いて手動で削除するのは時間がかかるだけでなく、変更漏れも容易です。 この記事では、使用方法について説明します HeSoft Doc Batch Tool の「Wordのキーワードを検索して置換」機能は、正規表現でファジーマッチを行い、置換内容を空白にして、複数のWordファイルから指定したパターンテキストを一括削除します。
大量のword文書を整理するとき、多くの場合、各ファイルに削除するキーワードがあるが、これらの内容は全く同じではないという問題がある。 例えば、3桁の大文字の略語であるところもあれば、数字番号、学時の数字、コード、その他の可変内容であるところもあります。 Docx、docファイルを1つずつ開いて手動で検索して削除すると、効率が悪いだけでなく、漏れやすい。
このようなシーンは、ファイルの一括処理をサポートするオフィスソフトウェアを使用する方が適しています。 次は HeSoft Doc Batch Tool 」を例に、正規表現で複数のWordのキーワードを一括して削除する方法を示します。 この記事の例では、複数のWordファイルから類似を削除する必要がありますBOTこのような3桁の大文字と60このようなデジタルコンテンツ。
適用シーン
正規表現を使用してWordキーワードを一括削除すると、「内容は規則的だが、具体的なテキストは固定されていない」という文書クリーンアップタスクに適しています。例:
- Word、docx、docファイルの数字、番号、年、金額などの内容を一括削除する
- 3桁の大文字のコードのように、固定形式の英語の略語を一括削除します
- 契約、コース資料、レポートの可変フィールドを一括整理する
- 複数のword文書の中のある種類のキーワードを統一的に空白に置き換え、一括削除を実現する
- 何十個、何百個ものWord文書を同時に処理して、重複して開いたり、検索したり、削除したりしないようにする必要がある。
削除する内容が正規表現で記述できる限り、「あいまい検索を空に置き換える」という方法で一括して作成できます。
効果プレビュー: 処理前と処理後の比較
処理前: 複数のWordファイルを一括して整理する必要があります
サンプルフォルダには6つのword文書があり、ファイル拡張子はdocxです。 実際に使用する場合は、Wordファイルをもっと扱う必要がある場合にも、同じように一括インポートすることができます。

ドキュメントの1つを開くと、削除する内容が本文に含まれていることがわかります。 例えば、タイトルの先頭のBOT、および本文中の数字60。 これらの内容が複数のファイルに分散されていると、手動で削除するのは面倒です。

処理後: マッチしたキーワードが一括削除されます。
処理が完了すると、ルールに合っていた内容が削除されます。 例えば、3桁の大文字と数字の内容が消去され、他の本文の内容はまだ残っている。 これにより、複数のWordファイルの正規ファジー削除が実現されました。

操作手順: 正規表現を使用してWordキーワードを一括あいまいに削除します
手順1: Wordツールに入り、「Wordのキーワードを検索して置換」を選択します
開く HeSoft Doc Batch Tool 後、左側で選択しますWordツールをクリックし、機能リストで「Wordのキーワードを検索して置き換えます」。 この機能は、Wordファイルのコンテンツ内のキーワードを一括検索して置換するために使用され、「コンテンツを空白に置換」という方法で一括削除することもできます。

この機能を選択する目的は、ソフトウェアが複数のword文書に対して、手動でファイルごとに操作するのではなく、検索置換ルールを統一的に実行させることです。
手順2: 処理が必要なWordファイルを追加する
機能ページに入ると、ステップ1「処理する記録を選択」でファイルを追加単一または複数のword文書をインポートします。フォルダからファイルをインポートするフォルダの下のドキュメントを一括インポートします。

インポートすると、ファイル番号、名前、パス、拡張子、作成時間、変更時間などの情報がリストに表示されます。 例では、1.docxから6.docxまでの6つのファイルがインポートされており、これらのドキュメントは後続の一括処理に参加することを示しています。
ファイルリストに間違いがないことを確認したら、ページ下部のをクリックします次へを選択します。
ステップ3: ファジー検索方式を選択し、正規表現を入力します
「処理オプションの設定」ページでは、検索方法とキーワードのリストを重点的に設定する必要があります。 今回削除する内容は固定語ではなく、ある規則に合ったテキストなので、検索方法を選択します式を使用してテキストをあいまいに検索します。

左側にあります検索するキーワードのリストに正規表現を入力します。 例には、次の2つのルールが入力されています
- [A-Z]{3}: BOT、ELAなどの連続した3つの大文字のアルファベットにマッチします。
- \ D: 60、2026、123など、1つ以上の数字にマッチします。
右側は置換後のキーワードリスト。 スクリーンショットに「入力しないと削除を意味します」というメッセージが表示されますので、このケースでは右側の置換内容を空白のままにします。 このように、ソフトウェアはバッチ処理時に、左側の正規表現にマッチした内容を空に置き換えます。つまり、これらの内容を削除します。
設定が完了したら、をクリックします次へ、保存場所の設定と処理プロセスの開始に進みます。
ステップ4: 保存場所を設定して一括処理を開始する
ページフローでは、次のステップが表示されます保存先の設定と処理を開始する。 処理したWordファイルを新しいディレクトリに保存することをお勧めします。元のファイルと区別しやすく、処理が完了した後に抽出して比較するのも便利です。
保存場所を確認したら、処理開始手順に進み、インポートした複数のWord、docx、またはdocファイルに対して、同じ検索置換ルールを自動的に実行させます。 処理が完了したら、出力ファイルを開いて効果をチェックし、削除するキーワードがクリーンアップされていることを確認します。
正規表現設定の説明
この例では、固定キーワードを正確に検索するのではなく、「ファジー検索」という考え方を使用しています。 よくある書き方は参考になります。
- [A-Z]{3}: 連続する3つの大文字にマッチします。
- \ D: 連続した数字にマッチします。
- [A-Za-z] : 英語の連続アルファベットにマッチします。
- \ S: 連続した空白文字にマッチします。
実際に使用するときは、ドキュメントの内容に基づいてルールを慎重に作成する必要があります。 正規表現のマッチング範囲が広いほど、削除内容が多くなります。マッチング範囲が正確であればあるほど、誤削除のリスクが低くなります。
よくある質問と注意事項
1.置换リストが空の场合に内容を削除できるのはなぜですか?
検索置換のロジックは「左側のコンテンツを見つけたら、右側のコンテンツに置換」だからです。 右側に内容を入力しない場合、一致するテキストは空白に置き換えられ、word文書から削除することに相当します。
2.正規表現は他の内容を誤って削除しませんか?
可能です。 たとえば、 [A-Z]{3} は、BOTだけではなく、連続した3文字すべての大文字にマッチします。 ELA、PDF、DOCなどの内容が文書に含まれている場合は、一致する可能性もあります。 そのため、処理する前に元のファイルをバックアップするか、少量のサンプル文書でルールをテストすることをお勧めします。
3.複数の異なる規則的な内容を同時に削除できますか?
いいですよ。 例では、キーワードリストに [A-Z]{3} と \ dの2つのルールを同時に入力して、3桁の大文字と数字を同時に削除します。 より多くの種類のコンテンツを削除する必要がある場合は、引き続き行ごとにルールを追加できます。
4. docファイルとdocxファイルの両方をこのように処理することはできますか?
この記事のスクリーンショットの例はdocxファイルです。 実際のバッチ処理では、ソフトウェア・インポートリストでサポートされているWordファイルタイプに応じて対応するファイルを選択できます。 重要なdoc、docxドキュメントの場合は、まずコピーしてから一括処理することをお勧めします。
5.処理後どのように結果をチェックしますか?
出力ディレクトリからいくつかの処理されたWordファイルをランダムに開いて、タイトル、本文、番号などの重要な位置を比較し、正規表現が目的の内容だけを削除し、他の重要な文字に影響を与えないことを確認することをお勧めします。
まとめ
複数のword文書に削除が必要な類似キーワードが大量に存在する場合、正規表現を使用して一括あいまいに削除することは、手動で1つずつ検索するよりもはるかに効率的である。 通過 HeSoft Doc Batch Tool の「Wordのキーワードを検索して置換」機能は、ファイルをインポートし、ファジー検索を選択し、正規表現を入力し、置換内容を空白にするだけです複数のdocx、docファイルのターゲットテキストを一括してクリーンアップできます。
Word資料を整理したり、番号を一括整理したり、コードの略語を削除したり、文書の内容を統一的に処理したりする必要がある場合は、まずテスト文書を用意し、正規ルールを検証してから一括して実行することをお勧めしますこれにより、効率が向上し、誤削除リスクも低減されます。