この記事では、オフィスソフトウェアのWord一括検索置換機能を使用して、複数のdocx、doc文書のキーワードを正規表現でファジーマッチさせ、置換内容を空白にして一括削除する方法を紹介します。 文書中の固定書式番号、英語の略語、数字、機密フィールドなどの重複内容を処理するのに適しており、Wordを一つずつ開いて手動で検索して削除しないようにし、一括文書の整理効率を高める。
大量のword文書を整理するとき、複数のdocxファイルやdocファイルに削除が必要なものが含まれているが、これらの内容は全く同じではない例えば、3桁の大文字の略語、連続した数字、番号、コード、コースマークなどです。 Word文書を一つずつ開いて手動で検索し、どこでも削除すると、時間がかかるだけでなく、削除を見逃しやすい。
この記事では、「正規表現を使って多くのWordのキーワードを一括して削除する」を例に、どのように利用するかを紹介します HeSoft Doc Batch Tool このようなオフィスソフトは、複数のWordファイルを一括検索して置き換えます。 「式をあいまいにしてテキストを検索」を選択し、 [A-Z]{3}、 \ dのようなルールを入力し、置換内容を空白のままにすることで、一致するコンテンツを一括削除できます。
適用シーン: 正規表現で一括削除するのに適したWordコンテンツ
正規表現は「内容は規則的だが、具体的なテキストは固定されていない」というWordキーワード削除タスクに適している。 一般的に固定語を探すよりも、正規表現は一度に1種類の内容にマッチできるので、一括勤務シーンに適している。
- 複数のword文書の連続した数字を一括して削除します。例えば、学番、番号、ページ内の番号、時間の数字などです。
- 3桁のコースコード、部門コード、ラベルコードなど、固定長の大文字の略語を一括削除します。
- Docx、docファイルでフォーマットは似ているが内容が異なるキーワードを一括削除します。
- ドキュメント内の機密情報、テンプレートの残りのフィールド、または表示する必要のないidを一括してクリーンアップします。
- フォルダ内の複数のWordファイルを一括処理して、重複して開く、検索、削除、保存する操作を減らします。
スクリーンショットのサンプルファイルには6つのword文書があり、ファイル名は1.docxから6.docxで、これらの文書の英語の略語と数字の一部をあいまいに削除する必要があります。
効果プレビュー: 処理前と処理後のWordコンテンツの変化
処理前: 複数のdocxファイルは統一的にキーワードを整理する必要があります。
処理する前に、フォルダに複数のword文書が含まれていたので、これらのdocxファイルに対してキーワード削除操作を一括して実行する必要がありました。 1つずつ処理を開くと、書類の数が多いほど、重複労働が顕著になる。

Word文書の1つを開くと、本文に削除する内容があることがわかります。 例えば、タイトルの先頭のBOT、および本文中の数字60などの内容は今回整理する対象です。

処理後: マッチした英語の略語と数字が一括削除されます。
処理が完了したら、word文書を開いてチェックすると、元のタイトルの3桁の大文字の略語が削除され、本文に一致する数字も削除されていることがわかります。 つまり、ソフトウェアは、ある固定語だけを削除するのではなく、正規表現のルールに従って、条件を満たす内容を一括して検索して削除する。

この方法は、「すべての連続した数字」「すべての3桁の大文字」「ある種類の番号形式」など、大量のWord文書の規則的なテキストを一括処理するのに特に適しています。
操作手順: 正規表現を使用してWordキーワードを一括あいまいに削除します
手順1: Wordツールに入り、「置換機能の検索」を選択します
開く HeSoft Doc Batch Tool を選択しますWordツール。 ツールリストで見つけてクリックします「Wordのキーワードを検索して置き換えます」。 この機能は、Wordファイルの内容を置き換えるキーワードを一括検索するために使用され、「空に置き換える」ことで一括削除することもできます。

このステップの目的は、Wordコンテンツ一括処理機能モジュールに入ることです。 Docx、docドキュメントのキーワードを一括削除する必要があるタスクでは、ファイル名、フォルダ名、PDFツールではなく、「置換Wordキーワードの検索」に関連するツールを選択する必要があります。
ステップ2: 一括処理が必要なWordファイルを追加する
機能ページに入ったら、ステップ1で「処理する記録を選択」中、クリック「ファイルを追加」を選択します。 ファイルが同じフォルダにまとめられている場合は、インタフェースの「フォルダからファイルをインポート」。

追加が完了すると、ファイル名、パス、拡張子、作成時間、変更時間などの情報がリストに表示されます。 スクリーンショットには6つのdocxファイルがインポートされています。 ファイルに誤りがないことを確認したら、下部のをクリックします。「次へ」処理オプション設定に入ります。
ステップ3: 「式を使用してテキストをあいまいに検索」を選択します
ステップ2では「処理オプションの設定」中、見つけます「検索方法」。 固定文字だけを削除する場合は、正確な検索を使用できますしかし、本論文の目標は、このようなキーワードを一括的に曖昧に削除することであるため、選択する必要がある「式を使用してテキストをあいまいに検索」。

ここでの「式ファジー検索テキスト」とは、正規表現ルールを使用してマッチングすると理解できる。 それはまったく同じではないが共通の法則を持つコンテンツを見つけるのに適しています。 たとえば、スクリーンショットでは、次の2つのルールが使用されています
- [A-Z]{3}: BOTのような3つの大文字のアルファベットにマッチします。
- \ D: 60、100、2026などの連続した数字にマッチします。
これらのルールは左側に記入されています「検索するキーワードのリスト」中です。 ソフトウェアは、リストのルールに従って、インポートされた複数のWordファイルの中で一致するものを一括検索します。
ステップ4: 置き換えたキーワードリストを空白のままにして、削除効果を実現します
右側にあります「置換後のキーワードリスト」エリア、インターフェースヒント「入力しない場合は削除」。 したがって、他の文字に置き換えるのではなく、一致するキーワードを削除することを目標としている場合は、置換内容を入力しないでください。
このステップは非常に重要です。左側はソフトウェアに「何を探しますか?」を教えます。右側が空白の場合は「見つけたら削除します。 例:
- 左側に [A-Z]{3} と入力し、右側に空白があります。一致する3桁の大文字の略語をすべて削除します。
- 左側に \ dと入力し、右側に空白: 一致する連続した数字をすべて削除します。
設定が完了したら、をクリックします「次へ」。 その後、ページフローに従って保存場所の設定を続け、処理を開始します。 処理が完了すると、一括削除されたword文書を出力場所でチェックできます。
よくある質問と注意事項
1.通常の検索ではなく正規表現を使用するのはなぜですか?
通常の検索では、ドキュメントごとに「テストテキスト」を削除するなど、まったく同じ固定テキストを削除するのに適しています。 しかし、すべての数字、すべての3桁の大文字、ある番号の書式など、削除する場合、通常の検索は効率的ではありません。 正規表現はルールに合わせてマッチさせることができ、Wordキーワードを一括曖昧に削除するのに適しています。
2.置換内容を空白にすると、テキスト全体が削除されますか?
できません。 置換リストを空白にすると、正規表現が一致する部分が削除されます。 例えば \ dは連続した数字だけにマッチし、通常は数字以外の文字は削除されません。 しかし、正規表現が広く書かれすぎると、期待以上に一致する可能性があるので、まず少量のファイルでテストすることをお勧めします。
3.docとdocxファイルを処理するときに注意する必要があることは何ですか?
この記事のスクリーンショットの例はdocxファイルです。 実際の処理では、処理するWordファイル形式がソフトウェアの現在の機能サポート範囲内にあるかどうかを確認し、できるだけバックアップファイルを使用して最初のテストを行うことをお勧めします。 一括処理する前に、元の文書のコピーを保持することは、より安全なオフィス習慣です。
4.正規表現の大文字と小文字は一致結果に影響しますか?
会 スクリーンショットの [A-Z]{3} は連続する3つの大文字のアルファベットにマッチし、小文字にマッチしないことを示しています。 大文字と小文字が異なるコンテンツを処理する必要がある場合は、実際のルールに基づいて式を調整する必要があります。 インタフェースにも用意されています「アルファベットの大文字と小文字を無視する」オプションは、クリーンアップの必要に応じてチェックするかどうかを決定します。
5.一括削除前にどのようにチェックすることをお勧めしますか?
まず1 ~ 2つのWordファイルを選んでテストし、削除効果が期待通りであることを確認してから、フォルダ全体を一括処理することをお勧めします。 特に \ dなどのルールを使用する場合は、すべての連続した数字と一致します。ドキュメントにページ番号、年、番号を保持する必要がある場合は、ルールを慎重に設定する必要があります。
まとめ: オフィスソフトでWordを一括処理し、重複削除作業を減らす
正規表現を使ってWordのキーワードを一括あいまいに削除することで、本来は1つずつ開いたり、1つずつ検索したり、1つずつ削除したりする必要がある重複作業を、1つの一括処理に変換することができる。 この方法は、docx、docファイルが大量に含まれるオフィスシーンでは、時間を大幅に節約し、手動で削除するリスクを軽減します。
Word文書に固定規則の数字、英語の略語、番号、機密フィールドがある場合は、を使用できます HeSoft Doc Batch Tool の「Wordのキーワードを検索して置き換えます」機能、式を選択してテキストをあいまいに検索し、正規表現を記入し、置換内容を空白にすると、一括削除が完了します。 少量のファイルでルールを検証してから、すべてのWordファイルを一括処理することをお勧めします。