Word文書をAIへ渡す前にチェックしたい重要情報候補|AI投入前チェック補助ツール SIC v01
Word文書をChatGPTやClaudeなどのAIへ渡す前に、少し不安になることがあります。
この文書、このままAIに入れて大丈夫なのか。
メールアドレスや電話番号が残っていないか。
社内フォルダのパスや共有パスが入っていないか。
URLやローカルパスから、余計な情報が見えてしまわないか。
AIに文書を渡す作業は便利です。
報告書の要約、文章の整理、見出し作成、誤字チェック、説明文の下書きなど、Word文書とAIは相性がよい場面があります。
ただし、業務文書をそのままAIへ投入する前には、一度確認した方がよい情報があります。
そこで、Word文書をAIへ渡す前に、重要情報候補・注意情報候補を一覧化して確認するための補助ツールを作成しました。
ツール名は SIC v01|Word文書 AI投入前 情報チェック補助ツール です。
AIにWord文書をそのまま渡す前に確認したいこと
AIにWord文書を渡すとき、問題になるのは文章そのものだけではありません。
文書の中に、次のような情報が残っていることがあります。
- メールアドレス
- 電話番号
- 郵便番号
- URL
- ローカルパス
- 共有パス
- 社内フォルダ名
- 作業PCの保存場所
- 外部共有すべきでないリンク
- 業務上注意が必要な情報の手がかり
特に、業務文書では、過去資料をコピーして作ったり、社内共有フォルダ上で編集したり、メール添付用に整えたりすることがあります。
その過程で、本文内に思わぬ情報が残っている場合があります。
目視で確認したつもりでも、長いWord文書では見落としが起きます。
AI投入前に一度、候補だけでも一覧化して確認できると安心です。
SIC v01とは
SIC v01は、Word文書をAIサービスや外注先へ渡す前に、文書内に含まれる可能性のある重要情報候補・注意情報候補を確認するためのExcelマクロツールです。
初期版では、.docx のWord文書を対象にしています。
Word文書を選択してチェックを実行すると、検出された候補がExcelの CHECK_RESULT シートへ一覧表示されます。
SIC v01の目的は、文書を安全判定することではありません。
匿名化することでもありません。
個人情報や機密情報を完全に検出することでもありません。
あくまで、AI投入前・外注前に「一度、人間が確認するための候補一覧」を作る補助ツールです。
重要情報をAIへ投入するリスクは、見落としから始まる
AIに重要情報を入れるリスクは、必ずしも「明らかな秘密文書をそのまま送る」ような場面だけではありません。
実務では、もっと地味な形で起こります。
たとえば、次のようなケースです。
- Word本文の末尾に担当者のメールアドレスが残っていた
- 打合せメモ内に電話番号が残っていた
- 文書中に社内共有フォルダのパスが残っていた
- 過去資料からコピーしたURLが残っていた
- ローカルPCの保存先パスが文書内に入っていた
- 外注先へ渡す前の資料に不要な連絡先が残っていた
こうした情報は、1つ1つを見ると小さく見えるかもしれません。
しかし、AI投入前や外部共有前には、確認しておきたい情報です。
SIC v01は、そうした「見落としやすい候補」をまず一覧化するためのツールです。
無料版でチェックできる基本6種類
SIC v01の無料・機能制限版では、検出対象を基本6種類に絞っています。
対象は次のとおりです。
- メールアドレス
- 電話番号
- 郵便番号
- URL
- ローカルパス
- 共有パス
この6つは、Word文書をAIへ渡す前に、まず確認しておきたい基本情報候補です。
たとえば、メールアドレスや電話番号は、個人や担当者に関わる情報である可能性があります。
URLには、外部公開ページだけでなく、社内システムやASP、共有先につながる情報が含まれる場合があります。
ローカルパスや共有パスには、PCユーザー名、社内フォルダ構造、案件名、会社名などが含まれることがあります。
もちろん、検出されたものがすべて削除対象とは限りません。
必要な情報もあります。
だからこそ、自動削除ではなく、人間が確認する形式にしています。
CHECK_RESULTで候補を一覧確認する
SIC v01でWord文書をチェックすると、検出された候補は CHECK_RESULT シートに一覧表示されます。
一覧では、次のような情報を確認できます。
- 検出種別
- 検出された文字列
- 前後の文脈
- 確認優先度
- 推奨される確認アクション
- 人間確認欄
- ルールID
- メモ
重要なのは、検出結果を機械的に信じるのではなく、文脈を見て確認することです。
メールアドレスが検出されたとしても、それが公開窓口なら残してよい場合があります。
URLが検出されたとしても、公開ページなら問題ない場合があります。
一方で、社内共有パスやローカルパスが含まれている場合は、外部共有前に確認した方がよい場合があります。
SIC v01は、その判断をしやすくするために、候補を一覧化します。
人間確認欄で「消す・残す・渡さない」を判断する
SIC v01の CHECK_RESULT には、人間確認欄を用意しています。
選択肢は次のとおりです。
- 未確認
- 削除
- 置換
- 残す
- AI投入しない
- 対象外
この欄は、検出結果を確認した人が判断を残すためのものです。
たとえば、検出された電話番号を削除するのか。
別の表現に置換するのか。
公開情報として残すのか。
文書全体をAIへ投入しない判断にするのか。
候補ごとに、人間が確認して判断します。
AI投入前チェックで大事なのは、ツールが自動で結論を出すことではありません。
人間が確認する入口を作ることです。
自動匿名化・自動削除・自動置換は行いません
SIC v01は、検出した候補を自動で匿名化しません。
自動削除もしません。
自動置換もしません。
これは、文脈によって判断が変わるからです。
たとえば、メールアドレスが検出された場合でも、それが削除すべきものか、残すべきものかは文書の目的によって変わります。
URLも同じです。
外部公開ページのURLなら問題ない場合があります。
一方で、社内システムや共有フォルダにつながるURLなら、外部共有前に確認が必要な場合があります。
SIC v01は、判断を自動化するツールではありません。
候補を出して、人間が確認できる状態にするツールです。
実行時にAI/APIへ文書を送信しません
SIC v01は、実行時にAIや外部APIへWord文書を送信しません。
検出内容も外部送信しません。
処理は、利用者のローカル環境上で行います。
Excel VBAからWord文書のテキストを取得し、あらかじめ用意したregexルールに基づいて候補を検出します。
AIは、開発段階でregexルールの候補作成や仕様整理の支援として利用しています。
ツール実行時に、Word文書をAIへ送って解析するものではありません。
ここは、AI投入前チェックツールとして重要な点です。
AIに渡す前の確認をするために、確認対象そのものをAIへ送ってしまっては、本末転倒になる場合があります。
SIC v01は、ローカル環境上で候補を確認する補助ツールとして設計しています。
公開版ではregexルールの編集・追加には対応していません
SIC v01の無料公開版では、regexルールの編集・追加には対応していません。
公開版は、基本6種類の検出対象に限定した無料・機能制限版です。
対象は次の基本情報候補です。
- メールアドレス
- 電話番号
- 郵便番号
- URL
- ローカルパス
- 共有パス
業務名、発注者名、施設名、契約番号、社内用語などを検出対象に追加したい場合は、個別調整が必要です。
無料版は、まずAI投入前チェックの入口を作るための基本版です。
このツールでできないこと
SIC v01には、できないことがあります。
ここは誤解を避けるために、はっきり書いておきます。
SIC v01では、次のことには対応していません。
- 個人情報の完全検出
- 機密情報の完全検出
- 情報漏洩の防止保証
- AI投入可否の自動判定
- 自動匿名化
- 自動削除
- 自動置換
- PDFのチェック
- OCR
- 画像内文字のチェック
- Excel文書のチェック
.docや.docmのチェック- AI/API連携
- 公開版でのregexルール編集・追加
このツールは「安全にAIへ投入できる」と保証するものではありません。
検出結果は、あくまで確認候補です。
AI投入・外部共有の可否は、必ず利用者自身で判断してください。
対象ファイル
初期版で対象にしているのは、.docx のWord文書です。
対象外は次のとおりです。
.doc.docm- OCRが必要な文書
- 画像内文字
- Excel文書
- PowerPoint文書
- テキスト抽出できないファイル
まずは、Word文書のAI投入前チェックに対象を絞っています。
使い方
SIC v01の基本的な使い方は次のとおりです。
sic-tools_v1_0.xlsmを開く- Excelマクロを有効化する
- MENUシートからWord文書チェックを実行する
- 対象の
.docxファイルを選択する - チェック結果が
CHECK_RESULTシートに表示される - 検出候補を確認する
- 人間確認欄で「削除」「置換」「残す」「AI投入しない」などを判断する
チェック結果が出たら、候補を機械的に消すのではなく、文書の内容や共有先を踏まえて判断してください。
業務に応じた個別調整について
無料公開版は、汎用的な基本チェック版です。
一方で、実務では業種や会社によって、確認したい情報候補が変わります。
たとえば、建設コンサル実務では、次のような情報が注意情報候補になる場合があります。
- 業務名候補
- 発注者名候補
- 路線名候補
- 河川名候補
- 橋梁名候補
- 施設名候補
- 契約番号候補
- ASP URL
- 社内共有パス
- 元請名
- 顧客名
- 社内用語
ただし、こうした業務固有の情報は、会社や業務ごとにルールが変わります。
汎用ツールとして一律に入れると、誤検出が増えたり、逆に必要な候補を拾えなかったりします。
そのため、業務別・会社別の検出ルール調整は、個別相談として扱います。
自社文書や業務様式に合わせて、どの情報候補を確認したいかを整理し、必要に応じて検出ルールの調整を行う形です。
ダウンロード
SIC v01は、無料・機能制限版として公開しています。
ダウンロードをご希望の方は、以下のフォームからお申し込みください。
フォーム送信後に、ダウンロード案内をお送りします。
ご注意
ダウンロードしたExcelでマクロが実行できない場合は、
右クリック → プロパティ →「許可する」 をチェック後、再度開いてください。Windowsのセキュリティ機能により、初回実行時にマクロがブロックされる場合があります。
免責・注意事項
本ツールは、Word文書をAIサービスや外注先へ渡す前に、注意情報候補を確認するための補助ツールです。
検出対象は、メールアドレス、電話番号、郵便番号、URL、ローカルパス、共有パス等の基本情報候補です。
個人情報、機密情報、業務固有情報等を完全に検出するものではありません。
検出結果は確認候補であり、AI投入・外部共有の可否は必ず利用者自身で判断してください。
自動匿名化、自動削除、自動置換には対応していません。
実行時にAI/APIへ文書や検出内容を送信しません。
公開版では、検出ルールの編集・追加には対応していません。
まとめ
Word文書をAIへ渡す前には、文書内に重要情報候補や注意情報候補が残っていないかを確認した方が安全です。
メールアドレス、電話番号、郵便番号、URL、ローカルパス、共有パスなどは、目視確認だけでは見落とすことがあります。
SIC v01は、こうした基本情報候補を検出し、CHECK_RESULT シートへ一覧化するための無料ツールです。
ただし、完全検出を保証するものではありません。
情報漏洩防止ツールでも、匿名化ツールでもありません。
検出結果はあくまで確認候補です。
最終的にAIへ投入するか、外部へ共有するか、削除するか、置換するか、残すかは、利用者自身が判断してください。
AIを使う前に、まず文書内の注意情報候補を確認する。
SIC v01は、その入口を作るための小さな補助ツールです。
維持DXノートについて
維持DXノートでは、建設コンサル実務や土木実務で使うExcel・Word帳票、写真整理、成果品整理、AI投入前チェックを少し楽にするための実務メモや小さなツールを公開しています。
AIや外注を使う場面が増えるほど、文書を渡す前の確認、責任境界の整理、人間による最終判断が重要になります。
SIC v01も、その確認作業を補助するための小さな無料ツールです。
ダウンロードをご希望の方は、以下のフォームからお申し込みください。

