FAQ資料の準備 — 回答精度を決める最重要ステップ
篠原 隆司
アフィリエイト広告を利用しています
このページの内容が役に立ったら X (旧twitter) でフォローして頂けると励みになります
挨拶や報告は無しで大丈夫です
Dify のアカウント作成と API キーの登録が完了しました。次は、チャットボットに「何を覚えさせるか」を決めて、資料を準備します。
チャットボットの回答精度は、この資料の質でほぼ決まります。AI モデルの性能や Dify の設定ももちろん大事ですが、そもそも「正しい答えが書かれた資料」がなければ、どんなに賢いモデルでもまともに答えられません。
この記事では、資料の整理方法、ファイル形式の選び方、AI が読みやすい書き方のコツをまとめています。
なお、本番では EC サイトの FAQ を対象にしますが、このシリーズでは自社の技術ブログ「Claude Code Lab」の記事(全15本)を題材にして手順を説明します。
【広告】 XServer VPS には Dify のアプリイメージが用意されています。
VPS上に独立した Claude Code 環境を簡単に構築することができます。
VPSでいろいろ試すなら『XServer VPS』
どんな情報を覚えさせるか整理する
対象にする質問の範囲を決める
最初にやるべきは「チャットボットに何を答えさせるか」の範囲を決めることです。範囲が曖昧なまま資料を作り始めると、不要な情報まで詰め込んで回答精度が下がります。
今回の題材(Claude Code Lab)であれば、以下のように範囲を絞ります。
- Claude Code の基本的な使い方や安全性に関する質問
- 環境構築の手順に関する質問
- 日常の開発サイクルに関する質問
- 移行やバックアップに関する質問
本番の EC サイトであれば、「送料」「返品」「支払い方法」「配送日数」など、お客様から実際に多い質問のカテゴリに絞ることになります。
回答に必要な情報源を洗い出す
範囲が決まったら、回答の元になる情報源を洗い出します。情報源の種類によって、後の変換作業の手間が変わります。
| 情報源の種類 | 例 | 変換の手間 |
|---|---|---|
| FAQ ページ | よくある質問の一覧 | 少ない(そのまま使える) |
| 説明書・マニュアル | Word の手順書、PDF の仕様書 | 中程度(質問を抽出して変換) |
| ノウハウ記事 | ブログ記事、社内ドキュメント | 多い(質問を想定して変換) |
今回の Claude Code Lab は「ノウハウ記事」に該当します。記事の内容を読み、読者が聞きそうな質問を想定して 1問1答の形式に変換していきます。
FAQ一覧をドキュメントにまとめる
1問1答の形式で書く
Dify のナレッジベースには、さまざまな形式のファイルをアップロードできます。そのまま長文のドキュメントとして登録することも可能ですが、回答精度を上げるなら すべてを1問1答の形式に変換して統一する のが最善です。
理由は3つあります。
- チャンク分割で文脈が途中で切れるリスクがない
- 1つの質問に対して1つの回答が明確に対応する
- 検索時のヒット精度が上がる
ファイル形式は Markdown(.md) を推奨します。Dify がネイティブで対応しており、人間も読み書きしやすく、見出し(##)でカテゴリ分けもできます。
書き方は Q: と A: のプレフィックスを付けるだけです。Dify にはチャンク分割の戦略として「Q&A」モードがあり、このプレフィックスを自動認識して1問1答の単位で区切ってくれます。
実際に作成した FAQ の例を示します。
## Claude Code の基本と安全性
Q: Claude Code とは何ですか?
A: Claude Code は、AIがターミナルでコマンドを直接実行する開発ツールです。
通常のAIチャットはコードを提案するだけですが、Claude Code はファイルの
作成・編集・削除やパッケージのインストールをAIが直接実行します。
Q: なぜ Claude Code の安全機能だけでは不十分なのですか?
A: Claude Code の安全機能はアプリケーション内部で完結しています。
フラグで無効化できますし、承認疲れで流してしまうこともあります。
OSのユーザー権限やネットワーク制限と組み合わせる「多層防御」が必要です。
カテゴリごとにファイルを分ける
FAQ の量が多い場合は、カテゴリごとにファイルを分けると管理しやすくなります。今回は以下の5ファイルに分けました。
| ファイル | カテゴリ | Q&A数 |
|---|---|---|
| 01-basics-and-safety.md | 基本と安全性・環境構成の選定 | 15 |
| 02-environment-setup.md | Ubuntu・ユーザー・SSH・リソース制限 | 14 |
| 03-install-and-workflow.md | インストール・ワークフロー設定 | 8 |
| 04-file-sync-and-dev.md | ファイル同期・WordPress・開発ツール | 11 |
| 05-daily-dev-and-ops.md | 日常開発・新規プロジェクト・移行 | 15 |
全15本の記事から、合計63問の FAQ を作成しました。カテゴリごとにファイルを分けることで、後から特定のカテゴリだけを差し替えたり、追加したりしやすくなります。
生成AIを使って変換する
63問の FAQ をゼロから手作業で書くのは大変です。実際には、元の記事を Claude などの生成 AI に読ませて「読者が聞きそうな質問と回答を Q: / A: 形式で抽出して」と指示するのが効率的です。
元の情報源が FAQ ページなら、ほぼそのまま使えます。説明書やノウハウ記事の場合は、AI に変換させた後に人間が内容を確認・修正します。AI が生成した回答に事実誤認がないか、情報が古くないかをチェックするのは必ず人間の作業です。
書き方のコツ — AIが読みやすい文章とは
FAQ の形式が整っていても、書き方が悪いとチャットボットの回答精度は上がりません。Dify の RAG で検索にヒットしやすく、LLM が正確に回答を生成しやすい書き方のコツを押さえておきます。
曖昧な表現を避ける
| 悪い例 | 良い例 |
|---|---|
| だいたい数日で届きます | 注文確定から3〜5営業日で届きます |
| 場合によっては返品できます | 未開封・未使用の場合、商品到着後7日以内であれば返品できます |
| 高スペックなPCが必要です | CPU 2〜4コア、RAM 4〜8GB で十分です |
チャットボットは FAQ の文面をもとに回答を生成します。元の文面が曖昧だと、チャットボットの回答も曖昧になります。
具体的な数値・条件を明記する
FAQ では「何が」「いつ」「いくらで」「どういう条件で」を具体的に書きます。特に以下の情報は、お客様が最も知りたい部分です。
- 金額(送料、手数料、最低注文金額)
- 期間(配送日数、返品期限、キャンセル可能期間)
- 条件(返品の条件、無料配送の条件、会員登録の条件)
- 手順(返品の手順、問い合わせ先の電話番号やメールアドレス)
1問に1トピック
1つの Q&A に複数の話題を詰め込まないようにします。「送料と返品について教えてください」のような質問があったとしても、FAQ 側では送料と返品を別々の Q&A に分けておきます。Dify の検索精度が上がり、回答がピンポイントになります。
回答は自己完結させる
他の Q&A を読まなくても意味が通る回答にします。「詳しくは上記をご参照ください」のような書き方は、チャットボットの文脈では機能しません。必要な情報はその回答の中にすべて含めます。
この作業が回答精度の8割を決める
ここまでの作業は地味ですが、チャットボットの回答精度はこの FAQ 資料の質で8割決まると考えています。
Dify の RAG は「質問に関連する FAQ を探して、LLM に渡す」という仕組みです。どんなに優秀な LLM を使っても、渡された FAQ に正しい情報がなければ正確には答えられません。逆に、FAQ さえしっかり整備されていれば、安価なモデル(GPT-5.4 nano)でも十分な回答品質が得られます。
次の記事では、ここで作成した FAQ ファイルを Dify のナレッジベースにアップロードし、検索テストを行います。
【広告】 XServer VPS には Dify のアプリイメージが用意されています。
VPS上に独立した Claude Code 環境を簡単に構築することができます。
VPSでいろいろ試すなら『XServer VPS』
このページの内容が役に立ったら X (旧twitter) でフォローして頂けると励みになります
本ページの内容は可能な限り正確な情報を提供するよう努めていますが、内容の正確性・最新性・安全性を保証するものではありません。本情報を利用して生じたいかなる損害についても、当方は一切の責任を負いません。実施にあたっては必ずご自身の判断と自己責任にてお願いいたします。