FAQ資料の準備 — 回答精度を決める最重要ステップ

アフィリエイト広告を利用しています

このページの内容が役に立ったら X (旧twitter) でフォローして頂けると励みになります
挨拶や報告は無しで大丈夫です

Dify のアカウント作成と API キーの登録が完了しました。次は、チャットボットに「何を覚えさせるか」を決めて、資料を準備します。

チャットボットの回答精度は、この資料の質でほぼ決まります。AI モデルの性能や Dify の設定ももちろん大事ですが、そもそも「正しい答えが書かれた資料」がなければ、どんなに賢いモデルでもまともに答えられません。

この記事では、資料の整理方法、ファイル形式の選び方、AI が読みやすい書き方のコツをまとめています。

なお、本番では EC サイトの FAQ を対象にしますが、このシリーズでは自社の技術ブログ「Claude Code Lab」の記事(全15本)を題材にして手順を説明します。

どんな情報を覚えさせるか整理する

対象にする質問の範囲を決める

最初にやるべきは「チャットボットに何を答えさせるか」の範囲を決めることです。範囲が曖昧なまま資料を作り始めると、不要な情報まで詰め込んで回答精度が下がります。

今回の題材(Claude Code Lab)であれば、以下のように範囲を絞ります。

  • Claude Code の基本的な使い方や安全性に関する質問
  • 環境構築の手順に関する質問
  • 日常の開発サイクルに関する質問
  • 移行やバックアップに関する質問

本番の EC サイトであれば、「送料」「返品」「支払い方法」「配送日数」など、お客様から実際に多い質問のカテゴリに絞ることになります。

回答に必要な情報源を洗い出す

範囲が決まったら、回答の元になる情報源を洗い出します。情報源の種類によって、後の変換作業の手間が変わります。

情報源の種類変換の手間
FAQ ページよくある質問の一覧少ない(そのまま使える)
説明書・マニュアルWord の手順書、PDF の仕様書中程度(質問を抽出して変換)
ノウハウ記事ブログ記事、社内ドキュメント多い(質問を想定して変換)

今回の Claude Code Lab は「ノウハウ記事」に該当します。記事の内容を読み、読者が聞きそうな質問を想定して 1問1答の形式に変換していきます。

FAQ一覧をドキュメントにまとめる

1問1答の形式で書く

Dify のナレッジベースには、さまざまな形式のファイルをアップロードできます。そのまま長文のドキュメントとして登録することも可能ですが、回答精度を上げるなら すべてを1問1答の形式に変換して統一する のが最善です。

理由は3つあります。

  • チャンク分割で文脈が途中で切れるリスクがない
  • 1つの質問に対して1つの回答が明確に対応する
  • 検索時のヒット精度が上がる

ファイル形式は Markdown(.md) を推奨します。Dify がネイティブで対応しており、人間も読み書きしやすく、見出し(##)でカテゴリ分けもできます。

書き方は Q:A: のプレフィックスを付けるだけです。Dify にはチャンク分割の戦略として「Q&A」モードがあり、このプレフィックスを自動認識して1問1答の単位で区切ってくれます。

実際に作成した FAQ の例を示します。

## Claude Code の基本と安全性

Q: Claude Code とは何ですか?
A: Claude Code は、AIがターミナルでコマンドを直接実行する開発ツールです。
通常のAIチャットはコードを提案するだけですが、Claude Code はファイルの
作成・編集・削除やパッケージのインストールをAIが直接実行します。

Q: なぜ Claude Code の安全機能だけでは不十分なのですか?
A: Claude Code の安全機能はアプリケーション内部で完結しています。
フラグで無効化できますし、承認疲れで流してしまうこともあります。
OSのユーザー権限やネットワーク制限と組み合わせる「多層防御」が必要です。

カテゴリごとにファイルを分ける

FAQ の量が多い場合は、カテゴリごとにファイルを分けると管理しやすくなります。今回は以下の5ファイルに分けました。

ファイルカテゴリQ&A数
01-basics-and-safety.md基本と安全性・環境構成の選定15
02-environment-setup.mdUbuntu・ユーザー・SSH・リソース制限14
03-install-and-workflow.mdインストール・ワークフロー設定8
04-file-sync-and-dev.mdファイル同期・WordPress・開発ツール11
05-daily-dev-and-ops.md日常開発・新規プロジェクト・移行15

全15本の記事から、合計63問の FAQ を作成しました。カテゴリごとにファイルを分けることで、後から特定のカテゴリだけを差し替えたり、追加したりしやすくなります。

生成AIを使って変換する

63問の FAQ をゼロから手作業で書くのは大変です。実際には、元の記事を Claude などの生成 AI に読ませて「読者が聞きそうな質問と回答を Q: / A: 形式で抽出して」と指示するのが効率的です。

元の情報源が FAQ ページなら、ほぼそのまま使えます。説明書やノウハウ記事の場合は、AI に変換させた後に人間が内容を確認・修正します。AI が生成した回答に事実誤認がないか、情報が古くないかをチェックするのは必ず人間の作業です。

書き方のコツ — AIが読みやすい文章とは

FAQ の形式が整っていても、書き方が悪いとチャットボットの回答精度は上がりません。Dify の RAG で検索にヒットしやすく、LLM が正確に回答を生成しやすい書き方のコツを押さえておきます。

曖昧な表現を避ける

悪い例良い例
だいたい数日で届きます注文確定から3〜5営業日で届きます
場合によっては返品できます未開封・未使用の場合、商品到着後7日以内であれば返品できます
高スペックなPCが必要ですCPU 2〜4コア、RAM 4〜8GB で十分です

チャットボットは FAQ の文面をもとに回答を生成します。元の文面が曖昧だと、チャットボットの回答も曖昧になります。

具体的な数値・条件を明記する

FAQ では「何が」「いつ」「いくらで」「どういう条件で」を具体的に書きます。特に以下の情報は、お客様が最も知りたい部分です。

  • 金額(送料、手数料、最低注文金額)
  • 期間(配送日数、返品期限、キャンセル可能期間)
  • 条件(返品の条件、無料配送の条件、会員登録の条件)
  • 手順(返品の手順、問い合わせ先の電話番号やメールアドレス)

1問に1トピック

1つの Q&A に複数の話題を詰め込まないようにします。「送料と返品について教えてください」のような質問があったとしても、FAQ 側では送料と返品を別々の Q&A に分けておきます。Dify の検索精度が上がり、回答がピンポイントになります。

回答は自己完結させる

他の Q&A を読まなくても意味が通る回答にします。「詳しくは上記をご参照ください」のような書き方は、チャットボットの文脈では機能しません。必要な情報はその回答の中にすべて含めます。

この作業が回答精度の8割を決める

ここまでの作業は地味ですが、チャットボットの回答精度はこの FAQ 資料の質で8割決まると考えています。

Dify の RAG は「質問に関連する FAQ を探して、LLM に渡す」という仕組みです。どんなに優秀な LLM を使っても、渡された FAQ に正しい情報がなければ正確には答えられません。逆に、FAQ さえしっかり整備されていれば、安価なモデル(GPT-5.4 nano)でも十分な回答品質が得られます。

次の記事では、ここで作成した FAQ ファイルを Dify のナレッジベースにアップロードし、検索テストを行います。