ブログ目次
「リードは月に数百件獲得できているが、どのリードに優先的にアプローチすべきかわからない」「スコアリングを設計したが、閾値の設定が感覚的で、本当にこの基準で合っているのか自信がない」「営業が自分の勘でリードを選別していて、組織としてのリード対応が属人化している」——こうした課題は、リードの量が増えてきたBtoB企業で頻繁に聞かれます。
リードスコアリング自体は新しい概念ではありませんが、従来のルールベーススコアリング(人間が設定した条件でポイント加算)には限界があります。担当者の経験則に依存するため、設計者が変わるとモデルが崩れる。市場環境の変化に追従しにくい。そして、人間が気づかない「商談化する人の行動パターン」を見落としてしまう。
AI予測リードスコアリングとは、CRMに蓄積された過去の商談化データをAIが学習し、新しいリードの商談確度を自動的に判定する仕組みです。本記事では、AI予測リードスコアリングの設計思想から、特徴量設計、閾値チューニング、CRM/HubSpotでの実装方法までを解説します。
この記事でわかること
- AI予測リードスコアリングとルールベーススコアリングの違い
- AI予測スコアリングの仕組みと必要なデータ基盤
- 特徴量設計の考え方と具体的なデータ項目
- 閾値の設定方法とチューニングの進め方
- HubSpotでのAI予測リードスコアリング実装方法
- AIスコアリングの運用・改善サイクル
AI予測リードスコアリングとは?
AI予測リードスコアリングとは、CRMに蓄積された過去データ(商談化したリードと商談化しなかったリードの属性・行動パターン)をAIが機械学習で分析し、新しいリードの商談化確率を自動算出する仕組みです。ルールベース(人が条件を設定)ではなく、データドリブン(AIがパターンを発見)でスコアリングモデルを構築する点が大きな違いです。
なぜAI予測スコアリングが重要なのか
ルールベーススコアリングの限界
ルールベーススコアリングは「料金ページ閲覧 +15点」「部長以上 +10点」のように、人間が設定したルールでスコアを加算します。この方式にはメリットもありますが、以下の限界があります。
| ルールベースの限界 | AI予測での改善 |
|---|---|
| 設計者の経験に依存する | データから客観的にパターンを発見 |
| 新しい行動パターンに対応しにくい | モデル再学習で自動的に追従 |
| 複数変数の交互作用を捉えにくい | 多変量の非線形関係を自動検出 |
| 閾値の根拠が感覚的になりがち | 確率値(0〜100%)で定量的に出力 |
例えば、「従業員50名以下の製造業で、ブログ記事を3回以上閲覧し、かつ料金ページを見ていないリードが、意外と商談化率が高い」というパターンは、人間のルール設計では見落としやすいものです。AIはこうした複合的なパターンをデータから自動的に発見します。
ただし万能ではない
AI予測スコアリングは万能ではありません。過去データに基づく予測であるため、「過去に経験のないタイプのリード」(新規市場、新プロダクト)に対しては精度が落ちます。また、学習に十分なデータ量が必要で、商談化の実績が少ない(目安: 100件未満)段階ではAI予測よりもルールベースの方が実用的です。
AI予測スコアリングの設計フレームワーク
ステップ1:データ基盤の整備
AI予測スコアリングの精度は、CRMのデータ品質に直結します。「ゴミを入れればゴミが出る」——この原則はAIにおいても不変です。
データ基盤整備のチェック項目:
- コンタクト・会社データの重複排除と名寄せが完了しているか
- 商談化/非商談化のステータスが正確に記録されているか
- リードの行動データ(ページ閲覧、メール反応、フォーム送信)がCRMに蓄積されているか
- データの欠損率が高い項目(フィルレートが低い項目)を把握しているか
HubSpotの場合、「データ品質コマンドセンター」でプロパティのフィルレート(記入率)を確認できます。フィルレートが50%未満のプロパティは特徴量として使うのが難しいため、入力率を上げる施策(必須項目化、スマートプロパティでの自動入力等)を先に行う必要があります。
ステップ2:特徴量の設計
特徴量とは、AIモデルが予測に使うデータ項目のことです。リードスコアリングの特徴量は、大きく4カテゴリに分類されます。
| カテゴリ | 具体的な特徴量 | 重要度(一般的な傾向) |
|---|---|---|
| 行動データ | ページ閲覧数、閲覧ページの種類、メール開封率、資料DL回数、フォーム送信回数 | 高 |
| エンゲージメント | 最終接触からの経過日数、過去30日の接触回数、セッション数 | 高 |
| 属性データ | 業種、従業員数、役職、地域、流入チャネル | 中 |
| ソースデータ | 最初の流入チャネル(自然検索/広告/紹介)、キャンペーン参加履歴 | 中 |
ここで結構ミソになってくるのが、行動データの「質」です。単純な「ページ閲覧数」よりも、「どのページを閲覧したか」の方が予測力が高いです。例えば、料金ページや事例ページの閲覧は商談化との相関が強く、ブログの一般的な記事閲覧は相関が弱い傾向にあります。ページをカテゴリ分類し、カテゴリ別の閲覧回数を特徴量にすることで、予測精度が向上します。
ステップ3:モデル構築と学習
AIモデルの構築方法は、大きく2つのアプローチがあります。
| アプローチ | 方法 | メリット | デメリット |
|---|---|---|---|
| CRM内蔵AI | HubSpotの予測リードスコアリング等 | 設定が簡単、CRMと自動統合 | カスタマイズ性が限定的 |
| 外部MLモデル | Python (scikit-learn等) + BigQuery | 完全なカスタマイズ、高精度 | 構築・運用に技術リソースが必要 |
多くのBtoB企業にとっては、CRM内蔵AIでのスタートが現実的です。HubSpotの予測リードスコアリング(Professional以上)は、CRMの過去データを自動的に学習し、0〜100のスコアを算出します。カスタマイズの幅は限定的ですが、運用負荷が低く、CRMとシームレスに統合されている点がメリットです。
データサイエンティストを社内に持つ企業や、より高精度なモデルを求める場合は、CRMデータをBigQueryやSnowflakeにエクスポートし、独自のMLモデルを構築するアプローチも選択肢です。
ステップ4:閾値の設定とチューニング
AIが算出したスコアを基に「MQL」と判定する閾値を設定します。
閾値設定の考え方:
- まず仮の閾値(例: スコア上位20%をMQLとする)を設定
- 1〜2ヶ月運用し、MQL化したリードの実際の商談化率を測定
- 商談化率が目標(例: 15%以上)を下回るなら閾値を上げる(MQLを絞り込む)
- 営業のリード対応キャパシティに余裕があるなら閾値を下げる(MQLを増やす)
| 閾値の調整 | 効果 | トレードオフ |
|---|---|---|
| 閾値を上げる | MQLの質が向上、商談化率UP | MQL数が減少、機会損失のリスク |
| 閾値を下げる | MQL数が増加、カバレッジ拡大 | MQLの質が低下、営業の負荷増 |
この調整は一度で完了するものではなく、月次でスコア分布と商談化率の相関を確認しながら継続的にチューニングします。最初の3ヶ月は「調整期間」と割り切って、データを蓄積しながら最適な閾値を探すのがよいかなと思います。
ステップ5:ルールベースとAI予測の併用
実運用では、ルールベーススコアリングとAI予測スコアリングを併用するのが効果的です。
- ルールベース: 営業が「これは確実に重要」と明確に判断できる条件(例: 料金ページ閲覧+資料DL+役職が部長以上)を明示的にスコアリング
- AI予測: 人間が気づきにくい行動パターンの組み合わせをAIが自動検出
両方のスコアを比較することで、ルールベースでは高スコアだがAI予測では低スコアのリード(=ルール設計の見直し余地あり)や、逆のケース(=AIが発見した新パターン)を発見できます。
CRM/HubSpotでの実装
HubSpotでの予測リードスコアリング設定
HubSpotの予測リードスコアリング機能(Professional以上)の設定手順:
- 「設定」→「プロパティ」→「予測リードスコアリング」を有効化
- HubSpotが自動的にCRMの過去データを学習(コンタクト数が一定以上必要)
- 各コンタクトに「コンバージョンの可能性」スコア(0〜100)が付与される
- このスコアを基にワークフローで自動アクション(MQL化、通知、タスク作成)を設定
加えて、手動のスコアリングプロパティも併用します。
- 「HubSpotスコア」プロパティで行動+属性のルールベーススコアリングを設定
- 「コンバージョンの可能性」(AI予測)と「HubSpotスコア」(ルールベース)をダッシュボードで並行監視
- 両スコアの相関を月次で分析し、ルール設計の改善に活用
ワークフローとの連携
AIスコアリングの結果をCRMのワークフローに組み込むことで、スコアリングが「分析ツール」から「営業アクションのトリガー」に変わります。
- スコアが閾値を超えた → ライフサイクルステージをMQLに自動変更 → IS担当に通知 → タスク自動作成
- スコアが急上昇した(過去7日間で20点以上上昇)→ 営業にリアルタイム通知(「このリードの検討が加速しています」)
- スコアが低下した → ナーチャリングシナリオに自動再登録
注意点・よくある失敗パターン
失敗1:データ量が不足した状態でAIモデルを構築する
AI予測スコアリングの精度を出すには、最低でも商談化の実績が100件以上あることが望ましいです。それ未満の段階では、ルールベーススコアリングで運用しながらデータを蓄積し、十分なデータが溜まった段階でAI予測に移行するのが現実的です。
失敗2:スコアを営業に「押し付ける」
AIスコアが高いリードを営業に「このリードを優先してください」と一方的に指示しても、営業が信頼しなければ活用されません。まずは一定期間、AIスコアと実際の商談化結果を比較し、「AIスコア上位20%のリードは、それ以外の3倍商談化率が高い」といった実績データを示すことで、営業の信頼を獲得します。
失敗3:一度構築して放置する
市場環境やプロダクトの変化に伴い、「商談化しやすいリードのパターン」も変わります。AI予測モデルは定期的(四半期〜半年に1回)に再学習させ、精度をモニタリングする運用が必要です。HubSpotの内蔵AIは自動的に再学習されますが、外部モデルの場合は手動でのリトレーニングが必要です。
失敗4:スコアリングだけで完結してしまう
スコアリングは「優先順位の可視化」であり、「フォロープロセスの設計」と組み合わせて初めて価値が出ます。高スコアリードに対するフォローの手順(誰が、何時間以内に、何をするか)まで設計してください。
まとめ
AI予測リードスコアリングの設計は、以下の流れで進めます。
- CRMのデータ品質を整備する(名寄せ・重複排除・入力率向上)
- 特徴量を設計する(行動データを重視、ページカテゴリ別に分析)
- CRM内蔵AI(HubSpot予測スコアリング)でまずスタートする
- ルールベースとAI予測を併用し、両方のスコアを比較分析する
- 閾値を仮設定し、1〜2ヶ月の運用データで調整する
- ワークフローと連携し、スコアを営業アクションのトリガーにする
- 四半期ごとにモデル精度をレビューし、改善サイクルを回す
まずはCRMのデータ品質整備から始めて、ルールベーススコアリングで基盤を構築し、データが蓄積されてからAI予測を追加するという段階的なアプローチをおすすめします。スコアリングの精度は一朝一夕で上がるものではなく、データの蓄積と継続的な改善の積み重ねが重要です。
よくある質問(FAQ)
Q. AI予測リードスコアリングに必要なデータ量はどのくらいですか?
HubSpotの予測リードスコアリングの場合、コンタクト数が一定数以上(公式には非公開ですが、目安として商談化実績100件以上、全コンタクト1,000件以上)あると精度が出やすくなります。
Q. ルールベーススコアリングだけでは不十分ですか?
不十分ではありません。リード数が月200件以下で、営業チームが各リードを個別に確認できる規模であれば、ルールベースで十分機能します。リード数が月300件を超え、営業の対応が追いつかなくなった段階でAI予測の導入を検討するのが適切なタイミングです。
Q. AI予測スコアリングの精度はどう評価しますか?
一般的にはAUC(Area Under the Curve)やPrecision-Recall曲線で評価しますが、実務的には「AIスコア上位20%のリードの商談化率が、全体平均の何倍か」を見るのが直感的です。2倍以上であれば実用レベル、3倍以上であれば優秀なモデルと判断できます。
Q. HubSpotの予測スコアリングとSalesforce Einstein Lead Scoringはどう違いますか?
基本的な仕組みは同じ(CRMデータを学習して商談化確率を予測)ですが、HubSpotの場合はMA・SFAが統合されているためマーケティング行動データもシームレスに学習対象となる点が強みです。Salesforceの場合はPardotなどのMAツールとの連携設定が別途必要になるケースがあります。
株式会社StartLinkは、事業を推進するためのHubSpot導入、また生成AIの社内業務への反映などのHubSpot×AI活用のご相談を受け付けております。 最近では、HubSpotを外部から操作するAIエージェント活用や、HubSpot内で使えるAI機能などのご相談をいただくことも増えてきており、サービスのプランについてご相談/お見積もり依頼があればお気軽にお問い合わせくださいませ。 無料のお問い合わせページより、お気軽にご連絡いただけます。
その他、HubSpot の設計の考え方や構築方法などをご紹介した YouTube チャンネルも運営しておりますので、社内の HubSpot 研修や HubSpot をこれから導入され、導入を検討されている企業様は、ぜひ一度ご確認いただいて、イメージをつかんでいただければなと思います。 すべて無料で公開しておりますので、こちらのYoutubeチャンネルを、ぜひチェックしてみてください!
関連キーワード:
サービス資料を無料DL
著者情報
今枝 拓海 / Takumi Imaeda
株式会社StartLinkの代表取締役。
HubSpotのトップパートナーである株式会社H&Kにて、HubSpotのCRM戦略/設計/構築を軸として、 国内・外資系エンタープライズ企業へコンサルティング支援を実施。
パーソルホールティングス株式会社にて、大規模CRM/SFA戦略の策定・PERSOLグループ横断のグループAI戦略/企画/開発ディレクションの業務を遂行経験あり。
株式会社StartLinkでは、累計100社以上のHubSpotプロジェクト実績を元にHubSpot×AIを軸にした経営基盤DXのコンサルティング事業を展開。