Skip to main content

データに対するインサイトを検証する

学習の目的

この単元を完了すると、次のことができるようになります。

  • データインサイトとは何かを説明する。
  • Einstein Discovery で生成されるデータインサイトの種別を定義する。
  • データインサイトを操作して解釈する。

データインサイトとは?

インサイトとは、データから判明した情報です。モデルバージョンを作成すると、Einstein Discovery でデータが綿密に分析され、その分析を基にインサイトが生成されます。 

Einstein Discovery では、公平かつ客観的で統計的に意味のあるインサイトが瞬時に生成されます。インサイトのグラフと事実に基づく説明により、簡単に読み取って解釈することができます。インサイトは、モデルの説明変数とその目標の関係を調べる出発点になります。数々のインサイトにざっと目を通すだけで、改善すべき結果と関連性が最も高い情報を見つけることができます。

インサイトの種別

Einstein Discovery では次の種別のインサイトが生成されます。

種別 説明

説明的

統計分析を伴う記述的分析を使用して、履歴データから導出されます。説明的インサイトは、データでが起こったのかを示します。

診断的

モデルから導出されます。診断的インサイトはなぜ起こったのかを示します。診断的インサイトを掘り下げれば、分析している結果への寄与が顕著な変数を把握できます。 


メモ: なぜという用語は、データの明白なパターンを意味し、必ずしも因果関係を表すわけではありません。

比較

モデルから導出されます。比較インサイトは、特定の 2 つのサブグループを比較して、結果変数の差異を説明します。比較インサイトでは、要素 (カテゴリまたはバケット) を他と切り離し、結果への影響を他の要素やグローバル平均と比較します。この比較は滝グラフで視覚化されます。

データインサイトを表示する

左のナビゲーションパネルで [データインサイト] をクリックします。Einstein Discovery にデータインサイト画面が表示されます。 

ストーリーツールバー、変数パネル、ストーリーバージョンの概要、インサイト概要パネルにコールアウトが示されているデータインサイト画面の例

  • モデルの概要 (1) には、モデルの目標、分析された行の合計数、結果の平均、以前のバージョンとの差が示されます。[Explore a Variable (変数を探索)] ボタンで変数パネルを切り替えます。
  • 変数パネル (2) には、モデルの説明変数が、モデルの結果との相関関係が高い順に示されます。相関係数 (パーセント値) が高いほど、統計的な結び付きが強いことになります。この例のモデルの場合、商談成立と相関関係が最も高いのは商談種別で、リードソースと業種がそれに続いています。
  • インサイト概要パネル (3) には、結果変数に対する上位の肯定的な影響と否定的な影響が示されます。このモデルで、商談成立率が最大になるのは、リードソースが「パートナー紹介」で、商談種別が「新規商談/追加商談」の場合です。商談成立率が最低になるのは、商談種別が「既存の商談」で、金額が 21,810 未満の場合です。この場合は、観測された成立率が 0.8% で、1,000 件の商談のうち成立するのがわずか 8 件程度であることを意味します。

ここからは、Einstein Discovery で生成される各種のインサイトを順番に見ていきます。この単元では、説明的、診断的、比較の各インサイトについて説明します。 

説明的インサイトを検証する

最初に表示されるインサイトは説明的インサイトで、説明的インサイトはプライマリインサイトです。説明的インサイトは、データセットの統計分析に基づき、結果に寄与した要因の概要を示すものです。Einstein Discovery では、棒グラフを使用して値の違い、トレンド、有意性を示します。

インサイト概要の先までスクロールダウンすると、説明的インサイトリストで 1 つ目のインサイトを確認できます。インサイトは統計的に有意な順に示されます。上位のインサイトほどモデルの結果に強く影響しています。 

タイトル、グラフ、説明テキストにコールアウトが付いているインサイト画面の例

各インサイトに次の情報が示されます。

  • 測定された内容のタイトル (1)
  • 結果を視覚化したグラフ (2)
  • 結果とデータセット内の他の変数との相互関係を説明する説明テキスト (3)

Einstein に目標 (商談成立件数の最大化) を指定したため、各インサイトにその目標に関する何らかの基準を上回ったか下回ったかが示されます。緑の丸の矢印は、目標に近づいていることを示します。赤の丸の矢印は、目標から遠ざかっていることを示します。

このインサイトには、商談種別の中で「新規商談/追加商談」の成立率が一番高く、「既存の商談」が一番低いことが示されています。

グラフでは、バーにマウスポインターを置くと、詳細なデータがポップアップ表示されます。 グラフのバーにマウスポインターを置くと、統計的詳細のポップアップが表示される

説明テキストでは、ハイパーリンクにマウスポインターを置くと、グラフの対応するバーが別の色で強調表示されます。 説明テキストの関連するハイパーリンクにマウスポインターを置くと、グラフのバーの色が変化する。

必要に応じて、リストの他の説明的インサイトにスクロールダウンして確認します。 

1 つの変数をドリルダウンする (一次インサイト)

インサイトリストを絞り込むには、変数パネルの [商談 種別] をクリックします。 

インサイトリストに、商談種別に関連付けられているインサイトのみが表示されます。インサイトの上にある絞り込みセレクターに、調査している変数が表示されます。 インサイトの絞り込みセレクター

リストの 1 つ目のインサイトに、商談種別が結果とどのように関連しているかが示されます。この情報は、変数に関連付けられているすべての値の概要です。説明的インサイトの場合、この情報を一次インサイトといいます。1 つの変数 (商談種別) によって結果変数 (IsWon TRUE) の変動がどのように説明されるかを検証するものであるためです。

サブグループを検証する (二次インサイト)

リストの次のインサイトまでスクロールダウンします。 二次インサイトの例

このインサイトは、変数の組み合わせ (サブグループ) が結果変数にどのように関連しているかを示します。この例では、リードソース [Phone Inquiry (電話照会)] が他のリードソースよりも劣っていて、特にアドオン商談で結果が悪いことがわかります。グラフでは各商談種別について電話照会 (青の縦棒) が他のすべてのリードソース (グレーの縦棒) と比較されています。この結果から、売り込み電話は新しいビジネスを生み出す方法として効果的でないことがわかります。

必要に応じて、リストをスクロールダウンして他のインサイトを検証します。続いて、診断的インサイトを詳しく見ていきます。

診断的インサイトを検証する

説明的インサイトから何が起こったのかがわかるのに対し、診断的インサイトからはなぜ起こったのかを知ることができます。診断的インサイトは、結果につながった要素を解明する場合に役立ちます。Einstein Discovery では、モデルの作成時に生成されるモデルから診断的インサイトが導出されます。診断的インサイトは滝グラフで視覚化されます。

メモ: なぜという用語は、データの明白なパターンを意味し、必ずしも因果関係を表すわけではありません。

診断的インサイトを表示するには、変数パネルから変数 ([リードソース]) を選択し、[値を選択] で、その変数の値 ([Partner Referral (パートナー紹介)]) を選択します。 [リードソース] カテゴリ-を選択。

Einstein に選択した値のパフォーマンスの概要が示されます。 選択したサブグループのパフォーマンスの概要

次に、リードソースが「パートナー紹介」である場合の診断的インサイトが示されます。 リードソースが「パートナー紹介」である場合の診断的インサイト

この滝グラフには情報が満載されています。順番に見ていきましょう。

まず青いバーから始めましょう。

  • 一番上に表示されているのはグローバル平均です。これは、すべての変数と値の平均です。
  • 一番下に表示されているのは選択した変数と値の平均です。これは、グローバル平均と比較した差 (正味の効果) を示しています。

次に、その間に表示されている緑と赤のバーを見てみましょう。これは特定の寄与要因 (個別の効果) で、個々の要素または要素グループが結果にどのように関連しているかを示します。緑のバーは改善を表し、赤いバーは悪化を表しています。

  • 関連する小項目は、選択した項目と相互作用しているが、それまでに表示された他のバーには含まれないすべての項目の集積効果です。選択した変数の結果に影響を及ぼす要素は多数存在しますが、このグラフにすべてを示すことはできません。そのため、影響が最大のものだけが表示され、残りの影響は小項目にまとめられます。このように表示する理由は、次の 2 つのグループと区別するためです。
  • 説明不能は、このモデルでは各種の要因に起因することが説明できないギャップを定量化したものです。診断的インサイトの寄与要因を集約すると、LeadSource が「パートナー紹介」の場合に観測された結果とグローバル平均間のギャップが説明されます。予測モデルではこうした寄与要因が生成される点に注意します。どのモデルも完璧ではないということです。説明不能が 0 の場合、このモデルによって LeadSource が「パートナー紹介」の場合の成立率が常に完璧に予測されることを意味しますが、現実的ではなく、モデルが過剰適合している可能性があります!

ここで学べることはまだまだたくさんありますが (寄与要因にマウスポインターを置いてさまざまなスコアを参照してみてください)、比較インサイトに進むことにします。

比較インサイトを検証する

比較インサイトは、診断的インサイトの特殊な事例です。前述のとおり、診断的インサイトでは、特定のサブグループとグローバル平均の差が寄与要素に分類されます。比較インサイトでも同じことが行われますが、この場合は 2 つのサブグループ間の差が分類されます。Einstein Discovery は、生成したモデルから比較インサイトを取得します。この比較は滝グラフで視覚化されます。

比較インサイトを表示するには、変数パネルから変数 ([リードソース]) を選択します。[値を選択] で、変数のカテゴリ ([Partner Referral (パートナー紹介)]) を選択してから、もう 1 つのカテゴリ ([Phone Inquiry (電話照会)]) を選択します。
[リードソース] カテゴリを選択して別のカテゴリと比較。

Einstein に比較インサイトが表示されます。 比較インサイトの画面要素

この画面のいくつかの情報を見ていきましょう。

  • タイトル (1) は、結果との関連においてパフォーマンスが優れているカテゴリを示します。
  • 概要 (2) は、各カテゴリと結果の相関関係と、カテゴリ間の差を示します。
  • サブタイトル (3) は具体的に何を比較しているのかを説明します。
  • 滝グラフ (4) では、2 つのカテゴリの主な差がわかります。
    • リードソースが「電話照会」の場合の平均 (最上部の青のバー)
    • リードソースが「パートナー紹介」の場合の平均 (最下部の青のバー)
    • 「電話照会」のほうが優れている場合の要素 (赤のバー)
    • 「パートナー紹介」のほうが優れている場合の要素 (緑のバー)

インサイトを利用して他にできること

モデルのデータインサイトを確認して解釈する以外にも次のことを実行できます。

  • 後で確認したいインサイトをブックマークしておき、インサイトリストを絞り込んでブックマークしたインサイトのみを表示する。
  • データにバイアスがかかっていないか分析するときに、配慮を要する変数に関連するインサイトを絞り込む。

次のステップ

インサイトについて理解したら、次はモデルをリリースします。

リソース

無料で学習を続けましょう!
続けるにはアカウントにサインアップしてください。
サインアップすると次のような機能が利用できるようになります。
  • 各自のキャリア目標に合わせてパーソナライズされたおすすめが表示される
  • ハンズオン Challenge やテストでスキルを練習できる
  • 進捗状況を追跡して上司と共有できる
  • メンターやキャリアチャンスと繋がることができる