データ分析種別を知る
学習の目的
この単元を完了すると、次のことができるようになります。
- データ分析によって意思決定がどのように向上するかを説明する。
- さまざまな分析種別を定義する。
- 記述的分析について説明する。
インサイトを得る
データポイントの収集は最初のステップにすぎません。その大量のデータをどうしますか? 情報を組み合わせて、人の意思決定に役立つものにする必要があります。それがデータ分析の基本目標です。このモジュールでは、さまざまな種類のデータ分析、特に記述的分析と、それが一般的なビジネスケースでどのように使用されるかを紹介します。
AWS のシニアクラウドテクノロジストである Rafael Lopes (Raf) の次の動画をご覧ください。この単元の最後にあるテストでは、この動画の内容に関する問題があります。この単元の最後にある質問に答えるのに必要な情報を得るために、必ず動画を視聴してください。
Raf は何度か「コース」と「レッスン」という用語を使っています。ここではモジュールを意味しています。
トランスクリプトを表示する
[Raf] こんにちは。これをご覧になっている皆さんはおそらくデータ分析に関心をお持ちだと思います。素晴らしいことです。ではさっそく、データ分析とは何かという価値提案について説明しましょう。
データ分析について語るときにまず最初に考えなければならないのは、収集したデータをどのように使用して今後のビジネスニーズに役に立つような情報を生成するかということです。そのような情報をインサイトといいます。
時として、このデータからインサイトを生成する過程は大規模で複雑になり、機械学習が使用されることがあります。逆に短時間でシンプルになることもあます。データセットの準備が整っていて、記述的データ分析を実行するだけの場合などです。とは言え、データ分析は、収集したデータをコンピューターシステムによって処理することで、データに基づいた事実によって意思決定を向上させるインサイトを生成する技術です。
今日では、データ分析は e コマースやソーシャルメディアに幅広く使用されています。ただし、この知識は情報セキュリティ、ロジスティックス、工場の操業、モノのインターネットなどの多くのことに適用できますし、そうするべきです。
データ分析には主に 4 つの種別があります。複雑度順に記述的、診断的、予測、指示的となります。1 つずつ説明します。記述的分析については後ほど詳しく説明します。この入門コースの対象となるのは記述的分析であるからです。
記述的分析とは、主に何が起きたかについての情報を得るために使用するデータ分析種別です。その目的は、システムによって収集されたデータを使用して、何が問題だったのか、何を改善できるのか、想定どおりに報告されていない指標はどれかといったことを特定することです。
この種別のデータ分析は、大きなデータセットを要約して結果をステークホルダーに説明するために幅広く使用されているため、記述的分析は状況を報告するだけのものであり、それ以上のものではないと考えてください。システムから得られる特に関連性の高い指標は一般に KPI (重要業績評価指標) と呼ばれます。
何が起きたかを知ることは、一部の市場分野にとっては非常に重要で、問題に対するさらに詳しい調査のニーズを十分満たせる場合もあります。ステークホルダーが潜在的な問題を修正するためにデータ主導な判断を下すときに注目すべき KPI を特定するのに記述的データ分析がどのように役立つかの例を挙げます。
e コマース Web サイトを想像してください。このサイトであなたは支払処理に要した時間に関する指標を収集します。この Web サイトでは購入を完了するために外部支払ゲートウェイを使用しています。そのため、お客様は Web サイトで何かを購入するたびに支払いゲートウェイにリダイレクトされ、お客様が支払を完了するとあなたはそのことを確認できます。この場合、効果的な記述的分析を行うために関連する KPI セットは、トランザクションの完了に要した時間、完了したトランザクション数、キャンセルされたトランザクション数に関する指標になります。
キャンセルされたトランザクションとトランザクションの完了に要した時間の両方に急増が見られる場合、それはトランザクションに時間がかかりすぎたためにキャンセルされたことを示しているかもしれません。また、それらの KPI が相互に関係していることを示しているかもしれません。これは、システム管理者やビジネス所有者が売上に影響する可能性のある問題のトラブルシューティングを開始するときに役立つ可能性があります。
まったく同じ概念がトランザクションの完了に要した時間にも適用されます。トランザクション時間内の各ステップを分けることで、この指標をドリルダウンできれば、問題を解決するのに適切な箇所を的確に指し示す詳細な情報を入手できます。何よりも避けたいことは、システムの不具合をソーシャルメディアの投稿やお客様からの連絡によって知ることです。この場合、監視が重要で、非常にシンプルな指標セットを使用してビジネス関連の問題のトラブルシューティングを開始します。
簡単に言うと、記述的データ分析とは、何が起きているかを知るための概念です。また、ユーザー活動、ソーシャルメディア投稿、モノのインターネット、システムセキュリティログに関するデータがある場合にも記述的データ分析を実行できます。先ほども言ったようにユースケースはさまざまですが、確かなことが 1 つあります。記述的データ分析を実行する方法についての知識を得たら、その知識を他のデータセットにも使用することができますし、そうすべきだということです。
いいですね。これで、記述的データ分析とは何かということについて確かな基盤ができました。他の 3 つはどうでしょうか?
先ほどの例に、トランザクション時間と失敗したトランザクション数に関するマトリックスがあったことを思い出してください。あの例では、問題を特定するためにその 2 つの指標を関連付けるインサイトやアイデアを得るのはあなたの仕事でした。システムがその関連付けを行うことはなく、「支払いゲートウェイの問題の確率」という統合された予測指標も提供されませんでした。今日ではそのような指標がシステム内に何百何千とあることが非常によくあります。そこで役立つのが診断的分析です。診断的分析では単に通知するだけではなく診断を行うために、KPI をさらに調査して関連付け、どこに問題が存在する可能性があるかを提案します。診断的分析は、システムが実行できる一連のアクションです。ステークホルダーはこれによって、なぜ何かが起きたかを理解できます。ここで覚えておくべき言葉は「なぜ」です。
3 つ目のデータ分析は予測分析です。予測データ分析はさらに複雑です。その名が示すとおり、過去のデータに基づいて、または複数のデータセットやソースの間でデータクロスオーバーを行うことによって、将来何が起こる可能性があるかを予測します。つまり、過去のアクションに基づいて将来を予測しようとします。診断的分析では、ニューラルネットワーク、回帰、ディシジョンツリーがよく使用されます。それについては別のコースで説明します。
最後は指示的分析です。これは基本的に前のすべてのものを合わせたものです。指示的分析では、過去の出来事や結果に基づいて、行う必要がある最もデータ主導の判断は何かということがステークホルダーに提案されます。指示的分析では機械学習戦略を多用して、大きなデータセットを参照、比較することでパターンを見つけてそれに対応する修復方法を特定します。
どの種類を学習して適用する場合でも、データ分析では情報テクノロジー、統計、専門知識 (ソーシャルメディア、ビジネス、業種) を組み合わせて使用します。このコースでは、AWS サービスを使用して、セキュリティログを使用することで AWS アカウントで何が起きているかについての記述的分析を実行する方法に焦点を絞ります。
これで、皆さんはデータ分析のさまざまな種類について理解できました。このジャーニーを続けて、次は現在皆さんの生活のどの部分にデータ分析が存在するかという例をもう少し見ていきましょう。
テストに備えて動画を視聴する
この単元のテストには動画の内容に関する問題があります。まだ視聴していない場合は、戻って視聴してください。準備ができたら、テストに進んでください。