データ分析の一般的なユースケースを理解する
学習の目的
この単元を完了すると、次のことができるようになります。
- 現代のビジネスにデータ分析が重要である理由を説明する。
- 一般的なシナリオでデータ分析ツールがどのように使用されているかを説明する。
複雑な世界にデータ分析を使用する
ゲーム、コマース、ソーシャルメディアに共通することは何でしょうか? このような業種では、大量のデータが生成され、組織はそれをサービスの向上や問題の検出とトラブルシューティングに使用しています。次の動画では、Raf が日常生活にデータ分析が存在する一般的な業種とユースケースについて説明しています。
対象となるのは 100 行ぐらいのデータでしょうか? 1000 行でしょうか? 場合によっては、何十万、何百万行ということもあります。それだけの量をどのように操作しますか?
この単元の最後にあるテストでは、この動画の内容に関する問題があります。この単元の最後にある質問に答えるのに必要な情報を得るために、必ず動画を視聴してください。
トランスクリプトを表示する
[Raf] さまざまな種別のデータ分析の違いがわかったところで、消費者としてもおそらくプロフェッショナルとしても、皆さんの生活に今、データ分析が存在している可能性の高い例をいくつか紹介します。データ分析は、今日の多くの業種に幅広く存在します。たとえば、ゲーム、ソーシャルメディア投稿、e コマース、オンラインストア、Web サイト、統計 (クリックストリームとも呼ばれる)、レコメンデーションエンジン、モノのインターネット (IoT)、ログ処理などです。
コンテキストの中でデータ分析の目的が何なのかを理解できるように、そのようなシナリオの中でデータ分析が役立つ例をいくつか挙げてみましょう。たとえば、あなたが私と同じようにコンピューターゲームをするのが好きだとしましょう。嫌いな人などいませんよね?
携帯電話、コンピューター、ゲームコンソールでゲームをするのが好きな皆さんは、プレイを開始する前にオンにする必要があるチェックボックスに馴染みがあるかもしれません。このチェックボックスには通常、「ゲームエクスペリエンスを改善するために匿名データをゲーム開発者に送信します」などと表示されています。これは基本的に、クラッシュの可能性、デザインの不具合、その他のデータを検出するために、あなたがどのようにゲームをプレイしているかの情報を収集することを許可しています。この場合は明確に、ゲームのプレイのような実際のデータが情報に変換されて、開発者が可能性のある問題を回避し、ゲームエクスペリエンスを強化できるように役立てられています。これがまさにデータ分析が存在する理由であり、現代の世界にとってデータ分析が重要である理由です。
皆さんは「なぜ最近こんなものが出てきたのか?」と思うかもしれません。「私は子供のころからゲームをしているけれど、そんなものはなかった。ゲームはカートリッジで売られていて、それを買ってプレイしていた。そうでしょう?」そうなのです。ただし、考えてみれば、当時のゲームは今日のゲームほど複雑ではありませんでした。それこそが結論です。
分析は人々がインサイトを生成するのに役立ち、そのインサイトは複雑な問題解決に対処するのに役立っています。ゲーム、株式市場、不動産データ、交通情報、ファッションコンピューターシステム、Web サーバー、セキュリティログのいずれであっても、データ分析は複雑なシナリオに対して答えを出すのに役立ちます。
ストレージの価格が日々低下していく中で、企業は現時点で使い道のないデータを収集していることがよくあります。ただし、明日疑問が発生すれば、答えは以前収集したデータの中にあるかもしれません。
今日の世界は 10 年前の世界よりも複雑になっています。その中でコンピューターシステムの助けを借りることは、主に 2 つの理由から有益です。拡張性とデータに基づく意思決定です。データ分析のもう 1 つの大きな部分はログ分析です。これはこのコースの主題であるため、もう少し詳しく説明します。具体的にはセキュリティログについてです。
私たちがログ分析について語るとき、その対象となるのは一般に、コンピューターシステムによってイベントに基づいて生成される情報です。そのイベントには、Web ページに対して実行された HTTP 要求、ユーザーログイン情報、API コール、その他の種類の要求などがあります。API はアプリケーションプログラムインターフェースの頭文字であり、基本的に複数のソフトウェアの間のインタラクションを定義するコンピューターインターフェースです。
実行できるコールや要求の種類、実行方法、使用すべきデータ形式、従うべき規則などが定義されます。データ分析の観点から、そのすべてのアクティビティのログをどこかに記録するのが非常に一般的です。
データ分析の従来からの例は、Web サーバーログを使用して Web サイトへの訪問者に関するインサイトを抽出することです。たとえば、HTTP サーバーに対するすべての要求がファイルシステム内のファイルに記録されているとしましょう。これは通常アクセスログと呼ばれます。Web サイトへの訪問ごとにアクセスログに新しい行が 1 行追加されると、このログ内の行数は Web サーバーが応答した要求の数と等しいと言えます。
サーバーが 1 台だけの小規模な Web サイトで、訪問者が毎分数人であれば、テキストエディターのような基本的なツールを使用して、ファイルを解析し、求めている情報を抽出できます。一方、単にログファイルの行を合計するよりも、もう少し役に立つ情報を求めている場合には、データ分析ツールの使用が鍵となります。
あらゆる場所でデータ分析ツールを使用することをお勧めしますが、ログの集計と視覚化を大規模に行う場合にはプロフェッショナル用のツールが必要です。毎秒何千ものユーザーに対応する何十ものサーバーがあると想像してください。各サーバーの各ログファイルはすぐにいっぱいになることが予想できます。そのため、その大量のデータをどこかに集約する必要があります。
さらに、そのデータを折れ線グラフで視覚化する方法が必要かもしれません。そうすれば、急増 (逸脱、外れ値ともいう) を特定しやすくなります。今日のデータ分析のもう 1 つの大きな用途はデータセキュリティです。システムでセキュリティログが生成されていて、すぐにアクセスして分析を抽出することができれば、要求がいつ誰によってどこから実行され、その要求に対するシステムの応答が何であったかを突き止める必要がある場合に非常に有利です。
このデータに加えて予測分析を行うレベルに達していれば、自動的にコンピューターシステムへの不正な要求を発生前にブロックしたり、現在の環境に劣化が見られる場合にフェイルオーバー環境の構築を開始する自己修復アーキテクチャを作成したりする状態に到達できます。
これは、クラウドのインフラストラクチャオートメーションツールを利用して実現できます。AWS CloudTrail という AWS サービスがあります。これは AWS アカウントに対して実行された API アクティビティを記録するものです。別の Amazon S3 という AWS サービスはストレージサービスです。簡単に説明しておきましょう。
これは誰かが AWS マネジメントコンソールを使用して AWS アカウントにログインするたびに CloudTrail によって保存されるデータです。これは Amazon S3 に保存され、誰が要求を実行したか、どの IP アドレスから実行したか、何に対する要求だったか、要求に対する応答は何だったか、その他の有用なコンプライアンス情報が含まれていて、必要な場合にはすぐに証拠にすることができます。その特性から、CloudTrail は AWS アカウントのインフラストラクチャガバナンス、運用監査、リスク監査を可能にするサービスです。
ただし、CloudTrail のテキストデータを毎回調べる必要があるとしたら、それは達成するのが難しいかもしれません。そこで、データ分析を習得すれば、このすべてのコンプライアンスデータを使用してできることが広がります。CloudTrail で生成される情報のデータ視覚化ツールがあれば、グラフィックを含み異常なアクティビティを警告するセキュリティダッシュボードとなります。ログイン失敗アクティビティのログが突然表示され始めたら、それは誰かがあなたの AWS アカウントにログインしようとしているか、あなたがパスワードを変更してそれを忘れてしまったためかもしれません。
私は常々、データセキュリティ分析はコンプライアンスレポートだけのためのものではなく、トラブルシューティングにも役に立つとお伝えしています。その概念をファイアウォールパケット、ネットワークアクティビティ、ロードバランサー、サーバーログ、その他のインフラストラクチャトピックに適用すれば、外れ値を簡単に特定して、すばやく問題を解決できます。常に、データ分析を使用して他に何ができるかを考え、何が起きているかについての強力なインサイトを得るためにデータ分析がどのように役立つかを検討してください。それはセキュリティ、製品の改良、カスタマーエクスペリエンスの改善など、データ分析のどの領域であっても同じです。
可能性は無限です。次の動画では、そのすべてをクラウドで行うことで、どのような利点があり、データ分析を誰もがいつでもどこでも利用可能にするためにどのように役立つかを説明します。
テストに備えて動画を視聴する
この単元のテストには動画の内容に関する問題があります。まだ視聴していない場合は、戻って視聴してください。準備ができたら、テストに進んでください。