Tableau のパフォーマンスを最適化する
学習の目的
この単元を完了すると、次のことができるようになります。
- Tableau ネイティブの最適化機能について説明する。
- Tableau でクエリを最適化するためのベストプラクティスを説明する。
現代のデータの課題に挑む
「Tableau の基本」では、データの量、状態、多様性が、ビジネス上の意思決定の速さに影響を与えることについて学習します。世の中には大量のデータが溢れています。ますます多くのプラットフォームやサービスにデータが存在し、情報の形式は多種多様です。
あなたの会社は、データの課題を解決し始めたところかもしれません。すでに特定のデータや分析プラットフォームに投資されているのではないでしょうか。現時点で最も重要なのは、分析を継続的に改善する手段を講じることです。データのアクセスと読み取りを容易にする取り組みを継続し、情報に基づいた意思決定を迅速に行えるようにしてください。
このモジュールでは、Tableau と Google BigQuery の統合のためにパフォーマンスのチューニングと最適化を行う機能について学習します。これらのプラットフォームがどのように連携してビッグデータの課題を解決するかを、ノーコード環境で垣間見ることができます。
まずは Tableau から見ていきましょう。
Tableau ネイティブの最適化について理解する
効率的かつ迅速に Google BigQuery と統合するために Tableau で自動的に行われる最適化が多数あります。以下で簡単に紹介します。
データソースコネクタ。これは、Google BigQuery へのネイティブの Tableau コネクタです。ライブデータ接続とインメモリ抽出の両方をサポートします。また、BigQuery と他のデータソースのマッシュアップデータもサポートしています。
並列クエリ。Tableau は、同時に複数のクエリ (最大 16 個の同時クエリ) をサポートします。並列クエリをさらに最適化する方法については、次のセクションを参照してください。
クエリの融合。これは、ワークブックとダッシュボードからの複数のクエリを取得して融合する機能です。Tableau では、クエリの数を減らすためにいつでも可能な限りこれが行われます。
外部クエリのキャッシュ。Web サイトの動作からのキャッシュについてはご存じの方もいると思います。データが変更されていなければ、ブラウザーはローカルに保存された Web サイトの要素を表示することで時間を節約します。Tableau も同じような動作をします。参照元データが変更されていなければ、Tableau はクエリをキャッシュし、ほとんど即座にデータを提供します。
バックグラウンドではもっと多くのことが行われますが、企業が意思決定を迅速に行えるように Tableau がどのように機能するかが大体理解できると思います。また、特定のビジネスニーズに基づいて分析をさらに最適化するための組み込みツールもあります。
Tableau の最適化ツールを知る
Tableau は、すべての人がデータ分析を行えるように構築されています。プラットフォームを使用するのに、技術的なスキルや専門的な分析コードの知識は必要ありません。
Google BigQuery など、多数のデータソースに接続するには、Tableau 環境のパフォーマンスを最高の状態に保つようにしてください。そのために次のツールと機能があります。
ツール/機能 | 説明 | ベストプラクティス |
---|---|---|
パフォーマンスレコーダー |
クエリとワークブックのサマリーを取得し、想定どおりに実行されているクエリと処理に時間がかかっているクエリを正確に把握します。 |
クエリの処理に時間がかかっている場合は、データモデルを再検討して、効率を上げるために改善できる部分を確認してください。 |
コンテキストフィルター |
コンテキストフィルターは、表示されるデータを減らして、必要な情報のみに焦点を当てます。 |
大きなデータソースがある場合に使用するのが理想的で、コンテキストフィルターをデータソースレベルで適用することをお勧めします。その後で、追加のフィルターをレコードレベルで使用します。 たとえば、都道府県のコンテキストフィルターを使用して国の地図を表示するビューがある場合、特定の都道府県を選択して、その地域のデータのみのビューを取得できます。 |
自動更新 |
自動更新を有効にすると、データビューを変更するたびにデータソースがクエリされます。これは分析の作成時に便利な機能です。ダッシュボードやワークブックが作成されていくところをリアルタイムで確認できます。ただし、この優れた機能にも限界があります。 |
自動更新はデータソースに対する実際のクエリであるため、密度の高いデータビューを作成する場合は自動更新を無効にしてください。 |
並列クエリ |
複数のクエリを同時に実行します。 |
大きなデータセットに対して並列クエリを実行する場合は、パラメーターを追加してクエリをさらに絞り込むためにカスタム属性を使用します。 ワークブックまたはデータソースをパブリッシュする前に、カスタム属性を追加するようにしてください。 |
次の単元では、BigQuery を微調整してデータを高速処理する方法と、BigQuery と Tableau を連携させてビジネスに関する予測を行う方法を見ていきます。