アクセンチュアにてTableau勉強会を開催! クラウド&ビッグデータの分析プラットフォームTableau(後編)
2019/04/18
2019/04/18
クラウド推進事業本部/テクノロジーコンサルティング本部シニアマネジャーの飯田と申します。AWS等のパブリッククラウドを使用したIT Modernization、クラウド・セキュリティやビッグデータプロジェクトを担当しています。
前編と後編の2回に渡って、アクセンチュアにてTableau様に開催いただいた勉強会の様子と今後のビッグデータ関連のプロジェクトで利用できそうなTableauの機能およびクラウドサービスとの連携について紹介いたします。
今回の後編ではTableau製品をクラウド上で利用する場合のポイントやセキュリティについて説明いたします。
■Tableau利用におけるセキュリティ考慮点
データ分析におけるセキュリティの考慮点としては、1. 誰がどのデータにアクセスできるのか、2. 分析結果を誰に公開するのかという点を考慮する必要があります。
言い換えると、データ分析の担当者がどのデータを利用して分析可能なのかということを検討する場合、ビッグデータ基盤のプロセス全体でセキュリティを検討する必要があるとも言えます。ビッグデータ基盤の主なプロセスには大きく分けて「収集・保存・処理・分析・可視化」があり、「収集」および「保存」プロセスでは社内・社外の分析に必要なデータを集めて、分析に利用できる場所に保存することが求められます。
保存先はストレージやデータベース、分析専用のデータウェアハウスなどが利用され、この保存先へのアクセス権限を誰に与えるのかという点が一つのセキュリティ考慮点(論点)となります。Tableauを利用する分析担当者は自分に与えられたアクセス権の範囲のデータで分析を実行することが可能となり、アクセス権がないデータを分析に利用することはできません。次に「処理」プロセスでは収集したデータをそのままではなく分析しやすいデータへと変換します。さらに不要なデータの削除や不要な情報のマスク処理を行うことが可能です。収集したデータで、そのままではセキュリティ上は分析担当者にアクセスさせることができないデータも、このデータ削除処理とマスク処理により、加工後のデータをアクセス可能とさせることができます。Tableauを利用する分析担当は、加工後のデータをより効率良くかつ広範囲のデータを利用した分析が可能となります。
表 ビッグデータ基盤の各プロセスのセキュリティ考慮事項
次に、分析結果を誰に公開するかというセキュリティ考慮点(論点)では、Tableauのセキュリティ機能により公開先を制御することが可能です。Tableauでは分析結果を共有する方法としてTableau Serverへのパブリッシュを行いますが、このTableau Serverでどの分析結果を誰にアクセスさせるかを「認証」「認可」「データセキュリティ」という機能で制御します。
認証機能ではTableau Serverでのローカル認証が可能ですが、エンタープライズ企業では認証情報の管理が複雑になるため既存の認証サーバーとの統合が重要となります。TableauではActive Directory(AD)認証、LDAP認証、SAML、OpenID Connectなどの認証方式・認証連携に対応しているため社内の既存の認証方式に適したものを利用することが可能です。
認可機能ではコンテンツに対するTableau Server上の操作の制限を与えます。データセキュリティではアクセス可能なデータを制限することができます。Tableau Serverではサイト管理と言う概念で階層的に権限を管理します。サイトの下にはプロジェクトという階層がありそれぞれにパーミッションを設定することが可能です。サイト、プロジェクトを分割することでユーザーにアクセス制限をかけることができます。(図 Tableau Server サイト管理)
図 Tableau Serverサイト管理
*Tableau社資料より引用
Tableauではさらに表示データへの制限をかける事が可能であり、これは公開された分析結果にフィルタをかける機能でアクセスするユーザーに対してどのデータを表示可能とするかといった制御になります。
例えば売上の分析結果を表示する権限を持っているユーザーであっても自分の所属している地域の分析結果のみを表示可能とするといった制御になります。これを実現するには静的な設定としてTableauの上で特定のグループに対してデータソースのどの項目からなるデータ表示を許可するというユーザーフィルターという方法と、データソースがデータベースの場合にそのデータベースへのユーザーのアクセス権限によりデータ表示を制御する動的な制御が可能です。
■クラウドサービスとの親和性
次に、BIとクラウドサービスという組み合わせをどのように活用できるのかという点に着目しTableauについて探ってみたいと思います。
ビッグデータ関連のプロジェクトでは、当然ながら「パブリッククラウド上にビッグデータの基盤を構築する必要がある」という課題に対して、どのように分析ツールを活用し分析結果を可視化するか、という論点が出てきます。
例えば、可視化にはクラウド側から提供されているツールセット(Amazon QuickSight等)も検討されますし、より柔軟に実現できるTableauのようなサードパーティ製BIツールも検討されます。
一般的にクラウドで提供されている可視化サービスのメリットはクラウドが提供するさまざまな機能との連携であり、サードパーティ製ツールの場合は利用したい既存のオンプレスにあるデータとクラウドサービス上のデータを組み合わせて分析することができます。そのため「どのクラウドサービスとの連携が可能か」ということがポイントとなります。
TableauではAWS、Azure、GCP(Google Cloud Platform)の主要なパブリッククラウドのビッグデータ関連機能と連携が可能です。パブリッククラウドとの連携の考慮点としてTableau が接続するデータソースとしてクラウドサービス上のデータの利用、およびTableau Serverのホスト先としてのパブリッククラウドの利用があげられます。
Tableauの接続先データソースとしてのクラウドサービスの利用では、Amazon RedshiftやGoogle BigQueryなどを直接利用することが可能です。(表 Tableauクラウドデータソースサポート例)このように直接パブリッククラウドのビッグデータ関連サービスと接続できることにより、クラウドサービスからデータをエクスポートしてから分析する必要がなく効率のよいデータ分析を実現することが期待されます。
*詳細はTableau社技術仕様のHPをご参照ください。
■Tableau – 技術仕様
https://www.tableau.com/ja-jp/products/techspecs
TableauをAWS上で利用する時の考慮点として、Amazon S3バケットに保存したデータファイルへのアクセスは直接サポートされていません(Tableau Desktop 64bit 2018-3-2にて確認)。したがって、S3上に保存されているデータを分析するためには、S3からTableau Desktopを実行しているPCにデータをダウンロードしてからローカルファイルとして分析する、もしくはAmazon AthenaでS3上のデータをテーブルとして登録してからTableauのデータソースとしてAmazon Athenaを登録することで分析可能となります。(図 Amazon Athenaをデータソースとして設定)TableauにてAmazon Athenaをデータソースとして利用する場合は事前にTableau Desktop上にAthena JDBCドライバのインストールとAthenaとS3にアクセス権限をもつIAMユーザーの作成およびユーザーのアクセスキーの作成が必要となります。
Tableau Serverのパブリッククラウド上で構築するにはIaaSインスタンス上にTableau Serverを構築する方法と、AWSマーケットプレイス、Azureマーケットプレイスから構成済みのインスタンスを利用することが可能です。
■AWSクラウド上へのTableau構成例
パブリッククラウド上でのTableau構成としてAWSを例に解説します。ここではAWSへのビッグデータ基盤のうちデータレイク構築は実施済みと想定します。AWS上のデータベースとしてRDSおよびRedshiftを想定し、データファイルはS3上に保存されているとします。Tableau Desktopは、マネージメントサブネットにWindows インスタンスを作成しそこへ導入します。また、このインスタンスからプライベートサブネットに配置されているRDSとRedshiftへアクセスが可能なように、プライベートサブネットのセキュリティグループが構成されています。利用者はリモートデスクトップを使用してWindows インスタンスへアクセスしTableau Desktopを実行します。Tableau Serverも同様のサブネットへ配置します。Tableau Serverの認証には社内のADを利用します。
図 AWSクラウド上へのTableau構成例
*要件に応じて構成は変更となる可能性がございます。
■まとめ
現在、クラウド上でビックデータ基盤の構築・運用を検討しているエンタープライズ企業が数多くいらっしゃいます。そのビッグデータ基盤の分析と可視化を行うツールとして、TableauのようなグラフィカルなBIツールはデータ利用者の敷居を下げる効果があります。また、クラウドサービスとの接続性も高いので利用するクラウドサービスに縛られることなく利用可能です。
クラウドサービスとTableauのようなサードパーティ製品の両者を最大限に活用したビッグデータ分析基盤構築をアクセンチュアがご支援いたします。クラウド上でのビックデータ分析基盤構築をご検討の際はぜひご相談ください。