こんにちは、donutです。
今回はGoogle Cloudが提供する「Looker」についてご紹介したいと思います。
Lookerとは
Lookerは、Google Cloudが提供する次世代型の「データプラットフォーム」です。
ユーザーやデータ分析者がデータを探索し、本質を得るために使用できる直感的で
柔軟なツールセットを提供しています。
ビッグデータ分析をメイン機能に持つLookerは、2013年にシリコンバレーで創業した
Looker Data Science社が開発しました。2019年にGoogleによって買収された後も
改良が進められています。
また、企業のデータを統合し、分析・可視化・共有を行うための中心的な場所となり、
Lookerに接続された様々なソースからデータを取り込むことができます。
OracleやMySQLのような専用のデータベースはなく、クラウドデータベースを利用しています。
<参考>
◆Looker公式
Lookerでできること
Lookerの主な特徴として、次のようなものがあります。
①データの探索と可視化、独自言語「LookML」を使用したSQLの生成
→Lookerは直感的なインターフェースを通じてデータを探索し、
リアルタイムで可視化することができます。これを元にグラフやチャート、
ダッシュボード等を作成してデータの傾向や関係性を把握することが可能です。
また、「LookML」というモデリング言語(※)を使用し、
自動でSQLを生成しています。
これにより、別のユーザーが行ったデータ分析でも、統一性のある結果データが
導き出せるような仕組みが確立されるため、データの一貫性を維持することが
できます。
(※)あらかじめ定義されたルールに基づいて構成された人工言語です。<参考>
◆LookMLについて(Google Cloudより)②データベースへの直接アクセスの実現
→Lookerにはデータ保存を行うためのストレージ領域が存在しません。
そのため、データベースへの直接アクセスを可能としています。
アップロード時間や工数の短縮が見込めるので、スムーズな分析作業はもちろん、
データの移動作業も不要であることから、セキュリティ面でも重宝されています。③セキュリティ面での充実性
→Lookerでは、データセキュリティにも重点を置いています。
ユーザーやグループ、データセットやビュー毎でのアクセス制御設定をはじめ、
データの暗号化やセキュリティポリシーの管理など、
データの保護とセキュリティを確保するための機能が提供されています。<参考>
◆Our shared security partnership(英語記事になります)④多様なデータウェアハウス及びツールとの連携
→Lookerは様々な外部ツールとの連携を可能としています。
例として、コミュニケーションツールとして利用されている
「Slack」では、Lookerで作成したダッシュボードをSlackへ
直接送信することができます。
チャンネルや個別メッセージでデータを共有し、
重要な事柄について問い合わせ、回答を得るといったこともできるのです。<参考>
◆Looker | Slack App Directory(Slackのサイトより)※なお、Slack以外で連携できるデータツールとしては下記があります。
◎データウェアハウスおよびデータストレージ
BigQuery(Google Cloudのデータウェアハウスサービス)
Amazon Redshift(AWSのデータウェアハウスサービス)
Snowflake(クラウドベースのデータウェアハウス)
MySQL、PostgreSQL、Microsoft SQL Serverなどの
リレーショナルデータベース
Apache Hive、Apache ImpalaなどのHadoopエコシステム
◎ビジュアライゼーションおよびダッシュボード
Tableau
Power BI(Microsoftのビジネスインテリジェンスツール)
QlikView、Qlik Sense
Google Data Studio
Looker×BigQuery
LookerとBigQueryは、データ分析及びビジネスインテリジェンス(BI)の領域で
組み合わせて使用されています。
BigQueryはGoogle Cloud Platformのデータウェアハウスサービスであり、
膨大なデータを高速でデータ分析できることが利点です。
BigQueryもクラウドベースであり、柔軟なクエリ機能とリアルタイムでの
データ分析を提供しています。
LookerとBigQueryを組み合わせて利用することで、以下のようなメリットもあります。
①BigQueryの性能を存分に活用できる
→LookerからBigQueryへ直接接続してSQLを実行するため、
BigQueryのパフォーマンスや機能を存分に発揮することが
可能となり、データの集計時間も大幅に短縮できます。
②リアルタイムでのデータ分析
→BigQueryが持つ高速処理能力と、Lookerが持つ可視化ツールを
組み合わせることで、リアルタイムでデータを分析し、
結果を得ることができます。
また、データがBigQueryに追加されると、Looker側から即座に
アクセスすることも可能です。
③データの柔軟な可視化とダッシュボードの作成
→Lookerのビジュアライゼーションツールを使用して、
BigQueryから取得したデータをグラフやチャート、
ダッシュボードで視覚化することができます。
④データセキュリティとアクセス制御
→LookerとBigQueryは、ともにデータセキュリティとアクセス制御に
重点を置いています。Lookerは、BigQueryのデータへの
アクセス権限を管理し、セキュリティポリシーやロールベースでの
アクセス制御を適用することができます。
Looker導入時の注意点
Lookerはデータ分析を通して企業のパフォーマンス向上にも貢献することができます。
ですが、「誰が何のために使うのか?」を明確化の上でデータを準備することが重要です。
また、Lookerを導入する際に考慮する必要がある事項は下記があります。
①データ品質と整合性の確保
→Lookerはデータを分析および可視化するためのツールです。
データソースの品質を確保し、整合性を保つために
「データ品質管理のプロセス」を導入することが重要です。
②データセキュリティとアクセス制御の強化
→Lookerは機密データやビジネス上の重要な情報へアクセスするための
ツールです。そのため、データセキュリティとアクセス制御を適切に
設定する必要があります。
セキュリティポリシー、アクセスレベル、データの暗号化などを確立し、
データの不正利用や漏洩を防止するよう注意が必要です。
③持続的な改善とフィードバックの実施
→Lookerの導入は一つのプロジェクトで終わるものではありません。
持続的な改善やフィードバックを確立し、内容を収集の上で
システムやプロセスを適宜改善していくことが重要です。
また、新たな要件やニーズにも対応するため、Lookerのカスタマイズや
拡張も検討する必要があります。
④Lookerの導入後も分析を継続する
→Lookerの導入後は、分析精度の向上に向けた取り組みが
重要となってきます。要因分析・予測分析といった高度な分析も必要となり、
PDCAサイクルを地道に回していかなければなりません。
BIツールは高度な分析も可能としています。ですが、
「どのようなデータを抽出、分析したいのか?」を決めておかないと、改善に活かすことが
困難となってしまいます。
今回ご紹介したLookerを利用することで、手元にあるデータを整理してみるのも
良いかもしれません。
なお、弊社でもLookerの資料を公開しています。
下記ページよりダウンロードが可能ですので、あわせてご参照ください。
<参考>
◆Looker概要資料