DWH(Data Warehouse/データウェアハウス)は、企業活動における過去から現在にわたるデータを保管する倉庫を意味します。
”データの集まり”という観点では、DWHの他にも「データベース」や「データマート」、「データレイク」などの概念もあり、これらの違いを整理できていない方も多くいらっしゃるのではないでしょうか。
この記事では、それらの違いを整理し、DWHの利用メリット、弊社がおすすめするDWHサービスをご紹介していきます。
データベース(Database)は、受発注、在庫管理、経理などにおける定型業務を効率よく行うために利用されるデータの集まりです。
企業内の基幹システムのデータはデータベースで管理されており、これらのデータベースは基幹系データベースや業務系データベースと呼ばれています。
日常業務の中では「現在の値」の参照・更新などが行われるため、データベースでは定型業務を行うのに必要な現在の値をもったデータを、即座に取り出せるように管理されています。
一方で、データベースで管理されている現在のデータだけでは、商品企画やマーケティングのような意思決定を行う業務を遂行することができません。
正確な意思決定をするには、過去のデータを参照したり、外部からデータを入手したりすることも必要になることがあるでしょう。
このような意思決定に必要な様々なデータを保管する倉庫がDWH(データウェアハウス)なのです。
DWHには4つの特性があります。これらの特性について、データベースと対比しながら簡単にご紹介していきます。
DWHは、サブジェクト指向のデータモデルで構成されます。
サブジェクト指向とは、データ主導のデータモデル化を行うという考え方です。データベースと対比すると分かりやすく、以下の図のように、基幹系データベースでは基幹システムごとに業務主導のデータモデルになっているのが一般的です。
DWHに格納されるデータは統合されています。
基幹系データベースでは、基幹システム毎にデータモデル化を行っているため、データの名称やコード体系等がそれぞれで独自に定義されているのが一般的です。
DWHにデータを統合する過程で、こういったデータの定義を全て統一する必要があります。
DWHとデータベースとの違いの部分でもご紹介しましたが、DWHは過去のデータも保持しています。データを時間的な順序で集めたものになっており、過去のデータを容易に参照・分析することが可能になります。一方で、基幹系データベースには「現在の値」のみが保持されています。
DWHの目的は、現在と過去のデータを意思決定に利用することですので、DWHに一度正しく蓄積されたデータは更新されることはありません。
もちろん誤ったデータを修正することはありますが、基本的にデータに対しては読み出しのアクセスをするだけです。
データマート(Data Mart)は、部門あるいはエンドユーザの個々のニーズを対象に、目的別に構築される小規模なDWHです。
全社的なDWHをグローバルデータウェアハウスと呼ぶのに対して、データマートをローカルデータウェアハウスと呼ぶこともあります。
マート(Mart)を直訳すると「市場、販売店」といった意味となり、グローバルデータウェアハウスが「倉庫」であるのに対し、データマートは「データを必要とする人に向けた市場」を意味します。
実際のシステム構築にあたっては、DWHとデータマートの両者とも構築する必要があるのか、それとも一方のみを構築すればよいのかを検討する必要があります。
データレイク(Data Lake)は、あらゆるデータをそのまま保管できるスペースを意味します。DWHで保管できるデータは整形(構造化)されている必要があり、画像データや音声データ、IoTセンサーデータなどの一定の形ではない(非構造化・半構造化)データをそのまま保管することはできません。そのため、こういったデータをデータレイクに保管し、直接データ解析をしたり、整形後にDWHに保管したりすることを目的として使用されます。
DWHを利用することで得られる最大のメリットは、過去から現在にわたるデータに基づいた意思決定を迅速に行うことができることです。
組織内外の様々なデータが1箇所に蓄積されているため、DWHから即座に必要なデータを取得することが可能となり、結果として意思決定までの時間短縮に直結します。
もしこの記事を読まれている方で、DWHの利用を検討されている方がいらっしゃいましたら、お気軽に弊社までご相談ください。弊社ではDWHの活用提案から、構築のご支援、運用サポートまでをご提供しております。
最後に、DWHの利用を検討されている方、もしくは既に利用しているが最新のサービスに移行したいという方向けに、弊社がおすすめするのは、クラウドデータプラットフォーム「Snowflake」です。
Snowflakeでは、この記事で登場したデータレイク/DWH/データマートの全てを同じプラットフォーム上で構築でき、シンプルなデータ統合基盤を実現することができます。
Snowflakeについては、こちらのページで詳しくご紹介していますので、是非ご覧ください。
クラウドデータプラットフォーム「Snowflake(スノーフレイク)」とは
また、定期開催している紹介セミナーは↓のバナーからお申し込みいただけます。こちらも是非ご活用ください。