お問い合わせ
3 分で読むことができます

DWH(データウェアハウス)とは? 定義・メリットをご紹介

執筆者 BI LAB編集室 更新日時 2021年6月18日

Topics: DWH
DWH(データウェアハウス)とは? 定義・メリットをご紹介

目次

DWH(データウェアハウス)とは

DWH(Data Warehouse/データウェアハウス)は、企業活動における過去から現在にわたるデータを保管する倉庫を意味します

”データの集まり”という観点では、DWHの他にも「データベース」や「データマート」、「データレイク」などの概念もあり、これらの違いを整理できていない方も多くいらっしゃるのではないでしょうか。

この記事では、それらの違いを整理し、DWHの利用メリット、弊社がおすすめするDWHサービスをご紹介していきます。

DWH(データウェアハウス)とデータベースとの違い

データベース(Database)は、受発注、在庫管理、経理などにおける定型業務を効率よく行うために利用されるデータの集まりです。

企業内の基幹システムのデータはデータベースで管理されており、これらのデータベースは基幹系データベース業務系データベースと呼ばれています。

日常業務の中では「現在の値」の参照・更新などが行われるため、データベースでは定型業務を行うのに必要な現在の値をもったデータを、即座に取り出せるように管理されています。

一方で、データベースで管理されている現在のデータだけでは、商品企画やマーケティングのような意思決定を行う業務を遂行することができません。

正確な意思決定をするには、過去のデータを参照したり、外部からデータを入手したりすることも必要になることがあるでしょう。

このような意思決定に必要な様々なデータを保管する倉庫がDWH(データウェアハウス)なのです。

DWH(データウェアハウス)の特性

DWHには4つの特性があります。これらの特性について、データベースと対比しながら簡単にご紹介していきます。

①サブジェクト指向

DWHは、サブジェクト指向のデータモデルで構成されます。

サブジェクト指向とは、データ主導のデータモデル化を行うという考え方です。データベースと対比すると分かりやすく、以下の図のように、基幹系データベースでは基幹システムごとに業務主導のデータモデルになっているのが一般的です。

図解/サブジェクト指向

②統合

DWHに格納されるデータは統合されています。

基幹系データベースでは、基幹システム毎にデータモデル化を行っているため、データの名称やコード体系等がそれぞれで独自に定義されているのが一般的です。

DWHにデータを統合する過程で、こういったデータの定義を全て統一する必要があります。

図解/統合

③時系列

DWHとデータベースとの違いの部分でもご紹介しましたが、DWHは過去のデータも保持しています。データを時間的な順序で集めたものになっており、過去のデータを容易に参照・分析することが可能になります。一方で、基幹系データベースには「現在の値」のみが保持されています。

図解/時系列

④不変性

DWHの目的は、現在と過去のデータを意思決定に利用することですので、DWHに一度正しく蓄積されたデータは更新されることはありません。

もちろん誤ったデータを修正することはありますが、基本的にデータに対しては読み出しのアクセスをするだけです。

図解/不変性

 

DWH(データウェアハウス)とデータマートとの違い

データマート(Data Mart)は、部門あるいはエンドユーザの個々のニーズを対象に、目的別に構築される小規模なDWHです。

全社的なDWHをグローバルデータウェアハウスと呼ぶのに対して、データマートをローカルデータウェアハウスと呼ぶこともあります。

マート(Mart)を直訳すると「市場、販売店」といった意味となり、グローバルデータウェアハウスが「倉庫」であるのに対し、データマートは「データを必要とする人に向けた市場」を意味します。

図解/データマート

実際のシステム構築にあたっては、DWHとデータマートの両者とも構築する必要があるのか、それとも一方のみを構築すればよいのかを検討する必要があります。

 

DWH(データウェアハウス)とデータレイクとの違い

データレイク(Data Lake)は、あらゆるデータをそのまま保管できるスペースを意味します。DWHで保管できるデータは整形(構造化)されている必要があり、画像データや音声データ、IoTセンサーデータなどの一定の形ではない(非構造化・半構造化)データをそのまま保管することはできません。そのため、こういったデータをデータレイクに保管し、直接データ解析をしたり、整形後にDWHに保管したりすることを目的として使用されます。

図解/データレイク

DWH(データウェアハウス)の利用メリット

DWHを利用することで得られる最大のメリットは、過去から現在にわたるデータに基づいた意思決定を迅速に行うことができることです。

組織内外の様々なデータが1箇所に蓄積されているため、DWHから即座に必要なデータを取得することが可能となり、結果として意思決定までの時間短縮に直結します。

もしこの記事を読まれている方で、DWHの利用を検討されている方がいらっしゃいましたら、お気軽に弊社までご相談ください。弊社ではDWHの活用提案から、構築のご支援、運用サポートまでをご提供しております。

クラウドデータプラットフォーム「Snowflake」とは

最後に、DWHの利用を検討されている方、もしくは既に利用しているが最新のサービスに移行したいという方向けに、弊社がおすすめするのは、クラウドデータプラットフォーム「Snowflake」です。

Snowflakeでは、この記事で登場したデータレイク/DWH/データマートの全てを同じプラットフォーム上で構築でき、シンプルなデータ統合基盤を実現することができます。

Snowflakeについては、こちらのページで詳しくご紹介していますので、是非ご覧ください。
クラウドデータプラットフォーム「Snowflake(スノーフレイク)」とは

また、定期開催している紹介セミナーは↓のバナーからお申し込みいただけます。こちらも是非ご活用ください。

Snowflakeを体験してみませんか?

INSIGHT LABではSnowflake紹介セミナーを定期開催しています。Snowflakeの製品紹介だけでなく、デモンストレーションを通してSnowflakeのシンプルなUI操作や処理パフォーマンスの高さを体感いただけます。

詳細はこちら

BI LAB編集室

執筆者 BI LAB編集室

BI LAB(データ活用研究所)編集室です。 BI、AI、DWHなどデータ活用に関するトレンドやニュースやコラムをほぼ毎日配信しています。押さえておきたい基本知識から、最新ニュース、事例インタビューやお役立ち情報・セミナーレポートまで、データ活用の専門家ならではの視点と情報量でお届けします。

4 分で読むことができます。
Snowflakeの料金体系|クレジットと費用最適化のポイントをご紹介
5 分で読むことができます。
【禁断の比較?】SnowflakeとTreasure Dataを比べてみました
1 分で読むことができます。
誤ってupdateしてしまったレコードをtime travelで復元する
5 分で読むことができます。
【Snowflake】新機能「Streamlit in Snowflake」とは何者か!?
3 分で読むことができます。
AWS Lambdaを使ってSnowflakeとSFTPサーバーを連携してみた