はじめに
こんにちは!INSIGHT LAB株式会社のKin-chanです。IT業界に居なかった人がデータのことについて理解しようとするこのシリーズ。今回が第5回目となります(第1回目の記事はこちら、第2回の記事はこちら、第3回目はこちら、第4回目はこちら)。
さて前回までデータマネジメントの原則について2回に分けて記事にいたしました(記事はこちら→原則その1、原則その2)。「原則」という言葉のあとには「課題」という言葉がセットになることが多いですよね。DMBOK2でもご多分に漏れず原則の後には課題がついてきますから、今回は「データマネジメントの課題」について追いかけていこうと思います。
DMBOK2で述べられている課題についての項目は多いので以下のように内容をまとめております。
データマネジメントの課題 目次
- データが資産であるとみなしたときにデータ価値をどのように評価するか?
- データの品質とライフサイクル
- データマネジメントは機能横断的で全社的な視点が必要
- 効果的なデータマネジメントにはリーダシップとコミットメントが必要
それではデータマネジメントの課題について追いかけていきましょう!
データが資産であるとみなしたときにデータ価値をどのように評価するか?
「データは資産である」
これは何度も述べられております。お金などの他の資産と同じように、組織に存在するデータも資産として扱いましょう、ということです。
データも資産として扱うとなると、お金における金額や資産価値等のようにデータに対しても客観的な評価方法を設定する必要があります。しかしながらデータに対して、お金のように共通的にデータ価値を評価する方法はイメージがつきづらいですね。データに対して直接的に「この組織でのデータ価値は○○○円です」と表現するためにはどのようにしたらいいでしょうか?
DMBOK2ではデータの価値を評価するアプローチとして以下のような提案があります。
- データを保持・維持するのにかかるコスト
- データを使用することによる利益(DMBOK2では恩恵という言葉をつかっている)
組織の資産に対して収入の部(利益)と支出の部(コスト)を作成して収支を見るのと同じように、データに対しても収支表めいたものを作ってみてはどう?ということでしょう。データにかかるコスト/利益の例として以下のようなものが挙げられています。
表1.データの価値を評価するには?
データに対する利益(収入の部) | データにかかるコスト(支出の部) |
|
|
データの資産価値を、収入の部、支出の部のようにして見える化をすることで、データの資産価値を客観評価することができそうですね。
メタデータ管理がデータマネジメントの入り口になる
また企業がデータを資産として管理するためには信頼性の高いメタデータが必要とされています。メタデータによって記述されるのは、組織内にどんなデータが存在し、それが何を表し、どう分類され、どこから来て、組織内をどう移動し活用されるのか、誰が使えて誰が使えないか、どの程度の品質か、などです。技術的な話題でいうとデータカタログ、リネージ、データに対する閲覧権限といったところでしょうか。
データそのものは抽象的なものである為、メタデータとしてコンテキスト(データに対しての説明)を定義し記述することによって、データそのものがどのようなデータなのかを理解しやすくなり、データやデータライフサイクル、およびデータを使用する複雑なシステムを理解できるようになります。言わばメタデータを作成/管理することがデータマネジメントの入り口である、ということですね。
メタデータもデータの一種ですから、メタデータをデータとして管理する必要がありますが容易なことではありません。データ管理がうまくできていない組織では大抵メタデータが管理できていないようですから、多くの場合メタデータを理解できるようにすることを目的としてメタデータ管理がデータマネジメント全体を改善する出発点となるようです。
データの品質とライフサイクル
ゴミを入力するとゴミが出力される
"Garbage in, garbage out"というフレーズはコンピュータサイエンスの世界では有名なフレーズです。データに対しても同じことが言えます。
データを利用したい人たちは「うちの組織にあるデータは品質が高いものである」というスタート地点に立ってデータを利用し始めますが、ある日「ムムッ、このデータの品質が疑わしい」ということに感づくと、データに対する信頼性が一気に崩れてしまい、失われた信頼を取り戻すことは難しくなります。
自組織データへの信頼を失わない為にも、計画段階からデータの品質を高めることが必要です。また、データは一度作成されたら終わりではなく、高いデータ品質を維持することが大変に重要なので、「『データ品質が高い』とはどのような状態なのか」を定義し、高いデータ品質である状態を維持する必要があります。例えば定期的にデータテストを実施してデータ品質が下がっていないかをチェックするなどの取り組みが考えられます。
「データは資産である」と再三お伝えしておりますが「『高品質な』データは資産である」ととらえるべきかもしれませんね。
データライフサイクル
データライフサイクルの概念は以下のように記述されます。
- 計画
- 設計と実装
- 生成/取得
- 格納/維持 → 格納が不要なデータはこのフェーズで廃棄される
- 利用
- 強化
- 計画へ戻ってライフサイクルを繰り返す
このライフサイクルを通じてデータはクレンジング・変換・統合・強化・集計され、データが利用される中で新しいデータが生成され、繰り返し使用されるデータと新しく生成されるデータが混在しながらライフサイクルの中を流れていきます。
ライフサイクルについて重要なことが3つ述べられています。
- データライフサイクルの中で重要な局面はデータ生成とデータ利用のフェーズである
- データライフサイクル全体でデータ品質、メタデータ品質、データセキュリティを管理する
- データマネジメントの取り組みを開始するには最も重要なデータに焦点を当てて取り掛かるとよい
DAMA日本支部のWEBサイトにもデータライフサイクルを説明した画像がありますのでそちらもご参照ください(リンク先ページの中ほどです)。
データマネジメントは機能横断的で全社的な視点が必要
データマネジメントに必要なスキルはシステム計画を作成するスキル、ハードウェア管理とソフトウェア開発の高度なITスキル、業務課題と問題を理解するためのデータ分析スキル、データを分析して解釈するスキル、業務用語やの定義を開設し合意形成するための言語スキルなど、必要なスキルが多岐にわたるので「データマネジメントは機能横断的で全社的な視点が必要」なのです。
これだけ多岐にわたるスキルを一人だけで実現することが難しいことは想像できますよね。だからIT側と非IT側どちらかだけではなく、双方一緒に頑張りましょう、ということになるのです。
特に双方一緒に頑張るために、リーダーとして「チーフ・データ・オフィサー(CDO)」という存在を置きたいよねという話題があります。CDOが組織におけるデータマネジメントの取り組みをリードすることで、データに対して組織が戦略的に取り組めるように企業文化を変革していくことが求められます。
効果的なデータマネジメントにはリーダシップとコミットメントが必要
「リーダーのためのデータ宣言(Leader's Data Manifesto 2017)」というものがありまして、この中で「組織が有機的に成長できる最高の機会はデータによってもたらされる」と述べられています。データを資産として認識している組織は多いながらも、自分たちがどのようなデータを持っていて、業務においてどのようなデータが重要なのかがわかっていない等の「理想と現実」のような乖離がある組織がほとんどのようです。
データマネジメントが実践できている組織が少ないということは、データマネジメントを実践できた組織は他の組織からアタマひとつ以上抜け出して、競争力をつけることができるということですよね。なんだかワクワクしませんか?
組織としてデータマネジメントを実践するためには、組織の誰かだけが取り組むのではなく、組織としてリーダーシップを発揮し、組織の全レベルで全員が関与することが必要です。
さいごに
今回の記事ではデータマネジメントにおける課題について追いかけてきました。
大事だなと思ったフレーズをまとめてみましょうか。
- 高品質なデータは資産である
- データの資産価値を見える化したい
- メタデータ管理をデータマネジメントの入り口としよう
- 組織のリーダーのリーダーシップのもとでIT側と非IT側の両サイドから推進し全社的な取り組みが必要(誰かだけがやれいいのではない)
次回は「データマネジメント戦略」について追いかけようと思います。次回のIT業界に居なかった中の人がデータのことについて理解しようとするこのシリーズもお楽しみに!
弊社INSIGHT LAB株式会社では「DATA-CONPASS(データ利活用のトータル支援サービス)」を提供しておりますので是非ご覧くださいませ。DATA-CONPASSについてはこちらから。