目次
データカタログとは?
データカタログとは、データの検索や管理を容易にするツールです。
視覚的な探索ツールや推奨システムを備えていることも多く、非技術者でも直観的に操作可能な点もメリットに挙げられます。
データカタログの機能
データカタログには3つの機能があります。具体例も添えて説明します。
①データの検索・探索
データカタログはメタデータを収集・管理することで、どこに何のデータがあるのか、その所在を検索する機能があります。
具体例:
・キーワード検索、フィルタリング、分類による効率的なデータ検索
・ユーザーの行動や関心に基づく推薦システム
・データの関連性や依存性を視覚化する探索ツール
②アクセス制御
データカタログは、データを検索できるだけではなく、ユーザーのデータへのアクセス権を適切に管理することができます。
具体例:
・業務内容に応じてグループ化されたユーザーごとにアクセス権を付与するロールベースでのアクセス権限の設定
・データアクセスポリシーの管理と適用
・アクセスログの監視とユーザーの操作が時系列に沿って記録されたデータの監視
③データ品質とデータライフサイクルの管理
データ品質の維持やデータライフサイクルを効果的に管理する機能もあります。
具体例:
・データセットの依存関係の可視化
・データ品質の監視と評価
・データライフサイクル(作成、使用、保管、廃棄)の管理
※データライフサイクル:「データが、生まれてから死ぬまでのこと」です。つまるところ、登録されてから削除されるまでの各ステージを指します。
具体的には、作成→保存→利用→長期保管→破棄のステージに分かれます。
データカタログを導入するメリット
データカタログを導入するメリットは以下の3点があります。
①データアクセスの時間短縮
データカタログは様々なデータソースからのデータを一元管理するためのツールです。そのため、データの行方が分からない際に複数のフォルダやデータベースを探す必要が無くなります。
②データガバナンスの強化
データガバナンス(Data governance)とは、一言で表現すると「データの統治」です。
データカタログはデータがどこに存在し、どこに格納されているかといったデータの可視性を向上させます。そのため、データの統治が行いやすくなります。加えて、データアクセスを制御する機能により、データの規制要件やコンプライアンスの遵守が容易になります。
③データの利用効率の向上
データカタログはデータの検索や管理を容易にするツールのため、チーム間での情報が縦割りとなり共有できていない状況を解決します。さらに、異なる部門間でのデータの活用促進を実現し、利用効率の向上につながります。
製品例
ここでは各社が提供しているデータカタログを紹介します。
Alation
このツールはAlation社が開発したカタログ化によりデータ検索時間を短縮し、データ活用を促進するデータインテリジェンスプラットフォームです。
単なるデータカタログではないので、データを利用するための必要な情報を検索する情報ポータルとして活用することができるのが特徴です。
公式ページ:https://www.alation.com/product/data-catalog/
Talend Data Catalog
このツールはQlik社が提供している組織がデータを安全に一元管理できるようにする製品です。
堅牢な検索・検出ツールと、あらゆるデータソースからメタデータを抽出するためのコネクターを備えており、データの保護、分析の制御、データパイプラインの管理、ETLプロセスの高速化を容易にするのが特徴です。
公式ページ:https://www.talend.com/jp/products/data-catalog/
Insight Catalog
株式会社インサイトテクノロジーが提供している製品で、データカタログ機能をベースにビジネスメタデータ管理や名寄せ機能を搭載し、データの可視化を実現しています。
日本語を適切に理解しているAIにより、異なるデータソースをまたいで関連データを自動検出する機能を搭載していることが特徴です。
公式ページ:https://www.insight-tec.com/products/catalog/
Quollio Data Intelligence Cloud
株式会社Quollio Technologiesが提供している「データの通販を社内展開」というキャッチフレーズがある製品です。
データリテラシーを醸成することと、横断データの取得・分析のリードタイムを削減することが特徴です。
公式ページ:https://quollio.com/jp/solutions/datacatalog
まとめ
今回はデータカタログについて機能、導入のメリット、製品例を紹介しました。
製品例から察することもできるように種類は豊富です。つまり自社に合ったものを導入するためには、導入後のビジョン、ゴールを定めることが重要だと考えています。
「何をしたくてデータカタログを導入するのか」それを考える事で、自ずと欲しい機能が定まり、自社に合ったデータカタログが選定できると思います。
それでは良きデータ活用ライフを!
データカタログについてもっと知りたい方はこちら!