目次
はじめに
こんにちは。
今回は2025年1月末にリリースされたQlik Cloud新機能!
セルフデータ準備・整形機能の「データフロー」をご紹介していきます!
実際に触ってみた内容は、次回にお届けする予定です。
データフローとは?
BIツールの会社が提供するデータ準備・整形の機能といったら、
何となくどんなものか想像できるかもしれませんが、まずはQlik社のヘルプを見てみます。
Qlik Cloud Analytics は、分析、機械学習、AI のデータ準備の最終段階を簡素化するネイティブのノーコード機能である Data Flow を導入しています。Data Flow は、データセットを視覚的に組み合わせて形成するための直感的なドラッグ アンド ドロップ インターフェイスを提供し、セルフサービス機能と適切なガバナンスのバランスを取ります。このアプローチは、データの整合性とセキュリティを維持しながら、データ準備を民主化することを目的としています。
引用:Qlik Help
引用:Qlik Help
Tableau Prepを触ったことがある方は、それに類似したツールと思っていただければ。
上記内容含めて、私の考えをまとめると以下のような使い方になるのかなと考えています。。。
データフローのエディター
データフローは、「エディター」という画面上で処理フローの設計、実行を行います。
エディターは以下のレイアウトで構成されています。
基本的には、Qlik Senseのアプリ構築画面と類似しています。以下が詳細です。
- アセット
- キャンバス(フロー)に追加できる全ての処理などが含まれ、ここから追加できる
- キャンバス
- 構築するフロー全体を表示し、各処理の接続や順序変更などを行える
- プロパティ
- キャンバスで選択している処理の構成変更を行える
- プレビュー
- 各処理時点のデータの状態、スクリプトを確認できる
どんな処理ができるのか
このデータフローという機能において、
どのような入力(ソース)・処理(プロセッサー)・出力(ターゲット)が用意されているのか。
※カッコ内はQlikデータフロー機能での呼称です
※2025/2/12現在
入力(ソース)
大きく2種類の入力ソースが用意されています。
➀カタログに保存されているデータセット(.qvd、xls、csv、parquet、json など)
➁外部ソース(添付以外にも複数用意されています、詳細はこちら)
処理(プロセッサー)
約20種のプロセッサー・処理機能が用意されています。
種類が多いので、個々には触れませんが、データ準備に必要な処理は大方カバーできているのではないでしょうか。
長年のQlik上級ユーザーには、Qlik scriptプロセッサーがあるので、スクリプト挿入すればどうにかなる安心感がありますね。(良くないw)
引用:Qlik Help
出力(ターゲット)
入力同様に、大きく2種類の出力が用意されています。
➁については、入力と若干コネクタの数が制限されます。
➀カタログに保存されているデータセット(.qvd、.parquet、.txt、.csv )
➁外部ソース(入力とは異なり、添付のコネクタのみ)
※ファイル形式での保存のみ対応
制限事項
最新の制限事項はこちらからご確認ください。
おわり
いかがでしょうか。
個人的には以下の点が特に気に入っています!
・Qlik Senseでアプリを構築する時とほぼ同じ操作感でデータ準備ができる
・スクリプトが自動生成されるので、スクリプトの勉強になる
(ベストプラクティスな書き方かは別)
日々データマートや分析データセット作成に追われている方々へ、
ユーザーにこのデータフローの利用を促してみてはいかがでしょうか。
次回は実際にサンプルデータを使って、データフローを触ってみたいと思います。
それでは。