この記事では、Qlik Senseのプレフィックスである「First」と「Sample」について説明し、それらの違いと使用方法をご説明いたします。
「接頭辞」という意味。Qlik Senseでは、「Join」「Concatenate」などもプレフィックスと呼ばれます。
「First」プレフィックスは、データソースから指定した数のレコードのみをロードするために使用されます。例えば、「First 10」と指定すると、先頭から10レコードのみがロードされます。大量のデータを扱う場合、スクリプトのテストやデバッグを行う際に非常に便利です。
例として、20日分の売上データを作成しロードします。Firstプレフィックスを使わずに通常通りロードすると、下図のように20レコードが生成されます。
次に、Firstプレフィックスを用いて上記のデータをロードするとどうなるでしょうか?
このように、先頭の5つのレコードのみが取り込まれました!売上の合計を見ても、5レコード分のみが集計されていることがわかります。
「Sample」プレフィックスは、データソースからランダムに選ばれたレコードをロードするために使用されます。例えば、「Sample 0.3」と指定すると、各レコードが30%の確率でロードされます。
ここで注意していただきたいのは、「レコードの合計数の30%がロードされる」のではなく、「各レコードがアプリケーションにロードされる確率が30%ある」ということです。このプレフィックスは、「先頭から〇レコード」のような偏ったサンプルではなく、全体から満遍なくサンプルを取得したいときに役立ちます。
先程と同じデータを用いて、Sampleプレフィックスを記述するとどのようにレコードが取り込まれるのでしょうか?
20レコードのうち8レコードがランダムに抽出されました!
「Sample 0.3」としても、20レコードの30%である6レコードが取り込まれるわけではないことが上図からもわかります。試しに10回リロードしてみましたが、取り込まれるレコード数は2から10とばらばらです。
このように、Qlik Senseの「First」と「Sample」プレフィックスは、それぞれ異なる目的でデータの一部をロードしたいときに役立ちます。これらを適切に使い分けることで、データのロードプロセスを効率化しましょう!