Qlik Senseナレッジ - INSIGHT LAB

【Qlik Sense】一部のレコードのみをロードする「First」「Sample」プレフィックス

作成者: Noa|2024年10月02日

はじめに

この記事では、Qlik Senseのプレフィックスである「First」と「Sample」について説明し、それらの違いと使用方法をご説明いたします。

プレフィックスとは?

「接頭辞」という意味。Qlik Senseでは、「Join」「Concatenate」などもプレフィックスと呼ばれます。

 

「First」について

「First」プレフィックスは、データソースから指定した数のレコードのみをロードするために使用されます。例えば、「First 10」と指定すると、先頭から10レコードのみがロードされます。大量のデータを扱う場合、スクリプトのテストやデバッグを行う際に非常に便利です。

例として、20日分の売上データを作成しロードします。Firstプレフィックスを使わずに通常通りロードすると、下図のように20レコードが生成されます。

次に、Firstプレフィックスを用いて上記のデータをロードするとどうなるでしょうか?

このように、先頭の5つのレコードのみが取り込まれました!売上の合計を見ても、5レコード分のみが集計されていることがわかります。

 

「Sample」について

「Sample」プレフィックスは、データソースからランダムに選ばれたレコードをロードするために使用されます。例えば、「Sample 0.3」と指定すると、各レコードが30%の確率でロードされます。

ここで注意していただきたいのは、「レコードの合計数の30%がロードされる」のではなく、「各レコードがアプリケーションにロードされる確率が30%ある」ということです。このプレフィックスは、「先頭から〇レコード」のような偏ったサンプルではなく、全体から満遍なくサンプルを取得したいときに役立ちます。

先程と同じデータを用いて、Sampleプレフィックスを記述するとどのようにレコードが取り込まれるのでしょうか?

20レコードのうち8レコードがランダムに抽出されました!

「Sample 0.3」としても、20レコードの30%である6レコードが取り込まれるわけではないことが上図からもわかります。試しに10回リロードしてみましたが、取り込まれるレコード数は2から10とばらばらです。

 

おわりに

このように、Qlik Senseの「First」と「Sample」プレフィックスは、それぞれ異なる目的でデータの一部をロードしたいときに役立ちます。これらを適切に使い分けることで、データのロードプロセスを効率化しましょう!