この記事は、『ゼロからわかる!Tableau入門講座』の第3回の記事です。
目次はこちら。
今回は、複数のデータを結合する方法を解説していきます。
前回の最後の画面の左下の「データソース」を選択します。
そうすると、データソースの編集画面へ移ります。
この画面の構成は以下のようになっています。
①接続
現在どのデータに接続されているのかが表示されています。
②シート
接続しているデータに含まれているシートが表示されています。
③データ
データへの接続状況が表示されています。
現在は、「サンプル - スーパーストア」の「注文」シートへ接続していることが分かります。
複数のデータを結合させるときには、ここで操作をします。
④明細
データの明細が表示されています。
さて、データソース「サンプル - スーパーストア」には、
・注文
・返品
・関係者
の3シートが含まれているのに、現在は「注文」シートにしか接続されていません。
このままでは、どの商品が返品されたのか分からないので、「返品」シートを「注文」シートへ結合させましょう。
「返品」シートを「注文」シートの隣までドラッグ&ドロップすると、、、
「注文」シートと、「返品」シートが繋がりました!
「注文」シートと、「返品」シートが重なっている部分を選択すると、このように表示されます。
これは、「注文」シートと、「返品」シートが内部結合していて、「オーダーID」をキーとして結合していることが表されています。
内部結合とは、簡単に説明すると、両方のシートにある「オーダーID」に関連する値のみ保持する結合のことです。
つまり、いま画面の下半分に出ている明細は、全て返品された商品についての明細になっています。
(結合については他の記事で詳しく書きます)
今回は、返品されていない商品についても分析していきたいので、左結合を選択します。
左結合を選択することで、「注文」シートのデータは全て保持され、その中で返品された商品にのみ、「返品」シートのデータが結合されます。明細を見てみましょう。
オレンジ色の枠で囲ったレコードは返品されていない商品で、緑色の枠で囲ったレコードは返品された商品であることがわかります。(返品の項目が○になっているのが返品された商品です。)
今回はここまでです、お疲れ様でした。
これで、分析用のデータ準備は終わりましたので、次回からグラフを作成していきます!
それでは、また次回の記事で。