お問い合わせ

目次

箱ヒゲ図で都道府県別お酒の消費量を分析

以前、箱ヒゲ図についての作成方法をこちらでご紹介いたしました。
今回はオープンデータを使って都道府県別のお酒の消費量について箱ひげ図作成し、「どの県で何のお酒が人気なのか?」を調べてみようと思います。

私の勝手な先入観かもしれませんが、九州地方の人は焼酎が好きで、東北地方の人は日本酒が好きなイメージがありませんか?
今回はそのイメージが私の勝手な思い込みなのか、それともデータから客観的にみて当たっているのか、確かめてみようという試みです。

このような分析をする場合、都道府県名を横軸、お酒の消費量を縦軸にしたヒストグラムを作成してもいいですが、横軸に47都道府県をずらっと並べ、さらにお酒の種類の数だけグラフを作成するとなると、たくさんのチャートを作ることになりますよね....

こんな時に箱ひげ図を作成すると、コンパクトに数値のばらつきを表現することができます。

箱ひげ図を作るためのデータを準備

使用するオープンデータは以下の2つです。

1. 都道府県別お酒の消費量データ

国税庁で公開している「都道府県別の販売(消費)数量」を使います。
以下のサイトからダウンロードが可能です。

https://www.nta.go.jp/publication/statistics/kokuzeicho/sake2019/shuzei.htm

2. 都道府県別人口データ

単に都道府県別の消費量をみると、人口の多い都市部の消費量が多い、という結果になることが予想されます。
それでは都道府県別にどのお酒の人気があるのかという特色が見えないため、お酒の消費量を都道府県ごとの成人人口で割ることにより、「成人一人あたりに対するお酒の消費量」をみてみようと思います。
都道府県別の成人以上の人口についてはe-statからデータを取得できます。

https://www.e-stat.go.jp/dbview?sid=0003312321

1.のデータが「令和元年度」のデータですので、人口データもその年度に合わせて取得したかったのですが、平成30年度までしかデータがなかったので、今回は平成30年度の人口を使用します。

読み込んだデータを分析できる形にする

 

①Tableau Desktopを起動し、データに接続

まず都道府県別人口データに接続します。

今回は成人人口を使用したいので、年齢五階級のカラムで以下のようなグループを作成しました。

次に都道府県別のお酒の消費量データを「新しいデータソース」として追加します。
ただしこちらのデータは、読み込みするだけでは、分析する形として適していませんので、
データインタプリターを使ってデータを読み込みました。

データインタプリター便利!ありがとう!!

さらにお酒の種類が列名に入って横持ちになっているので、ピボットしてデータを縦持ちにしましょう。
列の名前は適宜修正してください。

こちらもフィルター設定と列の非表示で必要な項目のみに絞ります。

これでデータがやっと分析できる形になりました!

Tableauで箱ひげ図を作成する

さて、前置きが長くなりました。いよいよ本題の箱ひげ図の作成に入ります。
以下の手順に沿って、箱ひげ図を作成してみましょう。

①成人ひとりあたりのお酒の消費量を算出するため、以下のように「成人一人あたり消費量」を計算フィールドで作成します。

②列に「お酒の種類」、行に「成人一人あたり消費量」を配置

 ③都道府県名を詳細に配置します。
 棒グラフが都道府県別に分割された形になります。
 
 
④マークを「円」に変えて、サイズを調整します。
 
 
⑤アナリティクスタブから箱ひげ図を選択し、シート上でドラッグ&ドロップします。
 
 
箱ひげ図が出来上がりました!
 
ラベルで都道府県名を表示しましょう。
 
 箱ひげ図ができましたー!
※ひげの位置はデフォルト四分位範囲×1.5に設定されています。
 箱をクリック>編集>ヒゲの拡張範囲でヒゲの位置を設定することができます。

 

焼酎が好きな都道府県は?

 
では「九州の人は焼酎が好きそう」という私の予想が当たっているか確かめるため、作成した箱ヒゲ図で「焼酎」に注目してみましょう。
 
 
※焼酎の項目には「単式蒸留」と「連続式蒸留」がありますが、一般的に「本格焼酎」と呼ばれる焼酎は「単式蒸留」らしいので、こちらを参照。
 
予想通り、鹿児島が1位、その次に宮崎と断トツで九州地方の消費量が飛びぬけています。

次に「東北地方の人は日本酒が好きそう」という予想についても確かめてみましょう。
 
 
日本酒では新潟県が1位、その次に秋田県、山形県と続いていました。
こちらについてもおおむね予想が大きく外れておらず、寒い地方では日本酒が好まれることが分かりました。他にも「果実酒」は山梨県が消費量1位になっており、やはりワインの生産が盛んな影響なのかもしれませんね。
 

おわりに

こうやってイメージとデータから見える結果を照らし合わせると予想が当たっても外れても面白いですね。
自分の出身地についてどんなお酒が人気があるのか、確かめてみると意外な結果が見えてくるかもしれません。
ぜひ箱ヒゲ図で遊んでみてください!
 

Tableauを体験してみませんか?

INSIGHT LABではTableau紹介セミナーを定期開催しています。Tableauの製品紹介や他BI製品との比較だけでなく、デモンストレーションを通してTableauのシンプルな操作性やプレゼンテーション機能を体感いただけます。

詳細はこちら

BI LAB編集室

執筆者 BI LAB編集室

BI LAB(データ活用研究所)編集室です。 BI、AI、DWHなどデータ活用に関するトレンドやニュースやコラムをほぼ毎日配信しています。押さえておきたい基本知識から、最新ニュース、事例インタビューやお役立ち情報・セミナーレポートまで、データ活用の専門家ならではの視点と情報量でお届けします。

1 分で読むことができます。

ゼロからわかるBIツールTableau(タブロー)使い方 入門講座の目次

1 分で読むことができます。

Tableauの日付関数入門【DATEDIFF】

1 分で読むことができます。

【Tableau】日付関数入門【DATEADDで日付を可算】

2 分で読むことができます。

Tableauを使ってデータを結合してみよう!

1 分で読むことができます。

Tableauでダッシュボードを作成してみよう!