どんなグラフも単純なデータの組み合わせ
データサイエンティストなどの専門家が分析で使用しているチャートについて解説していきます。こうしたテクニックをビジュアルアナリティクスと呼ぶ場合もあります。
グラフを作成することに苦手意識を持っている人は少なくないのではないでしょうか。以下にチャートの使い方を紹介していきますが、実は、見た目は派手でも裏側では単純な集計を組み合わせていたりすることが多いです。「チャートの基本10パターン:可視化のエッセンス」で紹介した分析の基本10パターンのどれを使っているかがポイントです。どのパターンの表現をしたいかから発想すれば、グラフ作成の方向性は決まってくるはずです。
1. ベン図|円にして大きさと重なりを比較する
ベン図は、集合の範囲や関係を円の大きさや重なり、位置で表現するグラフです。グルーピングしたデータの重なり具合によって関連性を直感的に把握することに優れています。
このベン図は、某商品についてキャンペーンを複数回実施した効果を見るために、購入者を男女別や年代別などの分析軸によって分類したものです。購入者数を円の面積に比例させることで、キャンペーンA、B、Cそれぞれの効果が一目瞭然となります。
さらに購入者をAだけ、Bだけ、Cだけ、AとB、AとC、BとC、ABCすべての7つにグルーピングして、各グループの人数を直感的に把握することも可能です。
この図は、さらに深い分析ができるように作り込まれています。マウスをクリックするだけで、円が重なっている部分の男女比や年齢構成をみたり、全体のデータから男女別や年代別に母数を絞り込んでベン図を再描画できるように設計してあります。全体とサブグループの傾向の違いを見比べることで、キャンペーンの効果に関する知見がえられるわけです。
ベン図は小学校で集合を習う時に登場する、極めて一般的な図ですが、定性分析でも使われる機会が多いものです。
2. メッコチャート(マリメッコ、モザイク図、メッコグラフ)|複数の要素を積み上げと面積で表現する
メッコチャートはクロス集計の結果を面積で表現しています。数値の大小と構成比を同時に視覚化することに優れた手法です。以下の図は、あるアパレル企業のブランド別の顧客数を年齢層別に表示したもので、横軸の幅が各ブランドの売上高、縦軸が各ブランドの顧客の年齢層別構成比となっています。ブランド別・年代別の顧客数が面積であらわされるため、全体を眺めつつ重要度の高い顧客グループの年齢構成の特徴や全体に占めるウェイトを、直感的に把握することができるのが分かるでしょう。データアナリストが便利に使うチャートのひとつです。
このメッコチャートは、顧客数が最も多い左端のブランドについての時系列グラフです。ここからは年齢構成はほとんど変わっていないことが明らかになります。つまり、何らかのキャンペーンで急に顧客が増えたのではなく、安定的に売れているブランドだという仮説が見えてきます。
この数値からどうアクションを起こすのかは経営的な判断です。他のブランドと比べて構成比が多い50代に合わせて商品戦略を修正するか、あるいは年齢構成を修正するためにプロモーション対象を若い年代に調整していくのかの選択肢が浮かび上がってきます。
このような有用性にもかかわらずメッコチャートがあまり利用されていないのは、EXCELを代表とする表計算ソフトに、このメッコチャートを描く機能が含まれていないことが最大の理由なのかもしれません。
#BIツール「QlikView」を使ったメッコチャートの作り方
3. ランキング:ABC分析|重要度で並べた順に傾向を探る
次はメッコチャートの応用例です。ビッグデータ分析をマーケティングに活用する代表例の一つが顧客のセグメント化です。セグメント化するための範囲設定は業種や企業、分析の目的によって変わってきますが、ここでは年間購入学によって顧客をA(最高)~E(最低)の5段階にセグメント化しました。一般的にはABC分析と呼ばれる手法です。
この図(ABC分析)は顧客を前年度のA~Eの幅が当年度の顧客数、縦軸が前年度の同分類の数を表しています。これによって、前年度からランクアップした顧客数、変化なしの顧客数、ランクダウンした顧客数の動向が一枚のシートにまとめられ、それぞれのウェイトが面積によって直感的に把握することができます。売上高順に顧客を並べるのではなく、グルーピングすることで大きな流れを見ることができるようになったというのが、このチャートのポイントです。
さらに各セグメント、たとえば昨年BランクからAランクへとアップした顧客など、チャートの当該部分をクリックすると、個々の顧客の内訳を詳しく見ることができるように設計されています。このグラフは、顧客の動向を見るだけでは終わりません。より細かな販売戦略の立案の実施に利用できる顧客リストを呼び出すことができます。同じBランクにいる顧客であっても、前年度からアップした顧客には、それが続くようにより高いインセンティブを自動的に付与しておけば良いでしょう。一方で大きくダウンした顧客に対しては、離脱する恐れがあるので個別で電話をかけるなど、これまでと違った手厚いアプローチをしなければなりません。前年と比較することで、同じカテゴリーに入る顧客にもまったく違うプロモーションをする戦略が浮かび上がってきます。
4. パレート図|重要なアイテムを見つける
前項で紹介したABC分析とは、重要度に応じて、商品や顧客をA、B、Cとクラス分けし、それぞれに応じた管理をする手法のことであり、「2割の品目が売上の8割を占める」という経験則(パレートの法則)からグループ分けをしています。
この図では様々な品目を販売金額の構成比の高い順に並べ、その累積比率が~70%のグループをA、70~90%をB、90~100%をCの3つに分類しています。
パレート図は、ABC分析を行って各品目の値を多い順に左から棒グラフで並べ、その累積比率を折れ線グラフにして重ね合わせたもので、ABC分析の可視化によく用いられる手法です。この図の例では、折れ線グラフを追っていくことで、売上の50%は構成比の上位4品目、同80%は8品目、同95%は12品目で占められていることが判明します。
この商品群のどこに注力するかは、戦略次第です。ここから先が人間が判断する部分です。インターネットの登場以前は、利益が出にくい下位の品目は捨てて上位の品目に注力すれば収益率が向上する、という考え方が企業戦略の常識になっていました。それをひっくり返したのがアマゾンです。多品種にわたる商品の管理コストが下がったことから、重要度が低く切り捨てられてきた商品を「地理も積もれば山となる」とばかりに意識して取り扱う「ロングテール戦略」が成功したのです。これはパレートの法則とは真逆の考え方であり、リアル店舗とネット通販の根本的な違いともいえます。
パレートの法則に従うのか、ロングテール戦略を採用するのか。いずれの道を選ぶにしても、まずはABC分析によって自社商品の構成をしっかりと認識しておくことが必要です。
#BIツール「Qlik Sense」でパレート図を作るとこうなります
5. CPO分析|顧客のグループを重要度の順で並べ替える
重要度の指標を使って積み上げる考え方はさまざまなところで採用されています。医療では、災害時など需要に対して医療資源が不足する場合に、緊急度や重要度に応じて治療の優先順位を決めるトリアージが行われます。残酷な言い方になりますが、助かる見込みのない患者、治療の緊急性の無い患者は後回しにするのです。これは医療に限らず、資源制約・予算制約がある他の分野にも応用できる概念です。
例えば、会員制通販会社が会員に広告を郵送する場合を考えてみます。予算が潤沢で費用対効果を考慮する必要がないのであれば、全会員に郵送すればよいのですが、現実には予算に限りがあることが多く、なるべく費用対効果を高めたい。そうなると、顧客を費用対効果の高い順に「トリアージ」することが解決策になります。これをどうやって分類するのか。
図に示した例では、
- 顧客を性別と年代別にカテゴライズする
- それぞれのレスポンス率(以下レス率)で優先順位を決める
- 予算の範囲内で優先順位の高い順から広告を郵送する
1つ1つの◯がカテゴリ(例えば女性・80代)、◯の大きさがリスト数(会員数)、横軸を累積リスト数、縦軸にレス率とほぼ相関しているCPO(Cost Per Oder:注文を取るためのコスト効率)を取ってグラフ化しています。
CPOの累積額は、裏返していえばプロモーションにかけられる予算でもあるので、CPOが上限7000であれば、7000から水平線を伸ばし、折れ線との交点となった点から下の目盛りを読んで、郵送先は約3万人までと決められます。逆に、会員4万人に郵送するのであれば、それに応じて必要なCPOと予算が見えてきます。
このチャートを使いながら、様々な仮説と検証を繰り返して、自らの顧客の特性を明らかにしていくことで、収益構造の改善や新たな戦略づくりが実現するのです。
さまざまな企業の分析を手伝っていると、重要顧客をあぶり出して効果的に予算を投入するという当たり前のプロモーションは、意外なほど実践されていない実情に行き当たります。漫然と顧客全体を対象にアプローチしてしまっているのです。しかし、ランク化、グループ分けの効果は絶大です。購買状況やレス率を丁寧に追ってグルーピングするという作業を軽視せず、ABC分析をもっと重視するべきなのです。
6. 変化の可視化|フラグを立てる
ビジネスにおいては、顧客がどの商品を購入しているのかを把握することが重要であるのはもちろんですが、購入商品の変化を適宜把握することもそれに劣らず重要です。
販売データから変化の傾向を抽出することになりますが、表計算ソフトではかなりの手間がかかります。手作業が必要になる上に、表計算量も多く、機動的にデータアナリティクスをすることは難しいといえるでしょう。
データの塊の中に埋もれた「顧客の購買行動変化」が宝であることは分かっているのですが、効率的な掘り出し方の知識がないために、持ち腐れになっているのです。
ここでどうやるか。
販売データをデータベースに蓄積する際に、購入商品の変化があった時点で「ここで変化があったよ」という目印(フラグ)をデータに付けておくよう設定するのです。こうすればフラグをチェックして、当該するデータを取り込んでいくことで、変化が起きている状況を簡単に集計できるようになります。これは大量のデータを事後に分析する際の効率を高めるだけでなく、フラグが立った、つまり、購入商品が変わった時点をリアルタイムで確認することにも利用できます。
図は、通販会社のデータです。購入した商品が変化した顧客数を商品の組み合わせ別に時系列で可視化したものです。
違う商品を買う行動をクロスセルと呼びますが、通販ではこのデータが重視されています。クロスセルの集計結果を作成したグラフとしては極めて単純ですが、裏側でフラグを立てるという一手間をかけているから簡単に作成することができるのです。
7. レーダーチャート|複数の指標と項目を総合的に比較する
分析対象を評価する指標が複数ある場合に、指標ごとにレベルを一目でわかるようにしたものがレーダーチャートです。
よく目にする事例としてはロールプレイングゲーム(RPG)のキャラクターのパラメータ設定があります。パラメータには体力、攻撃力、防御力、回復力、スピードなどがあり、それぞれのキャラクターによって強い分野と弱い分野が異なっています。個性が異なるキャラクターをうまく組み合わせることがRPG攻略のコツですが、レーダーチャートを使えば、各キャラクターの個性の違いを一目でわかるように可視化できます。ゲームソフトで使われることが多い理由は、この視認性にあります。
ビジネスにおいても、商品の強み・弱みを把握することは基本中の基本です。例えば、消費者にアピールしたいポイントが複数ある場合、各々のポイントがどの程度評価されているかによって、他社との差別化や広告の内容が異なってきます。
図は、ある消費財のポータルサイトへのアクセス者の行動分析です。同じジャンルの商品の訴求内容が異なる5つの広告を選び、それぞれ8つのKPI指標に照らしてて広告効果の強弱を測定してあります。KPI指標は「初回接触数:最初にクリックした商品かどうか」「IMP:閲覧数」「CT:クリックされた数」「CTR:クリックされた比率」「商品訴求CV数(CVR):商品名を訴えるサイトに移行した数(Rは比率)」「機能訴求CV数(CVR):機能面を訴求するサイトに移行した数(Rは比率)」です。
レーダーチャート自体は、珍しくも作製が難しいわけでもないのですが、ポイントは使い方の発想です。複数の商品(ここでは広告)の複数のKPIを一目で比較できるようになっていますが、これによって広告の訴求ポイントによってどんな行動に誘引できたのかがはっきりします。同じ商品ジャンルであっても、訴求するポイントが変われば消費者の行動がまったく変わるという実態には、少なからず驚かされるのではないでしょうか。
広告と販売をどのように組み合わせれば効果的なのか、マーケティング戦略を策定する際に有効な、説得力のあるデータになっていることが、分かるでしょう。
8. KPIの体系化|ツリー状につなげる
戦争においては戦略と戦術の違いや「戦術で勝って戦略で負ける」ことの危険性が指摘されるように、ビジネスにおいてはゴール(目標)とそのための手段の関係を明確化することが重要です。ゴールの指標はKGI、そのための行動の指標はKPIです。
エリヤフ・ゴールドラット著『ザ・ゴール』(三本木亮訳 ダイヤモンド社 2001年)で繰り返し強調されているのは、各部門・担当者レベルでの最適化(=高パフォーマンス追求)、すなわち部分最適(局所最適)が必ずしも全体最適にはつながらないことです。このような「合成の誤謬」を回避してゴールを達成するためにデータを使ってシミュレーションする際に、KPIとKGIは不可欠です。
KPI、KGIを設定しておいて、各々のKPIの変化がその他のKPIや全体のKGIにどのような影響を与えるかをシミュレーションすれば、合成の誤謬を回避することができます。そのシミュレーションを可視化するために、KGIを頂点として各KPIをツリー構造に体系化しておきます。
図は「前年比増収」をKGIにしたツリーです。それらの要素となるアクティブ顧客数、年間平均購入額、平均オーダー購入額、平均リピート回数がKPIとして繋げられています。
まず売上高を顧客数×平均購入額に分解することで、平均購入額は上昇したがアクティブ顧客数は減少したことが分かります。
平均購入額をさらに平均オーダー購入額×平均リピート回数とすると、平均オーダー購入額の減少を平均リピート回数がカバーしたことで平均購入額をプラスにできたことが見えてきます。アクティブ顧客数、平均オーダー購入額、平均リピート回数をクリックするとさらに細かくブレイクダウンした数字が示されるので、どの項目の変化がどのKPIの変化を通じてKGIにどの程度影響したかを容易に把握することができます。
ここまでは過去のデータの分析ですが、この事例の特徴は、数字を変えて試行錯誤ができることにあります。各KPIの数字をさまざまに変えてみて、KGIの変化をシミュレーションすることができるように設定されています。
今後は経営資源をどこに投入すればKGIを最大化できるのか、仮説検証を繰り返しながら、戦略を練ることができるのです。
9. 顧客動向の可視化|データの切り口を変える
顧客へのマーケティングを個別化(パーソナライズ)するためには、販売行動の履歴から「活性度」によってカテゴリ化することが有効です。最終購入日が1年前の顧客と1日前の顧客では、後者の活性度が高いと評価できるので、指標として「最終購入日から現在までの経過時間」を重視すべきです。
顧客を「レンタルビデオ」に例えてみましょう。新規顧客は貸し出しのために新たに購入した新作、既存顧客は1回以上貸し出された在庫分に相当します。活性度が高い顧客は貸し出し頻度(回転率)が高い作品、活性度が低い顧客は貸し出し頻度が低い作品です。貸し出し頻度によって作品の品揃えを変えていくように、活性度によって顧客へのアプローチを工夫するのです。
下図は新たにオンラインサービスを開始した旅行会社の会員数を、登録時期が古い順に積み上げたものです。これはレンタルビデオ店に並んでいるすべての作品を想像してください。ストックの概念です。
これだけ見れば順調に会員数が増加していることを読み取れます。まるでミルフィーユのようにコンスタントに会員数が積み上がっていて担当者は「優良顧客が順調に増えている」と満足しがちなのですが、ここからはだれが優良顧客なのかは見えていません。評価すべきは「収益に貢献してくれる顧客」の存在です。
会員の利用状況を知るために作成したのが次の図です。これは、左のグラフで使った同じデータを再集計し、直近半年など一定期間の間に利用した会員を抜き出し、前回の利用からの月数によって再分類したものです。いわばフローの概念です。
この図からは、サービス開始から10年以上経過した現時点でも、実際の利用者の約半分が新規入会者であること、過去3ヶ月以内の利用実績がある会員が残りの約半分を占めていることが見て取れます。レンタルビデオに例えると、新作映画と定番の人気作品だけで貸し出しのおおよそ7~8割を占めているということになります。
ここからは、会員数というストックの概念は将来にわたっての売り上げを保証するものではなく、左のグラフは顧客獲得実績の過去の記録以上の意味はないという結論を導き出せます。
収益向上を目指すのであれば、ここから二つの戦略が見えてきます。これは経営的な判断です。
ひとつめは新規顧客の開拓と既存会員に対してのリピート率を上げる戦略、もうひとつは過去に顧客となったことがある休眠顧客を掘り起こす戦略です。そのどちらに対してもこの事例では、グラフの対象となる部分をクリックすることで、顧客リストを呼び出せるように設計されているので、戦略的なアプローチは簡単に実行に移せます。
10. 減衰率と安定率|顧客の浮気度を可視化する
消費者が繰り返し購入する品目(ティッシュペーパー、コンタクトレンズなど消耗品全般)を選ぶ場合、類似の商品をA、B、C……と試しに買って比較してから、お気に入りのブランドを固定化すると考えられます。
これを個々の商品・ブランドの側から見れば、初回購入者が2回目、あるいは3回目に離反していく比率を「減衰率」として捉えることができ、減衰率ゼロは、安定的に繰り返し購入してくれる顧客だけになったことを意味します。
この減衰率がゼロになるまでの購入回数を比較することで、その商品・ブランドが固定客をグリップする「吸引力」を測ることができるという考え方で、このグラフは設計されています。同様に、ある商品・ブランドをn回目に購入した消費者が、n+1回目に同じ商品・ブランドを購入する確率を、顧客を逃さない「安定率」として捉えています。
図は、ある消費財のブランドの「浮気度」をグラフ化したものですが、減衰率の上図と安定率の下図は、裏表の関係にあります。減衰率のグラフでは、オレンジ色のブランドは減衰率の変化が大きいことが分かりますが、他のブランドについては詳細がわかりません。
そこで安定率を検討するのですが、A社の商品の安定率は4回目以降100%となっているのに対して、他4社の商品について顧客の浮気度には大きな差は認められず、10回目を過ぎても安定していないことがわかります。つまり、消費者は他4社の商品を決め手に欠ける「一長一短」とみなしているのに対して、A社の固定客になった消費者は、同社の商品に他4社とは一線を画する特長を見出していることが示唆されます。
このように、減衰率あるいは安定率を可視化することで、競合商品との差別化のヒントを直感しやすくなることが、このチャートの特徴です。
では、実際にどのようにブランドの移動が起きているのか。グラフをご覧ください。これは真ん中を基準に、上は同じ顧客が前回購入時に選んだブランド、下が次の回に選んだブランドです。これだけだとシェアの変化率でしかありませんが、色分けされたそれぞれのブランド購入者に絞って、前回と次回の購入ブランドをクリックだけで再集計できるよう設計してあります。
もっとも左のブランドに絞って調べたのが次の図です。このデータで初めて、他ブランドからの流入状況、他ブランドへの流出状況が明らかになるのです。各ブランドの特徴と重ね合わせて検討することで、ブランド流入出の原因が価格にあるのか、機能、イメージ、プロモーションにあるのかがおぼろげならが見えてきます。ここまで分析して初めて、データに裏付けられた販売戦略の立案が可能になるのです。
シェアが安定しているとしても、流出/流入が共に少ない場合と多い場合では「安定」の意味合いが異なってきます。顧客の流れを見るのがこの分析のポイントです。
11. ヒートマップ|色分けしてざっと眺める
全体を俯瞰して、データの偏在状況を確認する場合に便利なのが、ここで紹介するヒートマップです。
ヒートマップは数値を大小によってグループ分けして、そのグループを色に置き換えることで作成できます。天気予報で使われる全国の気温を色分けした地図のようなものと考えればいいでしょう。気温の場合、高くなるほど赤みが濃く、逆に低くなるほど青みが濃く表示されますが、2018年夏のように濃い赤に染まった地域が全国に広がった日本列島地図を見せられると、猛暑の実感が湧いてきます。これがヒートマップの可視化の効果です。
同じようにヒートマップをウェブサイトのアクセス分析で使ったのが上記の図です。アクセスが多ければより青、アクセスが少なければよりグレーのように色を設定してあります。これで数字を読まなくてもアクセス状況を気温のように実感(体感)できるというわけです。
左がPCから、右がスマートフォンからのアクセスです。PCからのアクセスは平日の勤務時間、スマートフォンからのアクセスは平日の昼休みと退社後(金曜日の夜はやや少ない)・土日は睡眠時を除いてほぼ全日アクセスが多いという傾向が一目でわかります。使用デバイスによって利用者の行動が違うということが分かれば、それぞれのカテゴリに応じたWEBデザイン切り替えなど、次の戦略へとつながっていきます。
ためしに色を使わず数値だけで構成された表も作製してみましたが、数字だけの場合、全体の傾向をつかむには、数字の桁数と4桁目の数字だけを頼りに中身を追うことになるのですが、結論を得るまでにかなりの時間がかかるだけでなく、全体の傾向を何となく把握することはとても難しかったです。そのため見落としも多くなるはずです。おおざっぱに全体の傾向を読み解くためには、ヒートマップを使った可視化が大きな力を発揮するのです。
EXCELのような表計算ソフトでも同じようなヒートマップを作成することはできますが、BIツールを使った場合、動的な分析が可能になることが大きな違いです。動的とは、変化を付けられるという意味です。色づけのグルーピングも自在に変えていくことができるので、データの分布を詳細に分析する、特定のデータを抜き出したマップを作成して全体と比較する、さらには時間や曜日、季節ごとの変化をアニメーション化して動きをみるなど、切り口を変えた突っ込んだ分析に効果を発揮します。
12. 滞在時間|線の角度と密度で表現する
店舗やWEBサイトにおける顧客行動の重要指標の一つが「滞在時間」です。それを可視化したものが下図です。注目していただきたいのは一番下の、斜めの線がさまざまに交錯しているグラフです。これはあるスーパーの店舗で「切り身さけ・サーモン(生)」を買った顧客のデータから作成しました。
一番上のグラフでは、それぞれの顧客の入店時間~退店時間を一本一本の横軸で示しています。このグラフを縦軸で切って、切断された横線の数を時系列で折れ線グラフで表したものが下部分です。つまり特定の時間に滞在していた顧客数の推移が真ん中のグラフということになります。通常はこの二つのグラフを使って、「滞在時間の平均的な推移」や「店舗の混雑ぶり」を判定することになるのですが、この二つでは、まだ全体の流れが見えてきません。
滞在客数の変化は折れ線グラフでわかります。しかし、滞在時間が時間帯によって違うのかどうかという行動パターンと店舗の混雑具合を一目で判断するには、二つのグラフを見比べなくてはならず、経験を要します。それを解決したのが一番下のグラフです。
これは一つ目のグラフをアレンジしたもので、顧客の入店と出店の時間を斜線によって表したものです。斜線の上端が入店時間、下端が退店時間なので、傾きが急なほど滞在時間が短く、ゆるやかなほど長時間滞在したことを意味します。斜線の粗密は各時間帯に滞在している顧客の数を反映しています。二つの要素を直感的にとらえることで、大まかながら客の行動が見えてくる、これが3番目のグラフの特徴です。
もちろん、細かい滞在客数は2番目の折れ線グラフの方が分かりやすいのですが、店舗における分析で必要なことはそれだけではなく、むしろ客の行動パターンの方が重要な情報となることもあります。
この事例でいえば、「切り身さけ・サーモン(生)」を買う客は何時頃に来店し、その客の滞在時間は短いのかどうかが問題解決のヒントになるということです。滞在時間が短ければ(斜線が急な傾きであれば)、買うものがあらかじめ決まっている忙しい客であり、価格での訴求よりは、商品を切らさないことが重要となります。逆ならば、メニューの提案などを組み合わせて購買に導くというように、店舗内での戦略が大きく変わってくるのです。
ここでは「切り身さけ・サーモン(生)」を買った顧客だけについて示していますが、他の商品あるいは商品分類別、売り場別などでも同様のチャートをクリックで作成することができます。商品別、売り場別、季節別など、さまざまな切り口で顧客の動きを可視化して比較していけば、これまで見えていなかった顧客心理が浮かび上がってきて、売上増加につながる気付きが得られるはずです。
13. 経路の可視化|空間に配置する
前項では店舗内での滞在時間を可視化しましたが、ここでは店舗内での移動経路を可視化しました。下図の右下が入口、中央やや上がPOSレジです。
何かを購入した顧客は入口→売場→レジと移動するが、途中の移動経路の組み合わせは膨大な数になるので、数値での表現にはなじみません。一覧表にするのではなく数値を空間に配置してはじめて、顧客の移動パターンが理解できます。
この図では一つ一つの楕円が日用雑貨、農産、畜産、飲料等の売場を表しています。楕円の位置は実際の店舗における位置を表し、楕円の大きさは立ち寄った客数を反映しています。楕円を結ぶ線に記された数値は客の移動回数です。
このチャートからは、例えば、最大の移動経路が入口→農産、次が畜産→日配(乳製品、大豆製品、パンなど毎日配送されてくる食品)、その次が畜産→加工食品・惣菜であることが読み取れます。
こうした分析の場合、実際の導線をカメラで追って画像処理し写真に重ね合わせて再現してみせる方法もありますが、逆にこれでは数値的なデータが取れません。統計的な処理を行う分析にはむしろ、このようにモデル化した図のほうが拡張性の面で優れています。ものとものの関係を数学的に解き明かす位相幾何学(トポロジー)では、たとえば「ドーナツ」と「コーヒーカップ」は同じように双方とも同じように穴が一つ空いた物体であるとカテゴライズして、数学的な計算に利用しますが、これはその考え方の延長線上にあります。
グラフは来店客全体のデータから作成したものですが、当然、ディメンションを作り込んであるために「加工食品を買った客」や「菓子を買った客」などを絞り込んで行動を調べることもできます。
流通業の場合、業態によって店舗や商品配置の考え方は大きく違ってきます。顧客が店舗全体を回遊するように人気売場を配置した方が効果的な業態もあれば、同時に買う確率が高い売場と売場を接近させて方がよい場合もあります。どのような売場配置をしたらよいかを考える際には、イメージだけでなく現実の顧客の動きを数値化して把握することも重要です。その際に、空間的把握(移動経路)と時間的把握(滞在時間)をモデル化した、このグラフが数値的な分析に力を発揮するのです。
14. 散布図|相関関係を明らかにする
ここでは購入金額と売場の関係についての可視化です。下の左図は横軸が顧客の各売り場での滞在時間、縦軸が購入金額の散布図で、各々の点が示す売り場は色分けしています。斜線は滞在時間と購入金額の回帰直線で、相関係数は0.51427875となっています(相関係数は完全に正の相関1〜完全に負の相関−1で表現されるので、この場合はやや弱い正の相関があると判断されます)。
これは全売り場のデータから作成したものですが、マウスクリック一つで売り場別の散布図に簡単に切り替えられるようになっています。売り場別に滞在時間と購入時間の平均値と相関係数を示したものが右図で、相関係数が平均を上回っているのが畜産、水産、農産、下回っているのが加工食品・惣菜、日配、日用雑貨、冷凍食品、一般食品、飲料、菓子という結果です。菓子が最小で0.09006、畜産が最大で0.78169と大差がありますが、ここからは畜産品は「必ず買う」「長い時間滞在すれば、より多く買ってもらえる」という消費行動が明らかになります。
つまり、畜産、水産、農産など日常食・生鮮食品は、来店客もそれらを買う目的で来店するために相関係数が高く、必ずしも買う必要のない菓子は、「気が向いたら買う」「お得なものがあったら買う」程度の意識なので、売り場に行くことが購入には直結しないという意識です。
このような分析の結論自体は、じつは経験則として得られているものと大差ありません。結果を示されたところで「だから何?」となりがちですが、気がつかないうちに環境変化が起きることもあります。
重要なのは、経年変化です。滞在時間と売上げは関係ないとされる菓子でも、少しだけ、たとえば0.05だけ相関係数が動いたとします。全体からみたら、小さい数字ですが、0.09が0.14になったのであれば、売れ行きは1.5倍以上になったことを意味します。単純に売上げの上積みとして大きいだけでなく、消費行動の変化の兆し、あるいは隠れたヒット商品が生まれているのかもしれません。
こうした消費性向や来店客層の水面下での変化、天気や時間帯によって生まれる特定の行動パターンなど、経験則が通用しないことに気がつかないでいると、間違った店舗運営をしてしまいかねません。経験則をデータとすりあわせアップデートすること、常識を常に疑っておくことは変化の激しい流通業には必要なポイントなのです。
15. カスタマージャーニー|リピーターの購買品目を明らかにする
通販サイトで何かを購入した新規顧客が、2回目、3回目には何を買うのかを可視化したものが下図のカスタマージャーニーです。
一つ目は縦軸に購入者数を取ったもので、初回購入時はバッグ、ワンピース、トップス、服飾雑貨・小物の順に多いことが分かります。2回目、3回目、・・・・・・と購入者が減っていくことは避けられないのですが、その減少率をできるだけ低く抑えることが収益を高めるカギになります。
そのためには、購入者がどのような品目を買っているかの把握が重要になってくるのですが、それが一目でわかるように可視化したのが二つ目の図で、縦軸を品目別の実額から構成比に変えてあります。
これを見ると、一つ目のグラフでは分かりにくい構成比の移り変わりが鮮明になります。初回購入はバッグの構成比が最大ですが、その割合は徐々に低下しています。バッグは流行に左右されにくく耐久性も高いため、使用期間が長いことを反映していると考えられるのです。
一方、トップスとボトムスは初回購入の割合は3番目と5番目ですが、徐々に割合を拡大させる傾向にあり、5回以上の購入ではトップスが最も売れる品目になっています。流行に左右されやすく回転が早いことを反映していると考えられます。
さらに、初回にバッグを買った顧客は次に何を買うか、という突っ込んだ分析をすることができるのがBIツールの強みです。
この分析結果からは、潜在的な新規顧客にはバッグ、既存顧客にはトップスを重点的に広告することが効果的との知見が得られます。こうして、購入回ごとに顧客のニーズは徐々に変化していくことを織り込んで、サイト構築、販売戦略を取ることの重要性を意識する意義は大きいといえます。
まとめ
以上、チャートの活用例をお見せしましたが、高度な技術が求められるものは少ないのがお分かりいただけたでしょうか。先端的で高度なテクニックよりもシンプルで基本的なテクニックのほうが実践に役立つことが少なくありません。簡単なテクニックは知っているつもりでも自在に活用できる人は非常に少ないです。
その背景にあるのが、使い慣れたEXCELのような表計算ソフトが苦手とする可視化、グラフ化、データベース機能の限界をそのまま分析の限界と考えてあきらめてしまうなど「Excelなどの表計算ソフトに対する誤解」なのではないでしょうか。
まずはデータ分析の隠れた障害となっている「表計算脳(EXCEL脳)」から脱却することが、さらに高いレベルの分析に移行するための第一歩でもあります。