来店客数予測における統計分析手法について(2)

客数予測の基本

客数予測の基本

来店客数予測における統計分析手法(2)

ここでは、より実際に近い形で回帰分析を行い、来店客数を予測してみたいと思います。
実際には、来店客数の実績は複数の要因で決まります。
そこで、「天気」以外に「曜日」と「イベント」の要因も加味して回帰分析を行ってみます。

(例)商店Bの客数実績とその日の天気、曜日、企画が以下の通りあったとします。

日付 1日 2日 3日 4日 5日 6日 7日
客数 1,220 1,238 1,486 1,492 1,028 1,402 1,248
天気 晴れ 晴れ 曇り 晴れ
曜日
企画 企画A 企画A
日付 8日 9日 10日 11日 12日 13日 14日
客数 1,306 1,164 1,470 1,432 1,224 1,336 1,530
天気 晴れ 晴れ 晴れ 晴れ 曇り 晴れ 晴れ
曜日
企画 企画A 企画B

次に、数値では表せない「天気」、「曜日」、「企画」を下記表の様に表現します。

日付 客数 企画
A有
企画
A無
企画
B有
企画
B無
1日 1,220 1 0 0 1 0 0 0 0 0 0 0 1 0 1
2日 1,238 1 0 0 0 1 0 0 0 0 0 0 1 0 1
3日 1,486 0 1 0 0 0 1 0 0 0 0 0 1 0 1
4日 1,492 1 0 0 0 0 0 1 0 0 0 1 0 0 1
5日 1,028 0 0 1 0 0 0 0 1 0 0 0 1 0 1
6日 1,402 0 0 1 0 0 0 0 0 1 0 1 0 0 1
7日 1,248 0 0 1 0 0 0 0 0 0 1 0 1 0 1
8日 1,306 1 0 0 1 0 0 0 0 0 0 0 1 0 1
9日 1,164 1 0 0 0 1 0 0 0 0 0 0 1 0 1
10日 1,470 1 0 0 0 0 1 0 0 0 0 0 1 0 1
11日 1,432 1 0 0 0 0 0 1 0 0 0 1 0 0 1
12日 1,224 0 1 0 0 0 0 0 1 0 0 0 1 0 1
13日 1,336 1 0 0 0 0 0 0 0 1 0 0 1 0 1
14日 1,530 1 0 0 0 0 0 0 0 0 1 0 1 1 0

次に、上記表を回帰分析用データに編集します。

客数 企画
A有
企画
B有
1,220 0 0 0 0 0 0 0 0 0 0
1,238 0 0 1 0 0 0 0 0 0 0
1,486 1 0 0 1 0 0 0 0 0 0
1,492 0 0 0 0 1 0 0 0 1 0
1,028 0 1 0 0 0 1 0 0 0 0
1,402 0 1 0 0 0 0 1 0 1 0
1,248 0 1 0 0 0 0 0 1 0 0
1,306 0 0 0 0 0 0 0 0 0 0
1,164 0 0 1 0 0 0 0 0 0 0
1,470 0 0 0 1 0 0 0 0 0 0
1,432 0 0 0 0 1 0 0 0 1 0
1,224 1 0 0 0 0 1 0 0 0 0
1,336 0 0 0 0 0 0 1 0 0 0
1,530 0 0 0 0 0 0 0 1 0 1

上記表データをもとに「回帰分析」すると、以下の結果を得ることができます。

  係数
切片 1,263
曇り 16
-180
-62
207
-47
-55
73
165
企画A有 246
企画B有 102

上記表の見方は、以下の様になります。

  • 1) 切片は、列を削除した「晴れ」、「月曜」、「企画なし」の時の来店客数を予測しています。
  • 2) 「曇り」の日は、「晴れ」の日より16人多いことを意味しています。
  • 3) 「雨」の日は、「晴れ」の日より180人少ないことを意味しています。
  • 4) 「火曜」は、「月曜」より62人少ないことを意味しています。
  • 5) 「水曜」は、「月曜」より207人多いことを意味しています。
  • 6) 「木曜」は、「月曜」より47人少ないことを意味しています。
  • 7) 「金曜」は、「月曜」より55人少ないことを意味しています。
  • 8) 「土曜」は、「月曜」より73人多いことを意味しています。
  • 9) 「日曜」は、「月曜」より165人多いことを意味しています。
  • 10) 「企画A有」は、「企画A無」より246人多いことを意味しています。
  • 11) 「企画B有」は、「企画B無」より102人多いことを意味しています。

回帰分析の結果は、以上の様な分析結果を出しています。
一見すると、「何で晴れの日より曇りの日の方が、客数が多いのだろう?」とか、
「何で水曜日は月曜日より207人も多いのだろう?」などと言った疑問が出てくると思います。

しかし、それがB商店の特性であり、何らかの理由がある筈です。
それでは、上記の回帰分析結果を元に次週以降の予測を行い、実際の実績(15日~29日)との比較を
行ってみることにします。

日付 15日 16日 17日 18日 19日 20日 21日
予測 1,263 1,447 1,470 1,462 1,208 1,582 1,428
実績 1,292 1,468 1,386 1,530 1,204 1,506 1,462
誤差 -29
(2%)
-21
(1%)
84
(6%)
-68
(4%)
4
(0%)
76
(5%)
-34
(2%)
天気 晴れ 晴れ 晴れ 晴れ 晴れ 晴れ 晴れ
曜日
企画 企画A 企画A 企画A
日付 22日 23日 24日 25日 26日 27日 28日
予測 1,083 1,201 1,470 1,462 1,208 1,582 1,530
実績 1,078 1,244 1,478 1,570 1,112 1,550 1,532
誤差 5
(0%)
-43
(3%)
-8
(1%)
-108
(7%)
96
(9%)
32
(2%)
-2
(0%)
天気 晴れ 晴れ 晴れ 晴れ 晴れ 晴れ
曜日
企画 企画A 企画A 企画B

大まかな目安として、誤差が5%以下なら、かなり精度が良いと言えます。
それ以上の誤差がある場合は、「天気は晴れとなっているが一時雨が降ったり、又は風が強くて寒かったり」と 気象条件の違いがあるかもしれません。

また、同じ企画としても、宣伝の仕方で来店客数に違いが出ることもあるかもしれません。

いずれにせよ、いろいろな観点から誤差を追求していくことで、より精度の高い来店客数の予測に結びついていくものと考えています。