Appearance
平均より中央値?データ分析で騙されないための基礎知識
「平均客単価が上がった」「平均滞在時間が伸びた」。レポートでよく見る 平均 は、意思決定を速くしてくれる一方で、現場を簡単にミスリードします。特にEC(ネットショップ)は、まとめ買い・法人注文・高額商品・返品などが混ざりやすく、数字の分布が歪みやすい世界です。
この記事は、データ分析の基礎として「平均値だけで判断しない」ための考え方を、中央値を中心に整理します。結論から言うと、意思決定の目的が「典型的なお客様像を知りたい」のか「全体の期待値を見たい」のかで、見るべき指標は変わります。
平均値は みんなの真ん中 ではない
平均値(mean)は、合計を件数で割った値です。計算が簡単で、売上の見積もりや予算配分に向きます。でも、少数の極端な値(外れ値)に強く引っ張られます。
たとえば、ある日の注文金額(円)が次の10件だったとします。
| 注文 | 金額(円) |
|---|---|
| 1 | 4,800 |
| 2 | 5,200 |
| 3 | 5,000 |
| 4 | 4,900 |
| 5 | 5,100 |
| 6 | 5,300 |
| 7 | 4,700 |
| 8 | 5,100 |
| 9 | 5,000 |
| 10 | 100,000 |
このとき平均は約14,100円。一方で「真ん中」の実感は5,000円前後のはずです。平均は、たった1件の高額注文で 急に景気が良く見える のです。
ネットショップの数字で言うと、平均客単価(AOV)が跳ねた日に、実は上位1〜2件の特殊注文(まとめ買い、転売、社内購入)が混ざっているだけ、というケースは珍しくありません。
中央値とは? 典型 に近い代表値
中央値(median)は、データを小さい順に並べたときの真ん中の値です。外れ値の影響を受けにくく、「典型的な注文はどれくらいか」を表しやすいのが強みです。
先ほどの例だと、真ん中(5番目と6番目の平均)なので中央値は5,050円。これなら現場感とズレにくい。
ここで押さえたいのは、平均と中央値は「優劣」ではなく役割が違う、という点です。
- 平均:全体の期待値・総量の見積もりに強い
- 中央値:典型値・現場の実態把握に強い
そもそも代表値とは?(データ分析の基礎)
大量のデータを1つの数で要約して「全体像」を掴むための指標を 代表値 と呼びます。代表値にはいくつか種類があり、どれも「正しい/間違い」ではなく、用途が違います。
- 平均値:合計÷件数。売上見積もりなど“総量”の議論に向くが、外れ値に弱い
- 中央値:並べた真ん中。“典型”を掴みやすく、歪んだ分布でもブレにくい
- 最頻値(mode):一番よく出る値。価格帯やサイズなど「ボリュームゾーン」を知りたいときに効く
ネットショップの数字を読むときは「いま知りたいのは、典型なのか、ボリュームゾーンなのか、期待値なのか」を先に決めると、代表値の選び間違いが減ります。
「騙されない」ために見るべきは 分布
平均と中央値のどちらを見るにしても、最終的に重要なのは「分布」です。たとえばAOVが同じでも、
- ほとんどが同じ金額で安定している
- 低単価が多数で、まれに超高額が混ざる
では、施策の打ち手が変わります。
騙されない データの読み方として、まずは次の3点をセットで確認してください。
- 平均と中央値の差(差が大きいほど歪んでいる可能性)
- 上位10%(または上位1%)の注文が占める売上比率
- 四分位(25%/50%/75%)の値:どの層が動いたか
ネットショップで“中央値が効く”代表例
客単価(AOV)
AOVは外れ値の影響を受けやすい代表格です。高額商品が少数ある店舗、法人注文が入る店舗、ギフト需要がある店舗は特に、平均だけだと改善の方向を誤ります。
- 典型的なお客様の購買行動を把握したい → 中央値
- 売上予測や粗利の期待値を出したい → 平均(ただし外れ値の扱いを明示)
配送日数・リードタイム
ほとんどの注文は翌日出荷でも、一部の取り寄せで極端に遅れると平均は悪化します。顧客体験の“ふつう”を知りたいなら中央値が有効です。
問い合わせ対応時間
問い合わせの大半は即時対応できても、週末や繁忙期に遅延が出ると平均が伸びます。SLA設計(例: 80%を24時間以内)には、中央値+パーセンタイルが相性が良いです。
それでも平均が必要な場面
平均を捨てる必要はありません。たとえば「広告費を1万円増やしたとき、期待売上はいくらか」「在庫をどれくらい積むか」のような“期待値”の議論では平均が便利です。
ただし、そのときの平均は「どのデータを含めた平均か」をセットで示すのが実務です。
- 返品・キャンセルを含む/含まない
- 転売疑い・社内購入を除外する/しない
- 新規とリピーターを混ぜる/分ける
平均は強い指標だからこそ、定義が曖昧だと結論がブレます。
今日からできるチェックリスト
ネットショップ 数字を読むとき、次の順番で確認すると事故が減ります。
- 平均と中央値を並べて見る(まず歪みを疑う)
- 外れ値候補を特定する(上位1%の注文、異常な点数、同一住所の連続購入など)
- セグメントを切る(新規/既存、デバイス、流入元、カテゴリ)
- 「典型の改善」か「期待値の改善」か、目的を言語化する
- 結論に使った指標と除外条件をメモして再現可能にする
まとめ:平均と中央値を“目的で使い分ける”
平均は強力ですが、“みんなの真ん中”ではありません。中央値は、典型的な顧客体験や注文像を掴むのに向いています。
データ分析の第一歩は、難しい統計手法ではなく「数字がどう偏り得るか」を理解すること。平均と中央値を並べ、分布を意識するだけで、判断の精度は大きく上がります。

