Skip to content
Hero Image

平均より中央値?データ分析で騙されないための基礎知識

「平均客単価が上がった」「平均滞在時間が伸びた」。レポートでよく見る 平均 は、意思決定を速くしてくれる一方で、現場を簡単にミスリードします。特にEC(ネットショップ)は、まとめ買い・法人注文・高額商品・返品などが混ざりやすく、数字の分布が歪みやすい世界です。

この記事は、データ分析の基礎として「平均値だけで判断しない」ための考え方を、中央値を中心に整理します。結論から言うと、意思決定の目的が「典型的なお客様像を知りたい」のか「全体の期待値を見たい」のかで、見るべき指標は変わります。

平均値は みんなの真ん中 ではない

平均値(mean)は、合計を件数で割った値です。計算が簡単で、売上の見積もりや予算配分に向きます。でも、少数の極端な値(外れ値)に強く引っ張られます。

たとえば、ある日の注文金額(円)が次の10件だったとします。

注文金額(円)
14,800
25,200
35,000
44,900
55,100
65,300
74,700
85,100
95,000
10100,000

このとき平均は約14,100円。一方で「真ん中」の実感は5,000円前後のはずです。平均は、たった1件の高額注文で 急に景気が良く見える のです。

ネットショップの数字で言うと、平均客単価(AOV)が跳ねた日に、実は上位1〜2件の特殊注文(まとめ買い、転売、社内購入)が混ざっているだけ、というケースは珍しくありません。

中央値とは? 典型 に近い代表値

中央値(median)は、データを小さい順に並べたときの真ん中の値です。外れ値の影響を受けにくく、「典型的な注文はどれくらいか」を表しやすいのが強みです。

先ほどの例だと、真ん中(5番目と6番目の平均)なので中央値は5,050円。これなら現場感とズレにくい。

ここで押さえたいのは、平均と中央値は「優劣」ではなく役割が違う、という点です。

  • 平均:全体の期待値・総量の見積もりに強い
  • 中央値:典型値・現場の実態把握に強い

そもそも代表値とは?(データ分析の基礎)

大量のデータを1つの数で要約して「全体像」を掴むための指標を 代表値 と呼びます。代表値にはいくつか種類があり、どれも「正しい/間違い」ではなく、用途が違います。

  • 平均値:合計÷件数。売上見積もりなど“総量”の議論に向くが、外れ値に弱い
  • 中央値:並べた真ん中。“典型”を掴みやすく、歪んだ分布でもブレにくい
  • 最頻値(mode):一番よく出る値。価格帯やサイズなど「ボリュームゾーン」を知りたいときに効く

ネットショップの数字を読むときは「いま知りたいのは、典型なのか、ボリュームゾーンなのか、期待値なのか」を先に決めると、代表値の選び間違いが減ります。

「騙されない」ために見るべきは 分布

平均と中央値のどちらを見るにしても、最終的に重要なのは「分布」です。たとえばAOVが同じでも、

  • ほとんどが同じ金額で安定している
  • 低単価が多数で、まれに超高額が混ざる

では、施策の打ち手が変わります。

騙されない データの読み方として、まずは次の3点をセットで確認してください。

  • 平均と中央値の差(差が大きいほど歪んでいる可能性)
  • 上位10%(または上位1%)の注文が占める売上比率
  • 四分位(25%/50%/75%)の値:どの層が動いたか

ネットショップで“中央値が効く”代表例

客単価(AOV)

AOVは外れ値の影響を受けやすい代表格です。高額商品が少数ある店舗、法人注文が入る店舗、ギフト需要がある店舗は特に、平均だけだと改善の方向を誤ります。

  • 典型的なお客様の購買行動を把握したい → 中央値
  • 売上予測や粗利の期待値を出したい → 平均(ただし外れ値の扱いを明示)

配送日数・リードタイム

ほとんどの注文は翌日出荷でも、一部の取り寄せで極端に遅れると平均は悪化します。顧客体験の“ふつう”を知りたいなら中央値が有効です。

問い合わせ対応時間

問い合わせの大半は即時対応できても、週末や繁忙期に遅延が出ると平均が伸びます。SLA設計(例: 80%を24時間以内)には、中央値+パーセンタイルが相性が良いです。

それでも平均が必要な場面

平均を捨てる必要はありません。たとえば「広告費を1万円増やしたとき、期待売上はいくらか」「在庫をどれくらい積むか」のような“期待値”の議論では平均が便利です。

ただし、そのときの平均は「どのデータを含めた平均か」をセットで示すのが実務です。

  • 返品・キャンセルを含む/含まない
  • 転売疑い・社内購入を除外する/しない
  • 新規とリピーターを混ぜる/分ける

平均は強い指標だからこそ、定義が曖昧だと結論がブレます。

今日からできるチェックリスト

ネットショップ 数字を読むとき、次の順番で確認すると事故が減ります。

  1. 平均と中央値を並べて見る(まず歪みを疑う)
  2. 外れ値候補を特定する(上位1%の注文、異常な点数、同一住所の連続購入など)
  3. セグメントを切る(新規/既存、デバイス、流入元、カテゴリ)
  4. 「典型の改善」か「期待値の改善」か、目的を言語化する
  5. 結論に使った指標と除外条件をメモして再現可能にする

まとめ:平均と中央値を“目的で使い分ける”

平均は強力ですが、“みんなの真ん中”ではありません。中央値は、典型的な顧客体験や注文像を掴むのに向いています。

データ分析の第一歩は、難しい統計手法ではなく「数字がどう偏り得るか」を理解すること。平均と中央値を並べ、分布を意識するだけで、判断の精度は大きく上がります。

The best way to predict the future is to create it.