『平均』だけじゃ足りない?中央値・最頻値の正しい使い分け
はじめに:なぜ「平均」だけでは誤解を招くのか
平均=すべてを代表しているとは限らない
私たちは日常的に「平均」という言葉に触れています。「平均年収」「平均寿命」「平均点」など、メディアや会話の中で頻繁に登場するこの言葉は、一見すると「みんなの真ん中」や「標準的な状態」を示しているように思えます。しかし、実は「平均」は万能な指標ではありません。特に、極端に大きいまたは小さい値(これを「外れ値」と呼びます)が混ざっている場合、「平均」は実態とかけ離れた印象を与えてしまうことがあります。
「平均年収◯万円」の裏に隠された数字のトリック
たとえば、ある業界の平均年収が「700万円」と発表されたとします。しかしその業界には、少数の高所得者(例えば1,000万円以上)が存在し、多くの人は500〜600万円の範囲で働いていたとしたら、「700万円」は現実とはズレた数字になります。これは「平均」が極端な数値に引っ張られやすいという性質によるものです。だからこそ、「中央値」や「最頻値」といった他の指標を併せて見ることで、より正確に「全体像」を把握することができるのです。
3つの代表値とは?平均・中央値・最頻値の定義
「平均値」:よく使われるが誤解されがち
平均値(mean)は、すべての値を足して、その個数で割ることで算出されます。もっとも一般的に使われる代表値で、計算もしやすいため、多くの統計データで使用されています。ただし、先述の通り、外れ値の影響を強く受けるため、実際の「多くの人が属する範囲」を正確に示すとは限りません。
「中央値」:バランスの取れた真ん中の値
中央値(median)は、値を小さい順に並べたとき、ちょうど中央に位置する値です。極端な値に左右されにくく、特に年収や資産などの偏りがあるデータにおいて、現実に即した「中間層」の状況を把握するのに役立ちます。
「最頻値」:一番多く登場する「人気者」
最頻値(mode)は、最も頻繁に登場する数値です。「どの値が一番多いか」を知ることで、流行や傾向を読み取る際に活躍します。特に商品サイズの需要やテストのよくある得点など、分布の中で「多数派」がどこにいるかを知りたいときに便利な指標です。
それぞれの値がズレる理由:データの分布に注目
外れ値があると平均が偏る
たとえば、5人の年収が「400万、450万、500万、550万、1,500万」だった場合、平均は680万円になります。しかしこの「680万円」という数字は、真ん中の人(500万円)や多数派の実感と一致していません。これは1,500万円という外れ値が、平均を大きく引き上げてしまった結果です。
中央値と最頻値は「極端な数」に強い
上の例でも、中央値は「500万円」となり、実態に近い値になります。最頻値はこのケースでは定まらない可能性がありますが、特定の値に集中がある場合(たとえば「450万円が2人」など)、その値を「一番多い年収」として捉えることができます。こうした値は、外れ値があっても揺れにくい特性があるため、偏ったデータの理解には非常に有効です。
具体例で比較!3つの代表値が示す「違う現実」
例1:年収の例(外れ値が多いデータ)
年収が「300万、350万、400万、450万、2,000万」という5人のデータがあるとします。このとき、
- 平均:700万円
- 中央値:400万円
- 最頻値:なし(すべて1回ずつ登場)
この平均700万円を見て「この業界は高収入だ」と判断するのは危険です。中央値を見ると、実際には400万円が「中間層」なのだとわかります。
例2:テストの点数(集中があるデータ)
点数が「60点、70点、70点、70点、80点」の5人だった場合、
- 平均:70点
- 中央値:70点
- 最頻値:70点
このように、データのばらつきが少なく、集中している場合は、3つの値が一致することもあります。こうしたときは、「70点」という代表値が全体を正確に表していると言えるでしょう。
どの指標を使えばいい?場面に応じた使い分け
ビジネスで使うなら「中央値」が有効な理由
ビジネスにおいて「購買者の所得」「社員の給料」などの分布が偏っているデータでは、中央値を用いることで、過度に楽観的または悲観的にならずに現状を正確に把握できます。特に意思決定や商品価格設定の判断において、実態を見失わないために役立ちます。
最頻値が役立つ場面は?マーケティングなどで活躍
最頻値は「もっとも好まれているものは何か?」を探る際に重宝されます。たとえば、ある商品のサイズで「Mサイズ」が最も売れているなら、在庫や広告もMに重点を置く戦略が有効です。最頻値は「現場の実感」に直結することが多い指標です。
ニュースや統計を読むときに気をつけたいこと
「平均値だけ」しか書かれていない記事の落とし穴
ニュース記事や報告書では、よく「平均」が使われていますが、それだけで内容を鵜呑みにするのは危険です。データに偏りがあるか、外れ値が混ざっているかによって、その平均は実情をまったく反映していない可能性があります。
疑ってみる視点:その数値は何を示しているのか
たとえば、「平均所得が上昇」と聞いたとき、それが本当に庶民の生活が豊かになったことを意味するのか、それとも一部の富裕層が引き上げているだけなのか――こうした「数字の使われ方」を考える習慣が、情報に振り回されないリテラシーとなります。
教育現場での誤解:子どもたちは何を学ぶべきか
「平均点」が全てじゃないという視点
学校ではテストの平均点がよく使われますが、それだけではクラス全体の学力状況は見えてきません。得点のばらつきが大きい場合は、「中央値」や「最頻値」も見ないと、指導の方向性を誤ることになりかねません。
複数の指標から読み解く力を育てよう
統計を正しく使うには、「どの値を選ぶか」だけでなく、「なぜその値を選ぶのか」という視点が重要です。教育の場でも、こうした複眼的な見方を身につけることが、将来の判断力を育む基盤になります。
まとめ:数字を読む力=現実を見る力
「1つの数字」に惑わされない感覚を持とう
統計は便利な道具ですが、使い方次第では誤解を生みます。特に「平均」という言葉は、わかりやすさゆえに過信されがちです。情報の裏側にはどんな分布があるのかを想像する力が、正しい判断につながります。
平均・中央値・最頻値を武器にする思考法
それぞれの代表値は、それぞれの「意味」を持っています。一つの値に飛びつくのではなく、場面に応じて複数の視点を使い分けることで、数字から見える現実は一気に豊かになります。「数を読む力」は、すべての教養の土台なのです。