統計は3つの問いで読むと怖くない 平均・割合・相関の基本をゼロから整理
統計が苦手に感じやすいのは、数字そのものが難しいからではありません。その数字が何に答えるためのものかを見失いやすいからです。
先に結論を書くと、平均は「だいたいどのくらいか」、割合は「全体のうちどれだけか」、相関は「2つが一緒に動く傾向があるか」を見る道具です。この3つを混同しなければ、ニュース、アンケート、業務レポートの読み違いはかなり減らせます。
この記事では、統計を専門的に計算する話ではなく、平均・割合・相関を誤解せずに読むための土台を整理します。数式は最小限にして、どこでつまずきやすいかを具体例で押さえます。
- この記事で分かること
- 平均・割合・相関がそれぞれ何を示すか
- 3つの数字を読むときに最初に確認すべき点
- ニュースや資料で起こりやすい典型的な誤解
- 数字を見たときに外さないチェックの順番
全体像と結論
統計を見るときは、まず「この数字は何を要約しているのか」を切り分けます。ここが曖昧だと、平均を見て割合の話をしたり、相関を見て因果関係だと思い込んだりします。
3つの基本は次の通りです。
- 平均: ばらばらな値を1つの代表値にまとめる
- 割合: 全体を100や1に対して、どれだけ占めるかを示す
- 相関: 2つの値が同じ方向、または逆方向に動く傾向を示す
この3つは似ていません。答えている問いが違います。
- 平均が答える問い: 「典型的にはどのくらいか」
- 割合が答える問い: 「全体の何割か」
- 相関が答える問い: 「2つは一緒に動いているか」
つまり、統計を読むコツは計算より先に、その数字が何の問いに答えているかを当てることです。
まず押さえたい基礎知識
細かい話に入る前に、最低限の前提だけそろえます。
数字は必ず「何を数えたか」とセットで見る
同じ「平均80」でも、テストの点数なのか、待ち時間80分なのか、月収80万円なのかで意味はまったく違います。統計の数字は単独では読めません。
確認したいのは次の3点です。
- 何を測った数字か
- どの集団についての数字か
- いつ、どの条件で集めた数字か
「全体」と「一部」を混同しない
割合では特に重要です。たとえば「20%が利用している」という文でも、
- 国民全体の20%なのか
- 調査回答者の20%なのか
- そのサービスの会員の20%なのか
で意味が変わります。分母が違えば、同じ20%でも話は別です。
数字はきれいでも、中身はばらつく
平均は1つの数字ですが、元のデータは1人ひとり違います。相関も1つの係数ですが、個々のケースでは外れることがあります。要約された数字は便利ですが、現実を丸ごと写しているわけではありません。
平均を誤解しないための見方
平均は、いちばん身近で、いちばん誤解されやすい統計です。
NISTの定義では、算術平均は「値の合計を個数で割ったもの」です。日常語の「平均的」は曖昧ですが、統計の平均はかなりはっきりしています。
平均が役立つ場面
平均が強いのは、全体の水準をざっくりつかみたいときです。
- テストの平均点
- 1日の平均歩数
- 1注文あたりの平均購入額
- 1回あたりの平均待ち時間
複数の値を1つにまとめるので、全体像の入口として便利です。
ただし、極端な値に引っぱられる
平均の弱点はここです。少数の大きな値や小さな値が入ると、印象が大きく変わります。
たとえば5人の昼食代が次の通りだとします。
- 700円
- 800円
- 900円
- 950円
- 4,500円
このとき平均は1,570円です。ただ、4人は1,000円前後で、1人だけかなり高い昼食をとっています。平均だけを見ると、「みんな1,500円くらい使っている」と読み違えやすくなります。
ここで大事なのは、平均を見た瞬間に次も確認することです。
- 極端な値が入っていないか
- 件数はいくつか
- ほかの代表値、特に中央値も見られるか
NISTのハンドブックでも、平均と並んで中央値が代表的な位置の指標として説明されています。平均だけで典型像を決めつけないほうが安全です。
平均で考えるときの実践ルール
- 平均は「全員の実感」ではなく「全体のならした値」と考える
- 大きくばらつくデータでは、平均だけで判断しない
- お金、時間、アクセス数のように偏りやすいデータでは特に慎重に見る
割合を誤解しないための見方
割合は、全体のうち一部がどれだけあるかを示す数字です。Open Universityの教材でも、割合と百分率は「全体を部分に分けて考える」ための基本として整理されています。
割合とパーセントは何が違うのか
日常ではほぼ同じように使われますが、見え方が少し違います。
- 割合: 0.2、0.35、5分の1のように表す
- パーセント: 20%、35%のように100あたりで表す
つまり、20%は「100のうち20」、0.2は「1のうち0.2」です。中身は同じでも、表現の仕方が違います。
割合で最重要なのは分母
割合は、分子より先に分母を確認したほうがいい場面が多いです。
たとえば次の2つは似て見えて、意味が違います。
- A店: 来店100人のうち20人が購入した
- B店: 来店1,000人のうち150人が購入した
購入率はA店が20%、B店が15%です。率だけならA店が高い。
ただし、実際の購入者数はB店のほうが多い。ここで「どちらが良いか」は、何を評価したいかで変わります。
- 効率を見たいなら割合が有効
- 規模を見たいなら実数が必要
割合は便利ですが、実数を消してしまうことがあります。
「5%増」と「5ポイント増」は違う
ここもよく混同されます。
たとえば利用率が20%から25%になったとします。
- 5ポイント増
- 25%増
この2つは同じ出来事を別の言い方で表していますが、印象が違います。20から25は差で見れば5ポイント、20を基準にした伸び率で見れば25%増です。
数字を読む側としては、
- どの値からどの値へ動いたのか
- 差を言っているのか
- 伸び率を言っているのか
を切り分ける必要があります。
割合で考えるときの実践ルール
- 分母が何かを最初に確認する
- 割合だけでなく実数も一緒に見る
- 「何ポイント増か」と「何%増か」を混同しない
- 小さい集団の割合は大きくぶれやすいと意識する
相関を誤解しないための見方
相関は、2つの変数の関係を見る道具です。NISTの説明では、相関係数は2つの変数の線形な関係を測るものです。
ここでいう線形とは、ざっくり言えば「片方が増えると、もう片方も一定の調子で増える・減る」ような関係です。
相関が示すもの
相関係数は一般に-1から1の範囲で考えます。
- 1に近い: 強い正の相関
- -1に近い: 強い負の相関
- 0に近い: 線形な相関は弱い
たとえば、勉強時間が長い人ほどテスト点が高い傾向があるなら、正の相関が出ることがあります。逆に、価格が上がるほど購入数が減るなら、負の相関が出ることがあります。
ただし、ここで分かるのは「一緒に動く傾向」です。原因までは確定しません。
ここがポイント: 相関は「関係がありそう」を示す数字であって、「AがBを引き起こした」と証明する数字ではありません。
相関と因果関係は別物
NICHDの研究解説でも、比較だけでは因果推論は正当化できず、相関だけで原因と結果を断定できないと説明されています。
なぜか。理由は主に3つあります。
- たまたま一緒に動いて見える可能性がある
- 本当はBがAに影響している可能性がある
- AでもBでもない第三の要因が両方に効いている可能性がある
たとえば、アイスの売上と熱中症の件数が一緒に増えても、「アイスが熱中症を増やす」とは言えません。暑さという第三の要因が両方を動かしている可能性が高いからです。
相関が0でも「無関係」とは限らない
ここも重要です。NISTの説明は線形関係についての相関です。つまり、まっすぐな増減関係をとらえるのが得意です。
現実には、
- ある点までは増えるが、その先で減る
- U字型になる
- 条件によって関係が変わる
といった関係もあります。この場合、相関係数だけでは見落とすことがあります。
相関で考えるときの実践ルール
- 相関を見たら、まず「因果ではない」と一歩止まる
- 何と何の関係かを具体的に言い換える
- 第三の要因がないか考える
- 可能なら散布図や元データの形も確認する
平均・割合・相関の違いを一気に整理する
数字の役割を並べて見ると、混同しにくくなります。
| 指標 | 主に答える問い | 強み | 弱点 | よくある誤解 |
|---|---|---|---|---|
| 平均 | だいたいどのくらいか | 全体の水準を1つでつかみやすい | 極端な値に引っぱられやすい | 平均がそのまま典型的な個人像だと思う |
| 割合 | 全体のうちどれだけか | 規模の違う集団を比べやすい | 分母を見失うと意味を誤る | 割合だけで実数まで分かった気になる |
| 相関 | 2つが一緒に動く傾向があるか | 関係の有無を探る入口になる | 原因と結果は分からない | 相関があるから因果関係があると思う |
この表を頭に置くだけで、統計の読み方はかなり安定します。
具体例で読む 統計が怖くなくなる順番
ここでは、よくある場面でどう読むかを順番で見ます。
例1 アンケート結果を見るとき
「満足度の平均は4.2点、満足と答えた人は78%」という結果があったとします。
このとき読む順番はこうです。
- 何点満点なのか確認する
- 回答者数を確認する
- 平均4.2が一部の高評価に引っぱられていないか考える
- 78%の分母が誰かを確認する
平均と割合は補い合います。平均だけだと分布が見えにくい。割合だけだと強弱が粗くなります。
例2 ニュースで「利用率が急増」と出たとき
「利用率が50%増」と書かれていたら、そのまま大きな変化だと思い込みやすいですが、元の数字を見ないと判断できません。
- 2%から3%なら50%増
- 40%から60%も50%増
伸び率は同じでも、意味合いはかなり違います。まず元の水準を見る。これが割合の読み方の基本です。
例3 2つの数字の関係が話題になったとき
「運動時間が長い人ほど成績が高い」という話を見たら、相関の可能性はあります。ただし、それだけで「運動すると成績が上がる」とはまだ言えません。
ほかにも考えるべきことがあります。
- 生活習慣全体が整っている人が両方高いのかもしれない
- 家庭環境や睡眠時間が影響しているのかもしれない
- そもそも対象人数が少ないかもしれない
相関は、調べるべき関係を見つける入り口として強い。断定の道具として使うと危ない。ここが実務でもニュース読解でも重要です。
よくある誤解
統計に苦手意識がある人は、計算より先に次の誤解にはまりやすいです。
「平均」が真ん中の人を表していると思う
平均は真ん中の人そのものではありません。極端な値があると、実感から離れることがあります。
割合が高ければ人数も多いと思う
割合は比率です。小さい集団の80%より、大きい集団の20%のほうが実数では多いことがあります。
相関があれば原因が分かったと思う
相関は因果の証明ではありません。第三の要因や逆向きの影響を除けないからです。
1つの数字で全体が分かると思う
実際は、平均ならばらつき、割合なら分母、相関ならデータの形を見ないと危険です。統計は1つの数字を見る技術ではなく、数字の置かれた文脈を読む技術です。
読み違いを減らすためのチェックリスト
数字を見たとき、毎回これだけ確認するとかなり安定します。
- この数字は平均・割合・相関のどれか
- 何についての数字か
- 分母や対象集団は何か
- 件数は十分あるか
- 極端な値に引っぱられていないか
- 相関を因果関係として読んでいないか
- 実数や元の値も確認できるか
最低限ここだけ覚えるポイント
- 平均は「だいたいの水準」を見る数字で、極端な値に弱い
- 割合は「全体のうちどれだけか」を示す数字で、分母確認が最優先
- 相関は「一緒に動く傾向」を示す数字で、原因と結果は確定しない
- 統計は計算式より先に、「その数字が何の問いに答えているか」を考える
- 1つの数字だけで判断せず、対象、件数、元データの形を合わせて見る
まとめ
統計を怖がらずに読む第一歩は、難しい数式を覚えることではありません。平均・割合・相関の役割を分けて考えることです。
平均は全体をならした代表値、割合は全体に対する比率、相関は2つの値の動き方の関係。この区別がつくと、数字を見た瞬間に「何が言えて、何はまだ言えないか」を整理できます。
次に数字を見たら、まずこう考えてください。これは何の問いに答える数字なのか。 その確認だけで、統計はかなり読みやすくなります。
