異なるデータをできるだけ公平に比較したい
今回はこういった問題を解消するときに便利な「標準化」という考え方を紹介します。
データを標準化する
標準得点とは?
ある学校で英語と数学のテストがありました。
以下はその結果です。
1組 | A | B | C | D | E | 平均 | 標準偏差 |
英語 | 40 | 30 | 80 | 70 | 60 | 56 | 20.73644135 |
2組 | F | G | H | I | J | ||
数学 | 30 | 50 | 40 | 30 | 20 | 34 | 11.40175425 |
誰が一番好成績だと思いますか?
点数で言ったらCが一番ですよね。
でもそれって正確でしょうか?
異なるデータを比べても意味がない気もします。
こういったときにつかえるのがデータの「標準化」です。
標準化すると、平均は0に分散と標準偏差は1になります。
これにより、異なるデータの大小が判定できるようになるのです。
標準化された数値が大きい方が実質的に高得点といえます。
計算方法
実際の点数ー平均÷標準偏差
これが公式になります。
実際に計算してみると
C=1.157382773
G=1.403292831
このようになります。
つまりGの方が相対的に高得点というわけです。
どういう仕組み?
標準化すると
データの平均→0
分散(標準偏差も)→1
このようになります。
基準を合わせているわけです。
正確性は?
気になるのは、標準化したデータの信ぴょう性です。
本当に比較して大丈夫なのでしょうか?
以下の場合は気を付けましょう。
母数が少ない
当たり前ですが母数が少ないと数値として正確ではありません。
例えば3人しか受けていないテストの点数を標準化した場合
A20点、B50点、C80点
→平均は50点になります。
この場合はCは標準点はかなり少なくなりますよね。
ひとり負けです。
でもこのテストが非常に難しくて、BとCがその分野の専門家だったとします。
このテストと普通のテストで平均を取った人とを比べた時に、Cは悪い評価を受けてしまいます。
母数が少ないと極端な数値が出てしまうのです。
正規分布にならない
平均を頂点になだらかな分布ならない場合もあります。
0点3人と100点3人。
これでも平均は50点になります。
こういった試験で標準化しても意味はないです。
極端な分布も正確性がなくなってしまうのです。
標準得点をExcelで計算する方法
STANDARDIZE関数でOKです。
=STANDARDIZE(C3,G3,H3)
というようにカンマで区切って、得点、平均、標準偏差となるように記述しましょう。
偏差値が求められる
標準点×10+50
これで偏差値も出せます。
読んでくれてありがとう!
>>【最新版|2022年】公務員試験ランキング!簡単?難しい?難易度を偏差値でランク付け!
★公務員試験対策の目次
【民法】公務員試験対策に使える!おすすめの参考書・過去問
【憲法】独学で憲法が学べるおすすめの参考書10選! 【公務員試験】
【行政法】公務員試験対策の参考書・問題集をおすすめ順に紹介!!【2021年】
【数的推理・判断推理】これやっておけばいい!おすすめ参考書と勉強法を紹介!
クレアールという通信系の予備校が無料で公務員ハンドブックを発行しているので、時間のある方は確認しておきましょう。
試験についてや、合格体験記など幅広く載っています。
コメント