おすすめ動画配信サイト7選!

標準得点とは?わかりやすく解説!【データを標準化】

ごり丸
ごり丸

異なるデータをできるだけ公平に比較したい


今回はこういった問題を解消するときに便利な「標準化」という考え方を紹介します。

スポンサーリンク

データを標準化する

標準得点とは?

ある学校で英語と数学のテストがありました。
以下はその結果です。

1組ABCDE平均標準偏差
英語40308070605620.73644135
2組
数学30504030203411.40175425

誰が一番好成績だと思いますか?

点数で言ったらCが一番ですよね。
でもそれって正確でしょうか?
異なるデータを比べても意味がない気もします。

こういったときにつかえるのがデータの「標準化」です。

標準化すると、平均は0に分散と標準偏差は1になります。
これにより、異なるデータの大小が判定できるようになるのです。

標準化された数値が大きい方が実質的に高得点といえます。

計算方法

実際の点数ー平均÷標準偏差

これが公式になります。

実際に計算してみると

C=1.157382773

G=1.403292831

このようになります。

つまりGの方が相対的に高得点というわけです。

どういう仕組み?

標準化すると
データの平均→0
分散(標準偏差も)→1

このようになります。
基準を合わせているわけです。

正確性は?

気になるのは、標準化したデータの信ぴょう性です。
本当に比較して大丈夫なのでしょうか?

以下の場合は気を付けましょう。

母数が少ない

当たり前ですが母数が少ないと数値として正確ではありません。
例えば3人しか受けていないテストの点数を標準化した場合

A20点、B50点、C80点
→平均は50点になります。
この場合はCは標準点はかなり少なくなりますよね。
ひとり負けです。

でもこのテストが非常に難しくて、BとCがその分野の専門家だったとします。
このテストと普通のテストで平均を取った人とを比べた時に、Cは悪い評価を受けてしまいます。

母数が少ないと極端な数値が出てしまうのです。

正規分布にならない

平均を頂点になだらかな分布ならない場合もあります。

0点3人と100点3人。
これでも平均は50点になります。

こういった試験で標準化しても意味はないです。
極端な分布も正確性がなくなってしまうのです。

標準得点をExcelで計算する方法

STANDARDIZE関数でOKです。

=STANDARDIZE(C3,G3,H3)

というようにカンマで区切って、得点、平均、標準偏差となるように記述しましょう。

偏差値が求められる

標準点×10+50

これで偏差値も出せます。

数学
スポンサーリンク
Study Gorilla

コメント