学力偏差値の最大値と最小値

学力の程度を計る指標の一つとしての学力偏差値。
高い人になると70いくつ、低い人になると20いくつになることもあるようです。
それでは、学力偏差値に最大値と最小値は存在するのか―っ!
ということで、考えてみたケロ。
(以下では学力偏差値を単に偏差値と呼ぶことにします。)


n 人の試験における、点数が x の人の偏差値は、全体の平均点を e 、i 番目の人の点数を x_i として、次のように定義されます。


\frac{x-e}{\sqrt{\frac{1}{n}\sum_{i=1}^n (x_i - e)^2}} \times 10 + 50


この分母は標準偏差と呼ばれます。


ちなみに、全員の点数が同じ場合には、各 i について x_i = e なので標準偏差が 0 になり、したがって、不定形になります。
このとき、偏差値は定義されないのですが、便宜的に全ての人の偏差値を 50 と決めても差し支えありません。
以下では簡単のため、最低でも一組は点数の異なるペアがあると仮定して話を進めていきます。


まず、各人の点数 x_i \cdots x_n が定まっている状況を考えると、平均 e と標準偏差は確定するので、点数が最も高い人が偏差値が最大で、点数が最も低い人が偏差値が最小であることが分かります。


次に、最高点(or 最低点)と平均点を固定し、点数の分布を変化させたとき、どのような場合に最高点(or 最低点)の人の偏差値が最大(or 最小)になるのかを考えます。
つまり、n 人の偏差値の最大値(or 最小値)を最大(or 最小)にしたいわけです。
最高点(or 最低点)を x_n とすると、x_n - e > 0(or x_n - e < 0)なので、標準偏差が最小になるように点数の分布を定めます。


\sum_{i=1}^n (x_i - e)^2
 = \sum_{i=1}^n (x_i^2 - 2ex_i + e^2)
 = \sum_{i=1}^n x_i^2 - 2e \sum_{i=1}^n x_i + \sum_{i=1}^n e^2
 = \sum_{i=1}^n x_i^2 - 2e^2 + ne^2
 = \sum_{i=1}^{n-1} x_i^2 + x_n^2 + e^2(n-2)
ここで、相加平均・相乗平均の関係式より
\sum_{i=1}^{n-1} x_i^2 \geq (n-1) \left(\prod_{i=1}^{n-1} x_i^2\right)^{\frac{1}{n-1}
等号が成り立つのは、各 x_i が等しいとき。
また、x_n + e^2(n-2) は点数の分布によらず一定です。
よって、各 x_i が等しいとき、最高点(or 最低点)の人の偏差値は最大(or 最小)になります。


実際の試験では点数は整数値ですが、ここでは最高点(or 最低点)以外の点数が \alpha (適当な実数)である状況を想定します。
以上の仮定のもとで


\frac{x_n-e}{\displaystyle \sqrt{\frac{1}{n}\sum_{i=1}^n (x_i - e)^2}}
= \frac{x_n-e}{\frac{1}{\sqrt{n}}\sqrt{\sum_{i=1}^{n-1} (\alpha - e)^2 + (x_n - e)^2}}
= \frac{x_n-\frac{(n-1)\alpha + x_n}{n}}{\frac{1}{\sqrt{n}}\sqrt{(n-1) \left\{\alpha - \frac{(n-1)\alpha + x_n}{n}\right\}^2 + \left\{x_n - \frac{(n-1)\alpha + x_n}{n}\right\}^2}}
= \frac{nx_n-\left\{(n-1)\alpha + x_n\right\}}{\frac{1}{\sqrt{n}}\sqrt{(n-1) \left[n\alpha - \left\{(n-1)\alpha + x_n\right\}\right]^2 + \left[nx_n-\left\{(n-1)\alpha + x_n\right\}\right]^2}}
= \frac{(n-1)(x_n-\alpha)}{\frac{1}{\sqrt{n}}\sqrt{(n-1) (x_n-\alpha)^2 + (n-1)^2(x_n-\alpha)^2}}
= \frac{x_n-\alpha}{\left|x_n-\alpha\right|} \frac{n-1}{\sqrt{n-1}}
= \frac{x_n-\alpha}{\left|x_n-\alpha\right|}\sqrt{n-1}
= \left\{\begin{array}\sqrt{n-1}&(x_n > \alpha)\\-\sqrt{n-1}&(x_n < \alpha)\end{array}\right.


あれまっ!
何と、x_n\alpha がきれいさっぱり消えてしまいましたっ!


以上により、次の結論を得ます。


n 人の試験における偏差値の
最大値は 10\sqrt{n-1}+50
最小値は -10\sqrt{n-1}+50
でっす。


これから何が分かるかというと…。
1) 偏差値の最大値と最小値に関係するのは人数のみで、試験の最高得点は関係しない。1点満点でも10000点満点でも変化なし。
2) 計算の過程で \alpha が消えたことで、例えば、一人が 100 点で残り全員が 0 点の場合と、一人が 100 点で残り全員が 99 点の場合とで、100 点の人の偏差値は同じ、ということが言える。不思議。
3) 人数 n をいくらでも増やして良いのであれば、最大値(or 最小値)に上限(or 下限)はないので、理論的には偏差値 10^64+50 とか、-10^10^10+50 とかもあり得る。


試しに、世界の人口が 60 億人で、その全員が試験を受けたとして、最大値と最小値を計算してみると、
最大値は、約 774647
最小値は、約 -774547
となります。
地球上における偏差値は、今のところこれが限界のようです。