情報地球科学 (2024年前学期) 第03回

第02回で「平均・分散・標準偏差」の定義などの説明はざっくり終わっている。 しかし (演習の進度との調整を例年やっている都合もあり)、平均とか分散とか標準偏差に関連した話を2回分入れておきたい。 その1回目は、テキスト第2章の前半に沿って、確率とか正規分布とかの話をする。 次回は誤差論の入口の話をする予定であるので、そのきっかけになりそうな感じで。

「確率」と「平均」の関係

「平均」とは、確率の言葉でいえば「期待値」のこと。 これをいま一度ふり返ってみる。

確率が一定でないことをとり入れた平均が「重みつき平均」である。 ここで登場する「重み」は「確率」であるからには、「重み」は全て正であり、また総和は1でなければならない。

図2.1と図1.1のグラフの違い、あるいは式(1.4)と式(2.6)との違いに注意。 図2.1では各月を表わす区間の幅は (実は) 一定ではない。 こうした区間の幅の違いを考慮した上で「平(たいら)に均す(ならす)」のが重みつき平均である。

平均・分散・標準偏差が出てくる例: 偏差値

偏差値 (へんさち、Standard score) とは、ある数値が母集団の中でどれくらいの位置にいるかを表した無次元数。

表2.1のように、「偏差値の値が○以上だと上位△%」などとよく言われる。 ただしこれは、値の分布が「正規分布」に近いときのみ有効。

正規分布

ガウス関数

誤差関数