高校数学まとめノート No.9 四分位数と箱ひげ図

2021年1月6日

四分位数

データの散らばりを見るために使えるもう一つの基準が「四分位数」というものです。

👆POINT

データの値の大きさを小さいものから順に並べたとき、それらを4等分する区切りの値を四分位数という。小さい方から順に、第1四分位数、第2四分位数、第3四分位数といい、それぞれ\(Q_1,~Q_2,~Q_3\)で表す。第2四分位数は中央値と一致する

また、\(Q_3-Q_1\)を四分位範囲といい、その半分\(\displaystyle \frac{Q_3-Q_1}{2}\)を四分位偏差という。

まず、四分位数という概念です。「しぶんいすう」と読みます。

これは、データを小さい順に並べてそれを4分割した。たったそれだけです。

この4分割をすることに何が意味があるのか?それは、「真ん中の半分」(第1四分位数から第3四分位数、下でやる箱ひげ図のはこの部分)が全体のどれくらいを占めているかが分かるんです。

これによって、比較的みんなが平均値や中央値あたりにいるのか、それともけっこうバラバラになっているのかが分かるわけです。

箱ひげ図

👆POINT

次のように、四分位範囲を箱で表し、範囲(レンジ)をひげで表したものを箱ひげ図という。

箱ひげ図
箱ひげ図

平均値を書き入れたい場合は+記号を用いるが、この記号は書き入れない場合が多い。

この図、名前の通り箱にひげが生えているように見えるから「箱ひげ図」といいます。この箱ひげ図はExcelを使って書きました。

この箱ひげ図は定義の通りなのであまり説明することがないんですが、ちょっとだけ見方を説明しておきましょう。

まず、箱の部分です。これが何を意味するかということです。箱の部分は第1四分位数から第3四分位数までです。両端のひげの部分にそれぞれ\(\displaystyle \frac{1}{4}\)づつのデータが入っています。すなわち、箱の部分には全体の半分のデータが入っていることになりますよね。

半分のデータが入るのが箱の部分ですから、全体としてどれくらい散らばっているのか、が一目でわかることになります。