高校数学まとめノート No.7 データの整理 度数や代表値(中央値や最頻値など)

2021年1月6日

度数

ここはまず、データを扱っていくうえで必要な用語の定義です。しっかり覚えましょう。

👆POINT

調査や実験などで得られた測定値の集まりをデータという。データをいくつかの区間(この区間のことを階級という)に分けたとき、その階級に属する値の個数を度数という。この度数をまとめた表を度数分布表という。階級の中央の値を階級値といい、階級の全体に占める割合を相対度数、一番低い階級からその階級まですべてを合計したものを累積度数という。

度数分布表をもとに、横軸に階級、縦軸に度数を取ったグラフをヒストグラムという。

まず、階級。階級というと身分の階級をイメージする人が多いと思いますが違います。もともと、いくつかの段階に分けるのが「階級」です。ここでもいくつかの段階に分けているのが「階級」です。

それから、「度数」。どの程「度」の「数」がるかを表すのが「度数」です。

例を出しましょうか。テストの結果をデータとしてまとめるとしましょう。まず、テストの点数が「階級」になります。何点から何点が一番上の区分で、次か何点から何点で…ってするわけですね。で、それぞれの人数が「度数」になります。何点から何点には、何人いるか、その人数です。例えば、0点から10点の間にAくん1人しかいなかったら、「階級」は0点から10点で、「度数」は1となります。

これらの用語はしっかり区別して覚えておきましょう。

代表となる値(代表値)

データを見るとき、そのデータ全体として手早く特徴を述べたいときに代表値というものが欲しいですよね。ですよね、って言っても???という感じでしょうか。

分かりやすい例を出しましょう。皆さんがいつもテストのたびに気にする「平均点」ってやつです。Aくんは自分の点数が1桁でお母さんに怒られそうなので、テスト自体が難しかったのだと言い訳をしようとします。しかし、平均点は90点でした。

このとき、「平均点は90点でした」と、テスト全体の難易度を特徴づけているわけです。Aくんが気にするのは平均点だけですが、頭の良いみなさんは平均点以外の「代表となる値」も気にできるようになってください。

さて、用語を確認していきましょう。

👆POINT

分布を調べるとき、データ全体としての傾向を調べる際に利用される値を代表値といい、代表値はいくつかある。

  • 平均値 すべてのデータを足し合わせ、データの総数で割ったもの。
  • 中央値 データの中央に位置する値のこと。ただし、データが偶数個からなる場合は中央に位置する2つのデータの相加平均とする。
  • 最頻値 データにおいて最も個数が多い値のこと。もっとも個数が多い値なので、複数個になることもある。

平均値は大丈夫でしょう。小学校の頃に扱いましたね。それ以外についても用語の通りでそんなに難しくないはず。

まず中央値です。中央値は名前の通り、「中央」の値です。テストの点数で考えれば、一番成績の良い人(悪い人でもいいですが、悪い人だとちょっと印象良くないので良い人にしときましょう)から順に並べて、ちょうど真ん中になる人の成績が「中央値」です。

それから最頻値。「最」も「頻」繁に現れる「値」が最頻値です。そのままですね。ただ、例えば、90点の人が5人で92点の人も5人、それ以外は1人づつとなるとどうでしょう。この場合、最頻値は2つあるということになりますので注意しましょう。