計測工学基礎
2022.07.06
今回は日本の教育の現状の一部について考えてもらいました.結果を見ていきましょう.まずは,相関係数等の結果です.
ということで,3つほど有意な相関が見つかりました.それらについてグラフを作ると以下のようになります.
では,考察はどうなるでしょうか.データが紹介されていた本の解説から一部を持ってきましょう.まず人口が多い都道府県ほど31人以上の学級の比率が高くなることについては,ほとんどの人が言及していたように,学校の収容スペースと教員不足によるものです.では,人口と通塾率についてはどうなんでしょうか.もちろん人口が多いところほど塾が多いという見かけの要因があることは確かです.ただ,3つめの相関,すなわち31人以上の学級の比率と通塾率を併せて考える必要がありそうです.クラスの人数が多いことで,学校で十分に学べているという肯定的な感情が実は弱くなります.そのため,塾に行かないと満足に学習したという感覚が得られないことが多いということになります.そして,それを裏付けるのが,学力テストと通塾率に有意な相関が無いことでしょう.塾に行かないと適正な学力をつけられない,すなわち学校教育だけでは不十分ということが言えそうです.政府には教育予算をもっとつけてもらって公立学校の教育を充実してもらいたいものです.
では,例によってちょっと問題のあるものを見ていきましょう.まずは縦軸と横軸に選ぶ量をよく考えてと言っていたのにおかしいものです.
基本的な方針としては,横軸には自分で操作可能な量か,基準となる量を取り,その結果変化する量を縦軸に取ります.今回で言うと,当然人口はなかなかコントロールできませんので,人口によって学級編成が変わるのか,をみるために横軸が人口でないと不自然です.一方,右側のような関係では,政策として自治体が行っているものが学級編成ですので,これがまず横軸となり,その結果かどうかは現段階では分からないところがあるものの,通塾率が縦軸になるでしょう.
次に示すのは不自然な有効数字の例です.相関係数は2桁程度で充分とこれまで言ってきたので,0.00としたのでしょうが,この場合には2桁分を表示させましょう.
次の例です.きちんと表にまとめてくれたことはありがたいのですが,まず記号の部分がイタリックになっていませんね.そして,列幅が狭いので数値が途中で改行されています.数値の改行は避けましょう.
そして,次の表は記号以外の文字もイタリックになっていることと,べき乗がエクセルやプログラミング言語で使用するEをつかったもののままです.レポートですので,べき乗はきちんと上付き記号で表現してください.
次も同じですね.かけ算の * 記号やべき乗の ^ 記号も特殊な用途で使用するためのものです.きちんと書きましょう.
さて,ここからは考察に関するものです.まず前回も言いましたが,次のようなものは考察とは言いません.ただ結果を書いただけです.
そして,次のものは書いていることが矛盾しています.コピペによるミスかもしれませんが,最後にちゃんと確認しましょう.
次のものはどうしてこうなるのか,理解できません.危険率とは何なのか,もう一度ちゃんと復習して理解してください.
最後はなんじゃこれ?というものです.レポートの記述を中央揃えにする意味がわかりません.で,これがしかも一人ではないということで,大変驚いています.
前回は無相関検定でした.有意な相関かどうかを見るものでしたが,検定の場合はまとめの表現が難しいので,早いところで慣れておくようにしましょう.
資料を参考に予習してください.
2つの平均値の間に有意な差があるかどうかは t 検定により確認できましたが,平均値の個数が3つ以上になると, t 検定では確認できません.そこで分散分析を行うことになります.今回は分散分析について実習します.
t 検定で実施した平均値の検定ですが,平均値の個数が3個以上になると分散分析で有意差について検討します.その際に,単純に平均値の個数が増えただけの状態が1元配置となります.学校のクラスの平均点などでは1組〜5組までを考える,というような場合がそれに相当します.このようなクラスの違いを「要因」と言い,5組まであるのなら「水準」が5というように言われます.一方,1年生から3年生までのそれぞれ各クラスというようになると,要因が学年とクラスの2つになりますので,そのような場合は2元配置と呼びます.2元配置は後ほど行うことにして,今回は1元配置の分散分析について考えます.
初めてWindowsで分散分析を行う場合にはエクセルに機能を追加する必要があります.以下の作業を行ってください.
Excelでは統計分析を行う環境はデフォルトでは見えないようになっていて,「アドイン」で追加する必要がありますので,まずはその準備から行いましょう.
まずは,「ファイル」メニューを開いてください.すると,図1のように一番下の方に「オプション」がありますので,それをクリックします.
「オプション」をクリックして開いた図2のウインドウの中の「アドイン」をクリックします.
図3のウインドウが表示されるので,「アドイン」の中から「分析ツール」をクリックして選択し,「設定」ボタンをクリックして下さい.
図4のウインドウが表示されるので,「分析ツール」のチェックボックスにチェックを入れて「OK」ボタンをクリックします.
ホーム画面でファイルメニューから「データ」を選択すると,図5のように「分析ツール」が追加されていることが確認できるはずです.
最近の表計算ソフトでは分散分析はあらかじめ用意されていますが,単純に関数一つでできるようなものでも無いので,メニューから呼び出して使用する形式になっています.以下の例で試してみましょう.
使用するデータはリンク先のものとします.このデータには水準がA〜Dの4つあります.以下の手順で分析してみましょう.
Excelのデータメニューにある「分析ツール」をクリックすると図6の画面が表示されるので,「分析ツール」の先頭にある「分散分析:一元配置」を選択して「OK」をクリックします.
図7の画面に変わるので,入力範囲を設定してください.見出しの部分も含めて選択し,「先頭行をラベルとして使用」にチェックを入れておくと,項目名として自動的に入れてくれるので助かります.αの値はとりあえずデフォルトの0.05のままで構わないでしょう.
出力先はデータと同じ表の中に出す場合には「出力先」を選択して,自分で場所を入力します.↑ボタンで設定します.別のシートに出す場合には「新規ワークシート」で,別のファイルとする場合には「新規ブック」になります.
設定が完了して「OK」をクリックすると結果を図8のように表示してくれます.分散分析表も出してくれますし,危険率 p の値や,p が0.05となる F の値も計算してくれています.
分散分析表には簡単な説明もついていますし,資料の方にも載せているのでそれを参考に見ていきましょう.まずは,各グループの平均と分散が計算されています.続いて下に分散分析表が来ます.
群間の変動と群内の変動,自由度,残差の平方和( SB と SW ),それらの比( F 値),そしてその F に対応する危険率 p ,最後が p =.05になる F の値という順番です.
この例題の検定結果は以下のように記述します.
ただし,分散分析単体ではどの平均値の間に有意な差があるかはわかりません.それについては次週の多重比較で扱います.
次回は多重比較について学習します.予習用の資料を参考に予習してください.
いつものレポート提出システムを利用して行います.
宿題の公開は原則として火曜日の18:00からとなります.また,提出の締め切りは授業翌週の火曜日の13:00までです.よろしくお願いします.
関係 相関係数 t 0 p 検定
人口ー学級比 0.67 5.998 3.15×10-7 ***
人口ー通塾率 0.51 4.000 2.33×10-4 ***
人口ー正答率 -3.3×10-3 -0.022 0.983 n.s.
学級比ー通塾率 0.58 4.828 1.63×10-5 ***
学級比ー正答率 0.10 0.6460 0.522 n.s.
通塾率ー正答率 8.3×10-3 0.0559 0.956 n.s.
都道府県人口に対する31人以上の学級比率
都道府県人口に対する放課後通塾率
31人以上の学級比率に対する放課後通塾率
図1 「ファイル」ウインドウ
図2 「オプション」ウインドウ
図3 「アドイン」選択ウインドウ
図4 分析ツールの選択
図5 「データ」タブへの「分析ツール」追加
図6 分析ツールの選択
図7 分散分析の設定画面
群A〜Dに関して以下の平均値が得られた.
m A = 4.6, m B = 5.5, m C = 6.4, m D = 7.0
帰無仮説: これらの平均値の間には有意な差はない
検定結果: F (3,33) = 5.19, p = .0048
よって,帰無仮説は棄却可能
これらの平均値の間には有意な差がある
Back