一元配置分散分析の計算方法【実用はエクセルでやろう!】 | シグマアイ-仕事で使える統計を-
(1) Rコマンダーで一元配置(1要因の)分散分析・多重比較を行うためのデータの形 右の表3のような形のデータにおいてグループA1,A2,A3の母集団平均の有意差検定を行いたいとき,Rコマンダーで分散分析・多重比較を行うにはExcel上で表4のようなデータの形に直しておいてこれをRコマンダーから読み込むようにする.(グループ名は数値データではなく文字データとする.) (2) Rコマンダーを起動する Excel2010, Excel2007 での操作 (Excelの内部から)アドイン→RExcel→Start R Excel2002 での操作 (Excelの内部から)RExcel→Start R →RExcel→RCommander:with separate menus (3) Excel上で右の表2に示した範囲をコピーする. (4) Rコマンダーのメニューから データ→データのインポート:テキストファイルまたはクリップボード,URLから... →右図3のようにクリップボードを選択 (3)でメモリに入れた内容をインポートする フィールドの区切り記号としてタブを選択 表2のように「列見出し」のないデータをコピーしているから「ファイル内に変数名あり」の チェックをはずす . (変数名がないので出力のときV1, V2という変数名が付けられる.) →OK (出力ウィンドウに Dataset <- ("clipboard", header=TRUE, sep="\t", rings="NA", + dec=". ", )などと表示される) (このとき,データがうまくインポートできているかどうかはRコマンダーのメニューで[データセットを表示]というボタンをクリックすると分かる) (5) 一元配置の分散分析を行い,同時に多重比較の結果も表示されるようにする (Rコマンダーのメニューから)統計量:平均:一元配置分散分析 → このとき右図4のように「2組ずつの平均の比較(多重比較)」にチェックを付ける →OK (6) 出力ウィンドウに > summary(AnovaModel. 分散分析 には、エクセル excel が大変便利です!. 2) Df Sum Sq Mean Sq F value Pr(>F) V1 2 2. 1870 1. 09350 5. 401 0. 02877 * Residuals 9 1. 8222 0. 20246 --- 0 '***'0.
一元配置分散分析 エクセル やり方
93 23 5. 01 27 5. 31 手順は、次の通りです。 1) 上記の表をEXCELのワークシートのセル範囲A1:E4へ入力します。 2) 「分析ツール」ー「分 散 分 析:繰り返しのない二元配置」を選択し、「OK」ボタンを押します。 3) ラベルを含めたため「入力範囲」へ$A$1:$E$4を入力します。 4) 「ラベル」にチェックを入れます。 5) (※ 0. 05 又は 0. 01の有意水準を入力できます。) ※ 有意水準とは、帰無仮設を偽として棄却してしまう誤りを犯す基準となる確率です。 6) 「出力オプション」を選択し「OK」ボタンを押します。 7) 「観測された分散比」と「F境界値」とを比較します。 計算結果は、変動要因の「行」が「気温」の影響、また「列」が「材質」による値を示します。 「観測された分散比」 > 「F境界値」 の場合、「違いがある」、と判定できます。 2. 30751 < 5. 14325 であったため、「気温」による影響が「材質」に対して「違いがある」出ることは、却下されます。 一方 6. 92563 > 4. 75706 であったため、「材質」による「違いがある」、と判定できます。 3.エクセル 分散分析の説明 (1)「偶然」との比較は、どこでなされているのでしょうか? 29-5. 一元配置分散分析-エクセル統計 | 統計学の時間 | 統計WEB. 一つの正規分布母集団からランダムに抽出した2組の試料の「平均値」の「ばらつき」は、標準偏差によって分かるかも知れません。 しかし、「標準偏差」の分布は、「正規分布」になりません。 「確率論」の研究の成果として、不偏分散(分 散)の比が確率密度関数になります。 したがって、この確率密度関数が「偶然」と関連しているため、採用されることになりました。 (※ この確率密度関数は、F分布と呼ばれています。) (2)「ものさし」として使用されている確率分布は、どの分 布でしょうか? F分布です。 (3)「目盛」は、どこにあり、「精度」は、どれ程でしょうか? 「p値」は、確率の「目盛」で、F分布の両側に広がる稀に起こる確率を示しています。 この値は、小さいほど、検定統計量がその値となることがあまり起こりえないことを意味しています。 また、「精度」と考えられる基準は、「有意水準」で、この基準以下の確率になった場合、検定の信頼性をチェックする必要があります。 (※ 「帰無仮説」、「H0」などの、 「差がない」 、という仮説を立て、その仮説を棄却するを意味します。) エクセル分散分析において、とりあえず立てられる帰無仮説は、「標本は、平均値が等しい」という仮説です。 主に次の内容により、この仮設が成立せず棄却されます。 1) 「p値」が有意水準0.05よりも小さい場合 (※ この0.
一元配置分散分析 エクセル 繰り返しのある
95*0. 95=0. 1426 となって,有意水準14%の検定を行っていることになり,有意水準5%の検定にならない.したがって,3つのグループのうち「少なくとも1組」に有意差があるかどうかの検定は3組のt検定に置き換えることはできない. 【例1】 ・・・対応のない一元配置 次の表1は異なる3つのグループA1, A2, A3について行った測定結果とする.これら3つのグループの母集団平均には有意差があるかどうか調べたい. 表1 A B C 1 A1 A2 A3 2 9. 5 10. 1 11. 3 3 9. 7 10. 7 4 9. 6 10. 一元配置分散分析 エクセル. 2 5 9. 8 9. 3 6 データはExcelワークシート上の左上端にあるものとする. (このデータを転記するには,上記のデータを画面上でドラッグ→右クリック→コピー→Excel上で左上端のセルに単純に貼り付けるとよい.ただし列見出し,行見出しの分が多いので削除する必要がある.) ■Excelでの操作方法 Excel2010, Exel2007 での操作 ・データ→データ分析 Exel2002 での操作 ・ツール→分析ツール →分散分析:一元配置→OK ・入力範囲:A1:C6 (上記の桃色の欄も含める)(グループA2,A3には空欄がある[データ件数が異なる]のはかまわない.ただし,空欄に「欠席」,「余白」,スペース文字などの文字データがあると分散分析を適用できない.) ・データ方向:列 ・先頭行をラベルとして使用:上記のように入力範囲にラベルA1~A3を含めた場合は,チェックを付ける ・α:有意水準を小数で指定する(デフォルトで0. 05が入る) ・出力先:ブックやシートが幾つもできると複雑になるので,同じワークシートの右側の欄に出力するようにするには,[出力先]を選び空欄にE1などと書きこむ 図1 図2 ※(参考)t検定と分散分析の関係 通常,2グループからなる1組の母集団平均の有意差検定はt検定で行い,3グループ以上あるときは分散分析で行うが,分散分析は2グループに対しても行うことができる.そのときは,両側検定となり(t値は得られないが)t検定と同じp値が得られる. (表1,表2参照) 2グループに対する分散分析において有意差が認められる場合は,以後の多重比較という問題はなくなり,当該2グループの平均に有意差があることになる.
一元配置分散分析 エクセル
エクセル 分散分析を簡単に解決しました。 エクセル 分析をマスターしましょう! 分析 には、エクセル excel が大変便利です! Homeへ 分散 エクセル 分散分析では、「ばらつき」を比較します。 1.エクセル 分散分析とは 分散分析とは、収集したデータの「平均値の違い」の「ばらつき」に注目して比較(検定)する方法を言います。 「全てのデータの集合の母平均は、等しい」、という仮説が成立するかどうか検定します。 但し、標本が3つ以上ある場合、この検定が有効です。 簡単に標本の母平均が等しいか検定できるからです。 (※ 多重比較は、複雑になるため、母平均が等しいかどうかに絞って検定する場合、この「分散分析」が有効であり、効率的です。) このエクセル解析は、さまざまな種類について行うことができます。(※ Excel ヘルプより引用) 2.エクセル 分散分析手法 (1)分散分析:一元配置 この解析は、一つの要因について行う分析です。 例えば、「一つの要因」として「材質」の Z1, Z2, Z3, Z4 に対して厚みを測定し、次のデータを収集できました。 Z1 Z2 Z3 Z4 5. 23 4. 83 5. 13 4. 93 5. 一元配置分散分析 エクセル やり方. 21 4. 91 5. 01 5. 01 5. 36 4. 77 5. 32 5. 31 エクセル操作手順は、次の通りです。 1) 上記の表をEXCELのワークシートのセル範囲A1:D4へ入力します。 2) 「分析ツール」ー「分 散 分 析:一元配置」を選択し、「OK」ボタンを押します。 3) ラベルを含ませるため「入力範囲」へ$A$1:$D$4を入力します。 4) データ方向を「列」にチェックを入れます。 5) 「先頭行をラベルとして使用」にチェックを入れます。 6) 「出力オプション」を選択し「OK」ボタンを押します。 7) 「観測された分散比」と「F境界値」とを比較します。 「観測された分散比」 > 「F境界値」 の場合、「材質」の「違いがある」、と判定できます。 5. 21949 > 4. 06618 であったため、「材質」の「違いがある」ことが分かりました。 このように、標本が3つ以上ある場合、この検定が有効です。 簡単に標本の母平均が等しいか検定できるからです。 (2)分散分析:二元配置 この解析は、2つの要因について行う分析のことです。 例えば、「2つの要因」として「材質」の Z1, Z2, Z3, Z4 と「気温」の変化に対して厚みを測定し、次のデータを収集できました。 気温 Z1 Z2 Z3 Z4 20 5.
表ア・・・表1のうちの1組(A1, A2)のデータに対するt検定の結果の出力 t-検定: 等分散を仮定した2標本による検定 平均 9. 680 9. 875 分散 0. 092 0. 282 観測数 プールされた分散 0. 174 仮説平均との差異 0 自由度 7 t -0. 698 P(T<=t) 片側 0. 254 t 境界値 片側 1. 895 P(T<=t) 両側 0. 508 t 境界値 両側 2. 365 表イ・・・表アと同じ1組のデータに対する分散分析の結果の出力 分散分析表 変動要因 変動 観測された分散比 P-値 F 境界値 グループ間 0. 085 0. 487 5. 591 グループ内 1. 216 合計 1. 3 8 →次のような出力結果が得られる. ↓ (ここに平均値の一覧表が入る) ↑ 2. 187 1. 094 5. 401 0. 029 4. 256 1. 822 9 0. 202 4. 009 11 ■Excelによる分散分析表の出力の見方 ○変動の下端行にある合計の欄 4. 一元配置分散分析の計算方法【実用はエクセルでやろう!】 | シグマアイ-仕事で使える統計を-. 009 は,図1で赤で示した全体の変動,図2の全体の変動に対応している. 表1の12個のデータの全体の平均は m=10. 01 で,全体の変動は (9. 5− m) 2 +(9. 7− m) 2 +(10. 1− m) 2 +··· ···+(10. 2− m) 2 =4. 009となる. ○グループ内の変動 1. 822 は,図1で青で示したもの,図2の青枠に対応している. A1の5個のデータの平均は m 1 =9. 68 で,A1のグループ内の変動は (9. 5− m 1) 2 +(9. 7− m 1) 2 +(10. 1− m 1) 2 +···+(9. 3− m 1) 2 A2の4個のデータの平均は m 2 =9. 88 で,A2のグループ内の変動は (10. 1− m 2) 2 +(10. 5− m 2) 2 +(9. 6− m 2) 2 +(9. 3− m 2) 2 A3の3個のデータの平均は m 3 =10. 73 で,A3のグループ内の変動は (11. 3− m 3) 2 +(10. 7− m 3) 2 +(10. 2− m 3) 2 これらの和,すなわちグループ内の変動は 1. 822 となる. ○グループ間の変動は「全体の変動」−「グループ内の変動」で求める.