池袋日記: 多変量解析

ソーターという機械は、一回に単一の変数の数値の分布しかすることができない。特定の大統領候補に対する支持という変数が、カードの第二〇行に入っているとするなら、一組二八七一枚のカードを一回機械にかけると、そのパンチに従ったポケットにカードが分類される。つまりソーターは、単変量解析の機械だったのである。大統領候補の支持率を従属変数（結果）とし、性別という変数を独立変数（原因）として二つの変数間の関係の解析つまり二変量解析（biｖａｎａｔｅ　ａｎａｌｙｓiｓ）を行いたいと考えたとする。その場合は、ソーターのそれぞれのボックスに落ちたカードの山を一組として、同じ過程を、繰り返していかなければならない。

最初のカードの山は第一回の支持率に関する分類で、「支持」と「不支持」の二つの山に分かれたとする。第二回目の性別という変数に関する分類ではこの二つのカードの山を、それぞれ「男性と女性」の山に分ける。そして出来上ったＡＢＣＤという、四つのカードの山の実数を、図の下に書かれた表にまとめる。こういう形で、記述的な単変量解析を二回重ねることによって、われわれは説明的な二変量解析に進んでいくのである。あのソーターによる解析は悪夢のような作業であった。しかし深夜のリサーチーセンターの機械室で、私たちは何度もカードを破りながら、サーヴェイーリサーチの論理を学んでいったのであった。それはいわば数量というものの扱い方を、手の作業を通じて覚えて行く過程であった。

さて私はあのソーターによる実習でサーヴェイーリサーチの論理を学んだといった。しかしサーヴェイーリサーチの本格的な論理は、図で示した二変量解析に、もう一つ変数を加えたところから、つまり三つ以上の変数を使用した多変量解析（mｕlｔiｖａｒiaｔｅ　ａｎａｌｙｓiｓ）の段階から始まるのである。それはどういうわけであろうか。

今、因果法則を支える三つの基本的原則を考えてみるとそれは田従属変数（結果）に対する、①　独立変数（原因）の先行、②　両変数の共変、それに、③　その他の変数の統制という、三つの条件であった。そしてこの三つの条件のうち、もっとも困難と思われる第三の条件、つまり「その他の変数の統制」は、前章で述べたように、実験的方法においては、変数の状況的操作によって解決されたのであった。つまり独立変数の影響におかれる実験群に加えて、独立変数の影響のない統制群を設定することによって、解決されたのであった。

このように実験的方法においては、研究者が実験群と統制群とを無作為に抽出するというような、状況の統制、あるいは操作を行うことかできた。しかしデータをコンピュータ化したサーヴェイーリサーチの方法では、現実の状況を操作することはできない。そこで現実を操作する代りに、この方法は数学的操作の方法を使用して、独立変数以外の第三の変数群を、統制しようとするのである。このような統制を加えない限り、第三の変数によって、従属変数が影響を受けている可能性を除去することはできない。

池袋日記

2014年5月23日金曜日

多変量解析

ブログアーカイブ

池袋日記

2014年5月23日金曜日

多変量解析

ブログ アーカイブ

ブログアーカイブ