統計を疑え

　主張の根拠となる文献の重要性については、三浦氏がコラム「ネットコラム〜その危険性」で述べているとおりである。特に、具体的な数値情報を提供してくれる世論調査などの統計は、物事を定量的に分析する上で非常に重要である。
　しかし、統計が常に実情を反映しているとは限らない。数値への過度の信頼は大変危険であることを、私は警告する。

＊　　　　　　　　　　＊

　分かりやすいように、「統計情報」を「実験結果」と読み替えて考えてみよう。

　科学を志す者ならば１度くらいは聞いたことがあるだろうが、実験で最も重要なことの１つに、結果の「再現性」がある。すなわち、実験で得られたデータが信憑性を持つためには、何度実験し直しても例外なく同じ結果が得られる必要がある（もちろん、偶然誤差という避けられないズレは存在するが）。そして、その再現性を保つ上で欠かせないものが、実験時の条件、例えば圧力や温度、湿度に関する情報である。
　実験時の条件が完全に再現できれば、当然、実験の結果も再現される。逆にいえば、条件が違えば結果もまた異なってくるし、結果に再現性がない場合は条件の指定に不足があるともいえる。したがって、実験条件が記されていない結果は、役に立たない。

＊　　　　　　　　　　＊

　ならば、統計の場合の「条件」とは、何だろうか？

　母集団をどう設定するかは、極めて重要な条件である。同じ質問でも、地域や世代、性別によって回答が異なってくることはよくある。
　そして、その母集団を元に、どのように標本（サンプル）を抽出するか。一般に、新聞等の世論調査には、この抽出方法に問題があることが多い。電話調査では、有効回答を得られる相手が、時間帯によっては特定の職業に偏りやすい。街頭での面接調査は、調査員や調査時間帯、天気によって声をかける相手に偏りが生じやすい。
　質問の形式によっても、調査結果は左右される。これはもはや心理学的なレベルの問題であるが、同じような内容の質問でも、問いかけ方が少し違うだけで、回答者の反応が変わってくることがあるのである。

　世論調査におけるこういった条件は、新聞には詳細に記載されていることが多いが、新聞より表現力も影響力もあるはずのテレビニュースでは、あまり伝えられていない。
　我々は、見た目の数値に惑わされることなく、数値の背景がどうなっているのかを冷静に考えて調査結果を把握するように、努めなければならない。

＊　　　　　　　　　　＊

　統計という手法の性質上の問題もある。
　標本調査では、その性質上、サンプリングに伴う誤差は避けられない。標本が母集団からバランスよく抽出されるかどうかは、確率の世界だからである。具体的には、標本数のマイナス2分の1乗で誤差が効いてくるため、標本数が数万〜数十万以上という大規模な調査（多くの場合、世論調査は数千人規模で行われる）を行わない限り、誤差は、無視できない大きさを持つ。

　マイナス2分の1乗といわれても実感が湧かないだろうから、計算例を出そう。
　テレビ朝日の「ニュースステーション」が2002年12月14日(土)・15日(日)に行なった内閣支持率調査によれば、小泉内閣の支持率は55.7%である。調査結果のWebページより、この調査の対象は1000人、有効回答率は62.3%であるから、有効な回答をしたのは623人と分かる。
　これらの値を基に、有効回答について区間推定の考えを導入してみる。なお、計算に際し、標本の値を標本の大きさで割った比率が正規分布であると仮定（すなわち、有効回答者623人が十分大きい人数だと仮定）し、支持率の真値をｐとおくことにする。（計算の詳細はこのコラムの最下部を参照）
　たいていの人は、支持率が55.7％と聞けば、ｐ＝55.7％である、あるいは有効数字を考慮しても55.6％≦ｐ≦55.8％である、と考えるだろう。ところがこの場合、ｐが 55.6％≦ｐ≦55.8％の区間にある確率は、実はたったの4.0％である。もちろん、この区間が最も確率の高い区間ではあるのだが、それでも、支持率が本当に55.7％である確率は4.0％でしかないのである。これだけでも、調査結果が大きな誤差を含んでいるかもしれないということが分かるだろう。
　念のためにｐの95％信頼区間を計算すると、51.7％≦ｐ≦59.6％となる。これは、ｐが95％の確率で51.7％〜59.6％の範囲にあるということである。やはり、可能性の高い範囲は、案外大きいのである。

　本来ならば、世論調査のような統計調査の結果には、質問の形式や誤差など、ありとあらゆる情報が明記されるべきである。だが多くの場合、調査方法は詳細に書かれているものの数値処理については記述が省略され、信頼区間の中央にあたる「最も確率の高い」値のみが調査結果として表舞台に登場する。そして多くの人が、実は数％の確率でしか的中していないない代表値を、真値であると信じてしまっているのではないだろうか。

＊　　　　　　　　　　＊

　数値処理されたデータは、客観性の高い論拠としてよく用いられる。実際、具体的な数値に基づいた議論には、説得力を感じることが多い。
　けれども、そういった定量的な議論に耳を傾けるとき、我々は、提示されたデータのもつ意味を本当に理解しているのだろうか。数字の大小のみに気を取られてはいないだろうか。数値以外の価値を見失ってはいないだろうか。

　三浦氏はこう述べている。

『情報というものはそれが「真実」（事実）であって初めてその役割を果たす性質を持つ。』

　このことは紛れもない事実であり、私も決して否定するつもりはない。が、数値データに関していえば、真実のうち、数字で表されているものが一体どれほどあるだろうか。そこには、表されていない数値や、数値では表すことのできない価値がたくさんあるはずだ。たった１つの数字を知っただけで、それが物事の本質だと思い込んではいけない。

　情報というものは、正しく認識されて初めてその役割を果たすものなのである。

＊　　　　　　　　　　＊

資料：小泉内閣支持率に関する計算の詳細

標本数ｎ＝623
分散Ｖ＝0.557(1−0.557)／ｎ＝0.000396
標準偏差σ＝sqrt(Ｖ)＝0.0199　（「sqrt(Ｖ)」はＶの平方根を表す）

0.001＝0.050σ
であるから、
0.556≦ｐ≦0.558（すなわち、ｐ−0.050σ≦ｐ≦ｐ＋0.050σ）
である確率は、正規分布表より、
0.0399

95%信頼区間は−1.960σ〜1.960σの区間である（正規分布表より算出）から、
0.557−1.960σ≦ｐ≦0.557＋1.960σ
0.517≦ｐ≦0.596

＊　　　　　　　　　　＊

この文章は、「三浦仮想研究所」に投稿したものです。
関連する文書「ネットコラム〜その危険性」は三浦氏の著作であり、上記のウェブサイトにて公開されています。