第 6 号
3
p
-- 現場における生物統計学入門 --
標準偏差と標準誤差の違いは?  (1)
東洋醸造株式会社医薬品研究所 松本一彦

 実験データの解釈に統計処理が必要であることは誰でも認めることではあるが,積極的に勉強する気にはならないというのが,多くの技術者の偽らざる気持ちであろう。できることなら,避けて通りたいと。一方,他人のデータを読む時には必ず,「この値で差があるのだろうか?」「有意差は?」と疑問を投げかける。数値はそれを作り出した人を除き,勝手に歩きだし,客観的な認識手段としてとりあげられる。それは,その数値が得られた背景を全く知らされずに提供される乾いた情報だからで,数値を得た本人だけが数値の裏側の主観的な感覚を知っている。従って,数値を提供する側に立つと,統計否定論者になり,反対に数値を読む側になるととたんに統計肯定論者になる。そこに,統計学の使用に関して大きな問題がある。
 最近,生物統計掌は大きく変わろうとしている。多群の比較を,2標本に分割して検定することに対して疑問が出され,“なんでもt検定”という姿勢に対する反省が促されている。それではそれに変わる方法はというと,多重比較検定だけでも数種あり,どれが適切であるかを吟味しなければならない。今回は現場で働く技術者からデータを作成する実験者まで,それぞれ特徴的な話題をとりあげ,その処理法にっいて述べてみたい。
はじめに:標準偏差と標準誤着を間違っていませんか?
標準偏差(standard deviation=S.D.)は得られたデータのバラツキを表す。したがって,図1のように棒グラフに示された±S.D.のエラーバーはデータのおよそ 68%がこの中にあることを意味している。決して,平均値の振れ幅を示しているものでもなく,データの95%がこの中に入っているわけでもない。

図1.(C)は平均値の棒グラフに,±標準偏差のエラーバーを付けた表示である。正規分布をするとみなせるデータについて,大きさが少なくとも50以上ある場合に限って使用できる。このときには,データのおよそ68%が,エラーバーの幅のなかにあるといえる。(D)は平均値の棒グラフに,±標準誤差のエラーバーを付けた表示である。大きさが20以上のデータについては,母平均の68%信頼区間を表すとみなしてよい。
 前提が満足されていないのに,慣習として(C)や(D)を用いている側はまだ多い。大きさ10未満のデータに(D)を適用するのは全くのナンセンスであり,絶対にやってはならない。データの分布を表示しなければならない場合に,エラーバーの幅をせまくして精密らしく見せるために,故意に(D)を使うのは一種の詐術である。(中里薄志著:実験データのグラフ表示より引用)
 標準誤差(standard error=S.E.)は得られた平均値の信頼性を表す。したがって,棒グラフに示された±S.E.のエラーバーは母平均の68%信頼限界を表すとみなしてよい。95%信頼限界を示すためには2S.E.の幅をとらなくてはいけない。すなわち,データのバラツキを示すことに用いてはならない。エラーバーの幅を小さく見せるために故意に使うことは許されない。(中里薄志著:実験データのグラフ表示.サイエンティスト社参照)
間題1.あなたが飼育担当者だったら次の問題をどう考えますか?
 ラット飼育A棟における6週齢雄ラットの体重は従来,平均値153.0g,分散が2.10であることが分かっていた。今回,新しく増設した動物室で飼育した6週齢ラットの体重を測定したところ,つぎのような結果が得られた。
 新棟飼育したラットは従来のものと同じと考えてよいだろうか?




問題2.あなたが一般毒性担当者だったら次の間題をどう答えますか?
(1)イヌの慢性毒性試験を実施し,高投与群のみに6カ月目のコレステロール値に対照群と有意差がみられた。この群は異常群としてとらえるべきだろうか?


解答:この様な問題は毒性試験を担当している技術者にはよく遭遇する問題である。特にイヌの亜急性あるいは慢性毒性試験のように時系列的に変化するデータを検定する時にしばしば悩まされる問題である。この例の場合は対照群と比較した検定では,有意差ありと判定されるが投与前との対応のある検定では有意差はない。群分けの時には体重とか心電図変化とか血液生化学検査等で偏りのないように配置しているが,数多い検査項目の中ではしばしばこの様なケースにあたる。用量相関も認められるし,対照群との間には統計的にも有意差が認められる。
 この様な場合はやはり,統計処理に従い,最高投与量群では6ケ月目にコレステロールの上昇があると判断すべきだろうか? 6ケ月目に対照群と差があっても投与前との差がない場合はその他の検査項目との関連で生物学的な有意差を判断すべきであり,一概に毒性発現ありとは判断できない。また,このような例に共分散分析を用いることも検討きれているが,まだ確立されていない。

(2)ラットの体重を測定して次の値を得た。116gは異常値(外れ値)として外すべきだろうか?
152,116.124,143.139,154,141,139.146



コメント;棄却検定は客観的に外れ値をみつける方法であるが,これを機械的に適用してはいけない。なぜ,外れ値になったのか?実験的なミスはなかったか?もし,理由がわからない場合は“考察”で外れ値を入れた場合と抜いた場合の両方について触れておく必要がある。

次項に続く--->