SSブログ

タイプ1エラーを巡る迷走 [ABOFAN問答集]

 さて、基本的な正しい知識は前前回の記事を参照してもらう事にして、今回はTAKESANとこの掲示板における#200を起点にした、主に「タイプ1エラー」にまつわるやりとりについて、一連の流れを逐次追いながら解説を加えたいと思います。
 ※注 非常に長いです。覚悟してください。

 只でさえ長いので、紹介したコメントは投稿の文章の中から、「タイプ1エラー」にまつわるやりとりに絞って抽出していますし、空白行もなるべく削除していますし、行頭の空白も無くなっていると思います。それはご容赦を。
 「都合の良い部分だけ取り出したのでは?」と訝しがる方もいるかもしれませんし、私も見落としがあるかもしれませんので、ぜひネタ元の掲示板も参照していただき、問題があれば教えて下さい。
(あと、さすがの私も全て校正し切れているとは思えません。タグの入れ忘れなどあったら教えてください。誤字脱字は見逃してください)
 また、コメント引用文においては、投稿者の敬称は略させていただきました。
 なお、一気に全部読み下すのは、よほどのヒマ人しかできなそうなので、適当にしおりを入れておきました。随時ご活用ください。


【はじまりはじまり】

まず、起点となるFSMさんの発言を紹介します。
200.FSM 2008/12/09 01:23
問題は、「意味のある」有意差というところです。大雑把にいえば、有意水準5%で統計やれば、100個質問項目があれば、5個ぐらいは本来相関がなくても相関が一見出ちゃうわけで。ここのハードルが高いですよね。

 この発言をした意図については#200以前を参照する必要がありますが、まず「有意水準5%で統計やれば、100個質問項目があれば、5個ぐらいは本来相関がなくても相関が一見出ちゃう」に関しては、(後で部分的に修正が入りますがそれを考慮すれば)統計理論上間違っているものではない、というより統計理論における「有意水準」の概念ほぼそのままと言えます。

 この概念をキチンと押さえていないと、「検定の多重性」と言われる“一つのデータに様々な方法や組み合わせで検定をする”問題や、“多くの項目に検定をかける”問題について理解できません。
 しかし、それに対しABOFANクンは異を挟みます。
210.ABO FAN 2008/12/10 22:29
これは、正直トホホです。(*_*)
今までの議論が、すべてムダになってしまうと言ってもいいほどです。
タイプ1エラー、タイプ2エラー、検定力、多重比較を少しでも知っていれば、こんな書き方はしないと思うんですが…。
「有意水準5%で統計やれば、100個質問項目があれば、5個ぐらいは本来相関がなくても相関が一見出ちゃう」というのはウソとは言えなくとも、正しいとは言えません。
この点だけは、TAKESANも完全に私に同意してもらえると思います。
あるいは、文章を単純化しすぎたといことですかね?
次回の訂正をお待ちしています。

 「ウソとは言えなくとも、正しいとは言えません」
 ABOFANクンお得意の曖昧表現です。
 しかも、『間違っている』と明言しないくせに、文末では「訂正」という“間違い”を前提とした言葉を使います。そして文頭では「正直トホホです。今までの議論が、すべてムダになってしまうと言ってもいいほどです。」などと、まるでFSMさんの資質の重大な欠陥であるかのような口調です。

 にもかかわらず、「タイプ1エラー、タイプ2エラー、検定力、多重比較」と、なんか、知っている統計用語を羅列するだけで、「何が正しくないのか」という“最も肝心な事”についての説明は一切ありません(ABOFANクンは、常々「具体的に指摘してくれないと答えようがない」と言いますが、自分の物言いが具体的で無い事については無頓着のようです)。

 そもそも、「ウソ」と「正しい」の合間とは何なのでしょう?
 どこかに一部でも間違いがあるのであれば、それはウソを言っている事になるし、そうでないならば、例え充足する余地があるにしても、少なくとも言っている事自体は正しい事になります。
 その合間の評価を下してしまうというのは、評価される側(FSMさん)の問題ではなく、「間違い」も「正しさ」も判断できないという評価する側の問題。
 結局は、ABOFANクンがそれを判断できない(わからない)のが悪いだけで、FSMさんの問題ではないわけです。
 
 だからFSMさんは下のように困惑するしかありません。
220.FSM 2008/12/14 00:17
ええと、どう正しくないのか、教えていただけますか?
ちなみに ABO FANさんのウェブページ(の新バージョン)も見たけど、理解できませんでした。

それに対し
228.ABO FAN 2008/12/14 23:32
「有意水準5%で統計やれば、100個質問項目があれば、5個ぐらいは本来相関がなくても相関が一見出ちゃう」ということはありません。
例えば、サンプル数が少なければ、ほとんど差は出ません。
また、同じ質問項目は、他の調査にもありますので、「5個ぐらいは本来相関がなくても相関が一見出ちゃう」かどうかは、チェックできます。

 「ウソとは言えなくとも、正しいとは言えません」という曖昧表現から、今度は「ということはありません」という否定に変わりました。
 『サンプル数が少なければ、ほとんど差が出ない。』というのがその理由のようです(ここで言う“差”とは“有意差”の事であろうと補う必要はあると思いますが)。

 「また~」以下は、多分再現性の話をしているのでしょうが、だったら「5個ぐらいは」は非常に余計で、人の主張の正確性を殊更問題にする人であれば、自分も文章に気を遣って、「他の調査にもありますので、本来相関がなくて出たものかどうかはチェックできる」と言うべきでしょう。

 ついでに言えば、どうやら「5個ぐらいは」という事に焦点を置いて批判しようとしているようですが、そういう自分は「ほとんど」という“批判対象”よりも曖昧な表現をしている点でおかしいわけ。
 
 ABOFANクンは勝手に「4個以下」を“ほとんど”と規定しているのかもしれませんが、そんな事知ったこっちゃないわけで、「ほとんど差は出ない」事が「100個中5個ぐらい出る」事とは違う、という事を明示できていない点で、この記述は、読む人にとって「否定の理由を説明せず否定している」だけにしか見えません。

 なお、その後補足的な事も言っています。
234.ABO FAN 2008/12/16 01:09
「有意水準5%で統計やれば、100個質問項目があれば、5個ぐらいは本来相関がなくても相関が一見出ちゃう」というのは、妥当な記述とは思えません。
「有意水準5%」というのは、タイプ1エラーが5%(以下)の確率で起こるということです。
しかし、それだからと言って、どんな場合でも「100個質問項目があれば、5個ぐらいは本来相関がなくても相関が一見出ちゃう」のではありません。

 あらら、「ウソとは言えなくとも、正しいとは言えません」→「ということはありません」ときて、今度は「妥当な記述とは思えません」と“個人的な印象”の話になっちゃいました。
 で、得意げに「タイプ1エラー」の説明をして、前回とほぼ同じ事を言って、じゃぁもうちょっとましな説明をするのかと思えばこれでこの話は終わりです。やっぱり、「否定の理由を説明せず否定している」だけ。
234.ABO FAN 2008/12/16 01:09
あるいは、FSMさんは、『100個「有意差のある」質問項目があれば、5個ぐらいは本来相関がなくても相関が一見出ちゃう』と言いたいのかもしれません。
確かに、統計学的にはそういうことも言えるでしょう。
しかし、巨大サンプルでは、疑似相関がもっと盛大に出ると考えられるので、これまた妥当とは思えません。
結局、私はFSMさんが何を言いたいのかわかりませんでした。

 ...「確かに、統計学的にはそういうことも言えるでしょう。」って、そんな事「統計学的」には言えません(詳細は当ブログの前の記事や、後から出て来ます)。
 どんな根拠で「有意水準5%で統計やれば、100個質問項目があれば、5個ぐらいは本来相関がなくても相関が一見出ちゃう」事を批判しているのかまだ明確では無いですが、少なくとも『100個「有意差のある」質問項目があれば、5個ぐらいは本来相関がなくても相関が一見出ちゃう』なんていう統計学的にまったく不適切な事に比べれば妥当でしょう。
 なのに、ABOFANクンは前者を批判し、後者を妥当とするわけで、このあたりから「ABOFANクンの統計理解の誤り」が露わになってきます。

 なお、「しかし」以下の文でも「ABOFANクンの統計理解の誤り」が見えます。
  見かけの相関〔spuriouscorrelation〕
2つの変数の実際の相関が低い場合に,第3の変数の影響によって,見かけ上高められた相関のことで,擬似相関と呼ばれることもある.たとえば,身長と体重の相関を4~10歳児の児童のデータを用いて計算すると,年齢という第3の変数の影響によって,見かけの相関は高まる.このような場合,年齢のような第3の変数の影響を除去した偏相関(→偏相関係数)を求めると,見かけの相関は消失する.(新曜杜・統計用語辞典)

 つまり疑似相関とは、比較している2つの変数にはそれぞれ関係が無いのに、両変数に影響する第3の変数の効果により統計上“相関”が強く出るものです。
 書いてあるように“偏相関”を求めるとその影響を除去できますが、もう一つの手法として、第3の変数の効果を相殺するよう満遍なくデータを得る方法があります。ですから、巨大サンプルであるほうが(第3の変数の効果が相殺される可能性が高まるので)むしろ疑似相関が押さえられる可能性が高いとも考えられます。
 まぁ、何はともあれ「疑似相関が盛大に出るか」は、サンプルサイズではなく、第3の変数の存在の有無にあるわけで、「巨大サンプルでは、疑似相関がもっと盛大に出ると考えられる」という考えこそ、妥当とは言えません。

 このように、ABOFANクンは、相手の主張を否定はするものの、その理由を明確にせず、そのくせ「統計的に妥当でない自分の理解」を披露するという、何ともメチャクチャな発言を重ねます。


【しおり1】

239.FSM 2008/12/21 02:05
TAKESANさんのご指摘、その通りです。「相関」と「有意差」の使い分けが適当過ぎでしたね。混乱させてしまってすみません。私が言いたかったのは、本来相関がない場合でも、5%水準であれば、100個のうち5個は有意差が出てしまう(出てしまってもおかしくない)、という意味でした。
で、これは有意水準の概念の基本だと思うのですけれど、どうでしょうか。
もちろん厳密に100個のうち5個、という意味ではないですよ。概念として、5個程度は有意になってもおかしくない、ということです。5個より小さい場合もあるでしょうが、1個にしたければ1%水準で統計やるべきですよね。

 FSMさんは、ABOFANクンが「100個のうち絶対5個」と勝手に読み替えているのでは、と疑念を持ちます。
 まぁ、FSMさんは最初に「5個ぐらいは」と幅を持たせる表現をしているわけですから、それはないはずなのですが、ABOFANクンであれば、そのくらいの強引な解釈をする事はあり得ると言えばあり得ちゃいますね。
240.ABO FAN 2008/12/21 23:12
>>239
> 私が言いたかったのは、本来相関がない場合でも、5%水準であれば、100個のうち5個は有意差が出てしまう(出てしまってもおかしくない)、という意味でした。
ん~、大丈夫なんですかね。
本来相関がない場合なら、何%水準でも、間違いは100%ということですよ。(^^;;
5%水準なら、有意差があった場合でも、本来関係がない場合(つまり間違い)が5%ということになります。
逆に95%は正しいことになります。
> で、これは有意水準の概念の基本だと思うのですけれど、どうでしょうか。
ですので、違いますよ。
> もちろん厳密に100個のうち5個、という意味ではないですよ。概念として、5個程度は有意になってもおかしくない、ということです。5個より小さい場合もあるでしょうが、1個にしたければ1%水準で統計やるべきですよね。
トホホです。
本当にそう思っているなら、次回から議論の仕方を根本から変えようと思います。(T_T)

 「次回から議論の仕方を根本から変えようと思います。」って言ってますが、根本から変える必要があるのは、ABOFANクンの統計の理解であるとしか言えません。

 既に書きましたが、「タイプ1エラー」とは、そもそも「帰無仮説が正しい場合にそれが棄却される(有意差として出る)誤り」です。それこそ、統計の本を読めば、だれでもそのように理解できるように書いてあるはずです。
 それに対して、「本来相関がない場合なら(帰無仮説が正しい場合)、有意水準が何%だろうが、タイプ1エラー(間違い)は100%」と言うのは、もう常人では考えられないような根本的な部分で誤った発言です。

 次も、「有意差のうち5%が誤り」という前のコメントの間違いを引きずっています。
 「逆に95%は正しいことになります。」も、おそらくこの時点でABOFANクンは「有意差が出たうち95%が正しい」と言いたいのだと思いますが、実際は有意水準5%に対する95%と言うのは「実際に相関が無い場合に、有意差が出てしまわない」確率です。

 これはもう、ケアレスミス、という次元ではなく、「根本的な理解」が間違っているから言う事言う事間違っている事が分かります。
 で、間違った事ばかり言うくせに「ん~、大丈夫なんですかね。」とか、「トホホです。」とか、しきりに相手を見下す反応ばかりして見せているのは、傍目には非常に滑稽なのですが、言われている相手にとっては苛立つばかりでしょう。

 そして、統計をある程度正しく理解している人にとっては、ABOFANクンの統計の説明は「おかしい」を通り越して「わけがわからない」ものにしか聞こえません。
241.TAKESAN 2008/12/22 00:09
>>240
▼▼▼引用▼▼▼
本来相関がない場合なら、何%水準でも、間違いは100%ということですよ。(^^;;
5%水準なら、有意差があった場合でも、本来関係がない場合(つまり間違い)が5%ということになります。
逆に95%は正しいことになります。
▲▲引用終了▲▲
まるで意味が解らないので、もう一度説明をどうぞ。
いや、同じ事を、表現を変えながら5回くらい説明してみて下さい。そう言ってしまうくらい意味が解らないです。

243.FSM 2008/12/22 01:36
>>240
> 本来相関がない場合なら、何%水準でも、間違いは100%ということですよ。(^^;;
> 5%水準なら、有意差があった場合でも、本来関係がない場合(つまり間違い)が5%ということになります。
> 逆に95%は正しいことになります。
232のTAKESANさんのコメントに完全に同意です。
いや、完全にじゃないな。「ちょっとよく解らない」じゃなくて、まったく解らないです。(^^;;
私が言ったのは、本来相関がなければ、100個すべてに有意差がないという結果になるとつい思ってしまうのだけれど、5%水準の検定であれば、5個ぐらいは有意差が出てしまっても不思議ではない、ということですが…。つまり95%はちゃんと有意差なし、と出るけれども、5%は相関がないにもかかわらず、有意差あり、と出てしまう、と。
ABO FAN さんも、多分同じことを言っていると思うのですけど?「間違い」の意味がよくわからないので。

しかし、そもそも他人にとって「わけの分からない事」を、自分では正しいと信じ込んでしまえる程の「わけのわからない人」に、「わけが分からない」と言ってみても、まともな答えが返ってくるわけはありません。
252.ABO FAN 2008/12/23 07:56
>>241
有意水準5%で検定を行うということは、タイプ1エラーが5%のはずです。
しかし、本来相関がない場合なら、有意水準が何%だろうが、タイプ1エラー(間違い)は100%ということですよ。
どうも、FSMさんは統計的検定をおわかりになってないようですね。(^^;;

 #234や#240の記述の一部をもう一度書いただけ
 それを読んで「わけのが分からない」と言っている人に対し、それと同じ事を繰り返す意味って何でしょう?
 同じ事でも何度も言えば、そのうち分かってくるとでもいうのでしょうか?
 単に、「わけのが分からない」説明しかできないだけ、という事なのでしょうけどね。

 何を聞かれても「同じ事を繰り返すだけ」。これがABOFANクンのデフォルトのようですね。
 そして、自分はなんら具体的な反論を示していないのに、「相手の能力不足」を決め付けるのもデフォルトのようです。
253.ABO FAN 2008/12/23 08:03
>>243
> 私が言ったのは、本来相関がなければ、100個すべてに有意差がないという結果になるとつい思ってしまうのだけれど、5%水準の検定であれば、5個ぐらいは有意差が出てしまっても不思議ではない、ということですが…。つまり95%はちゃんと有意差なし、と出るけれども、5%は相関がないにもかかわらず、有意差あり、と出てしまう、と。
困りましたね。
TAKESANさんも困っていると想像します。(^^;;
> ABO FAN さんも、多分同じことを言っていると思うのですけど?「間違い」の意味がよくわからないので。
いえ、違います。#252をご覧ください。
あるいは、手元の統計学の教科書を読んでみてください。
今までのFSMさんへの私の説明は、すべてムダになってしまった、といってもいいでしょう。(T_T)

 何故TAKESANさんがFSMさんに困惑しなければならないのかさっぱり分かりません。
 というか、TAKESANさんが困っているのはむしろABOFANクンの発言に対してですよ(#241)。

 で、#252をご覧ください。
 そこに書いてあるのは、FSMさんやTAKESANさんが「わけが分からない」と評する文章の繰り返ししか書いていません。

 おそらくFSMさんは統計の本を調べた上で言っていると思われますし、ABOFANクンの言うような「わけのわからない事」は統計学の教科書には書いてありません。
 つまり、ABOFANクンの返事そのものが“的外れ”なのです。

 こんな事ばかりしていて「今までのFSMさんへの私の説明は」と、あたかも“説明していた”かのように振舞うのはなんなんでしょうね?

 「今までのFSMさんへの私の説明は、すべてムダになってしまった」よりも、「今までのFSMさんへの私の説明なるものは、ムダと間違いの繰り返しだった」の方が現状をより的確に示しているでしょう。


【しおり2】

で、この辺から私が参戦しました。
271.J 2008/12/24 02:24
そして決定的なこと
「基礎たるタイプ1エラーすらキチンと理解していない」のも判明。
しっかりネタにさせていただきます。
現在執筆中。
言い訳するなら今のうち。

まぁ、宣戦布告ですね。
で、どんな反応が返ってきたかと言うと...
274.ABO FAN 2008/12/24 02:57
> 「基礎たるタイプ1エラーすらキチンと理解していない」
タイプ2エラーの話をしているつもりなのですが?
なぜタイプ1エラーの話になるなかわかりません。

これには私もびっくり。
一週間ほど前、自分から「タイプ1エラー」の単語を持ち出した事はおろか、前日の朝にもタイプ1エラーの話をした事すら忘れているようです。
これは、傍目にもびっくりだったようです。
278.TAKESAN 2008/12/24 03:31
▼▼▼引用▼▼▼
タイプ2エラーの話をしているつもりなのですが?
なぜタイプ1エラーの話になるなかわかりません。
▲▲引用終了▲▲
これはすごいです。
Jさん、これはすごいですよ。

279.TAKESAN 2008/12/24 03:32
これは、ポルナレフのAAを貼ってしまいそうになるレベル。

コレに対する返事...。
282.ABO FAN 2008/12/24 21:55
本当は差があるのに、差がないと言いたい人がいるようですので…。(^^;;

「そのような人がいるとABOFANクンが感じている事」が、「自分から言っていたことを、言っていないことにする事」の関係がさっぱり見えません。
 自分で引き起こした状況を、自分で把握する能力が無いようです。
 
 TAKESANさんに答えて、私のコメント。
286.J 2008/12/25 00:08
あ…ありのまま 今 起こった事を話すぞ!
『”タイプ1エラー”の単語を用いた話をさんざんしていた人を批判しようとしたら
 ”なぜタイプ1エラーの話になるなかわかりません”と言われてしまった』
な… 何を言ってるのか わからねーと思うが
おれも何を言われたのかわからなかった…
頭がどうにかなりそうだった…
詭弁だとか強弁だとか
そんなチャチなもんじゃあ 断じてねえ
もっと恐ろしいものの片鱗を味わったぜ…
...おまけに「なるなか」だ。
単なるキータッチミスだろうが
テンパッタ雰囲気が出すぎてて怖い。

例のアレですね

コレに対する返事...。
291.ABO FAN 2008/12/25 02:22
>>286
確かに、誤解されやすい文章ですね。(^^;;
これ以上、どうのこうの言っても、ますます誤解が拡大すると思われますので、申し訳ありませんが撤回します。m(._.)m

 問題発言をした事をどれだけ正確に理解しているかどうかは知りませんが、とにかくまずいと思ったのか撤回します(ちなみに、私はABOFANクンの事を「よほどバカにされないと、自分がバカである可能性を考えすらしない人」だと思いながら対処しています)。

 ただ、言い訳がまた姑息ですね。「誤解されやすい文章」だって。
 あたかも、「適切な事を言ったつもりだけと、伝わらなかった」と言いたいようです。
 そんな風に言うのだったら、むしろ、撤回しなくていいから、どんな「正解」の読み方があるのか教えて欲しい。それができなければ、あの狂ったようにしか聞こえない受け答えについて「誤解」も何もないだろうに。

 そもそも言った当人すら「どうのこうの言っても、ますます誤解が拡大する」と匙を投げるのであるから、「根本的におかしい発言だった」と認めざるを得ないでしょう。

 まぁ、ABOFANクンの狂った発言をよそに、FSMさんは元の話を続けます。
318.FSM 2008/12/26 01:50
>>252
> 有意水準5%で検定を行うということは、タイプ1エラーが5%のはずです。
> しかし、本来相関がない場合なら、有意水準が何%だろうが、タイプ1エラー(間違い)は100%ということですよ。
> どうも、FSMさんは統計的検定をおわかりになってないようですね。(^^;;

よくわからないので、言葉の意味を明確にしていただけませんか?
母集団に差がなくても、標本には差が有意に出てしまう確率が5%ではないのでしょうか?
「間違い」が100%というのは、どういう間違いが、何に対して100%なのですか?

さてその答えは...
335.ABO FAN 2008/12/26 22:35
>>318
> 母集団に差がなくても、標本には差が有意に出てしまう確率が5%ではないのでしょうか?
有意水準5%で検定を行い、有意差が出たとした場合、本当は母集団に差がない確率(タイプ1エラー)が5%です。
従って、
・有意水準5%で検定を行い「母集団に差がなくても、標本には差が有意に出てしまう確率が5%」
ではなく、
・有意水準5%で検定を行い、有意差が出たとした場合、「母集団に差がなくても、標本には差が有意に出てしまう確率が5%」
です。
FSMさんが知っていて言っているのか、あるいは知らないのかわかりませんが、これでは読者が混乱すると思いますが。
> 「間違い」が100%というのは、どういう間違いが、何に対して100%なのですか?
ですので、有意差が出たとした場合、その有意差が出た結果はすべて間違っていることになります。要するに、その結果は100%間違っていることになります。
ひょっして、わかっていてワザと言ってました?(苦笑)
私も、こんなことは説明したくないので、もう少し考えて発言していただければ、と思います。
どうかよろしくお願いします。

 まず、冒頭の2例については、本当はABOFANクンが否定した方が妥当な説明で、ABOFANクンが肯定した方がまるっきり間違った説明です。
 FSMさんはおそらく知っていて正しい事を言っています。TAKESANさんも多分正しく知っているでしょうし、私も知っています。
 読者を混乱させているのは、ただ1人、間違った事を肯定し、正しい事を否定するABOFANクンですね。

 「本来相関がない場合なら、有意水準が何%だろうが、タイプ1エラー(間違い)は100%」発言についての説明もこれまた意味不明。「間違い判定のうち、間違い判定は100%」って事ですかね。トートロジーとすら言いたくない、愚劣な考え方です。根本的に間違った事をいくら説明しようとしても、訳の分からない事しか言えないという事を示しているだけでしょう。

 「ひょっして、わかっていてワザと言ってました?」って、ひょっとしても何も、そんな風に「わかっている」のはABOFANクンだけなのにね。
 「私も、こんなことは説明したくないので、もう少し考えて発言していただければ、と思います。」と偉そうに言っていますが、こっちとしては間違った説明ばかりを繰り返し聞きたくないので、まず根本的な部分をもっともっとよーく考えてから発言していただければ、と強く思いますとしか言えません...・
338.FSM 2008/12/26 23:12
>>335
> > 母集団に差がなくても、標本には差が有意に出てしまう確率が5%ではないのでしょうか?
> 有意水準5%で検定を行い、有意差が出たとした場合、本当は母集団に差がない確率(タイプ1エラー)が5%です。
> 従って、
> ・有意水準5%で検定を行い「母集団に差がなくても、標本には差が有意に出てしまう確率が5%」
> ではなく、
> ・有意水準5%で検定を行い、有意差が出たとした場合、「母集団に差がなくても、標本には差が有意に出てしまう確率が5%」
> です。
> FSMさんが知っていて言っているのか、あるいは知らないのかわかりませんが、これでは読者が混乱すると思いますが。
細かいなあ。(^^;;
だから、項目が100個あったら、5個は有意差が出てもおかしくないわけでしょ?
あ、当然ながら、項目はそれぞれ独立だという仮定が入りますが。

> > 「間違い」が100%というのは、どういう間違いが、何に対して100%なのですか?
> ですので、有意差が出たとした場合、その有意差が出た結果はすべて間違っていることになります。要するに、その結果は100%間違っていることになります。
はいはい、言いたいことはわかりました。
間違ってるものが間違ってる割合は100%ってことですね。そりゃそうだ。ってそんな自明なことわざわざ聞きませんよ。(^^;;

> ひょっして、わかっていてワザと言ってました?(苦笑)
> 私も、こんなことは説明したくないので、もう少し考えて発言していただければ、と思います。
> どうかよろしくお願いします。
うーん、常識の範囲で適当に補って聞いてほしいんですけどねえ。どうかよろしくお願いします。

FSMさんは、まだABOFANクンの奇矯さを十分に理解していないのでしょう。
まだ「自分の表現が悪かったのかな」と心配しています。

まさか、偉そうに人の統計理解を見下す人が、全く見当外れの統計理解を元に批判しているなんて、普通の人には予測できませんものね。

でも、さすが直接対決経験豊富なTAKESANさんは、分かっていますね。
341.TAKESAN 2008/12/26 23:30
>>335
本当に第一種の過誤の意味が解ってるんですか?



【しおり3】

 さて、FSMさんの#338に対する返事です。
347.ABO FAN 2008/12/27 00:09
> どれを撤回されるのかよくわかりませんが、(^^;;
> タイプ2エラーの話はなかったことにする、ということですかね?
はい、タイプ2エラーの話はなかったことにする、そういうことです。
大変申し訳ありません。m(._.)m

実際は他にも撤回すべき事は山ほどありますが...
352.ABO FAN 2008/12/27 00:28
>>338
> 細かいなあ。(^^;;
すみません。
数々の議論で懲りてますからね。(^^;;
念には念を入れて…と。

> だから、項目が100個あったら、5個は有意差が出てもおかしくないわけでしょ?
> あ、当然ながら、項目はそれぞれ独立だという仮定が入りますが。
本当にわかっているのでしょうか?
少々不安です。
有意差の有無を無視して、任意の100項目を選択した場合、「5個は有意差が出てもおかしくない」のではありませんよ。
しつこいようですが、有意差の出ている任意の100項目を選択した場合、「5個は誤って有意差が出ていていてもおかしくない」ということです。
念のため。

 はい、同じ間違いを繰り返すだけですね。
 間違っている人が「本当にわかっているのでしょうか?」という何ともおかしな状況です(もしかして、間違った事を信じさせるための洗脳?)。
 「念のため」と言うのであれば、まず「念のため」自分の理解が正しいか確かめて欲しいものです。

さて、ABOFANクンを分かっているTAKESANさんの反応。
353.TAKESAN 2008/12/27 00:29

いや、ABO FANさんがαエラーを知らない、という話です。 あ、間違った。
ABO FANさんはαエラーも知らない、でした。
こりゃ失敬。
r もρも知らないしなあ。帰無仮説も検定も知らないし。
こまつたこまつた。
出典:ABO FAN氏のコメント群
だって、間違いが100%とか……笑いが堪え切れない…。

それに対するABOFANクンの負け惜しみ。
357.ABO FAN 2008/12/27 00:54
単なる独り言です。
>>351 >>353 >>355 >>356
は反論ではなくて感想なんでしょうね、たぶん。

それに対するTAKESANさんの追い打ち。
367.TAKESAN 2008/12/27 01:05
>>357
あんまり笑わせないで下さいよ……疲れてしまうではありませんか。
反論っていうのは、反論する価値があるだけの論理構成がなされていないと出来ない訳ですな。

反論じゃ無くて、間違っている所を書いているだけですよ。
反論されたいなら、まともな事書いて下さいな(笑)
>>352
▼▼▼引用▼▼▼
有意差の有無を無視して、任意の100項目を選択した場合、「5個は有意差が出てもおかしくない」のではありませんよ。
しつこいようですが、有意差の出ている任意の100項目を選択した場合、「5個は誤って有意差が出ていていてもおかしくない」ということです。
念のため。
▲▲引用終了▲▲
これは松田優作AAを貼ってしまいそうになるレベル。
FSMさんの文章を何百回か読み直……ああ、やっぱいいです。

さて、そう言われたABOFANクンは...
387.ABO FAN 2008/12/28 09:37
>>367
> 反論じゃ無くて、間違っている所を書いているだけですよ。
そうですか…。
具体的にどこが間違っていると書いてないので、申し訳ありませんが私には理解できません。
では、特に返事は不要と判断させていただきす。

 出ました、いつものアレ。
 少なくとも、TAKESANさんは「間違っている」所を指定しています(ただ、ABOFANクンはそれが正しいと信じているから分からないだけ)。

 「でも、どんな風に間違っているか言及していないじゃないか」と頬を膨らませるかもしれません。まぁ、私だったらそこまでしますが、ABOFANクンにはそれを言う資格はありません。

 #210を読み返してみよう。
 “「有意水準5%で統計やれば、100個質問項目があれば、5個ぐらいは本来相関がなくても相関が一見出ちゃう」というのはウソとは言えなくとも、正しいとは言えません。この点だけは、TAKESANも完全に私に同意してもらえると思います。あるいは、文章を単純化しすぎたといことですかね? 次回の訂正をお待ちしています。”

 ABOFANクンだって、自分が間違っていると思う所を指定するだけで、どんな風に間違っているか言及していません。それでいて、「訂正」を要求しています。
 自分では同じ事を当然のようにしているのに、他の人にされると勝手に「返事は不要と判断する」のは、何ともご都合主義でありますね。


【しおり4】

ところで、FSMさんも、ようやく事の深刻さを受け入れられたようです。
368.FSM 2008/12/27 01:16
>>352
> 有意差の有無を無視して、任意の100項目を選択した場合、「5個は有意差が出てもおかしくない」のではありませんよ。
> しつこいようですが、有意差の出ている任意の100項目を選択した場合、「5個は誤って有意差が出ていていてもおかしくない」ということです。
> 念のため。
え?えええ???ええとどうしたらいいのでしょう>みなさん
ABO FANさんと同じことを言っていると思っていたのですが…。
ここに1枚のコインがあります。投げて表と裏が出る確率は丁度0.5づつのものです。本当に0.5づつか検定しましょう…ありゃ、5回続けて表が出ちゃった。0.5づつとすると、5回続けて表が出る確率は1/32<0.05。0.5づつという帰無仮説は有意水準5%で棄却されました!つまりこのコインは表と裏が出る確率が0.5づつじゃありません!…あれ?
考えてみてください>ABO FANさん
このコメントへの返事は(私は)不要です。考えてさえいただければ。
# なんかこう断言されると、自分に対してものすごく不安になってしまうんですが。(^^;;

 さてさて、12/24に宣戦布告してから、一週間もたたないうちに、ABOFANクンの間違いがどんどんあからさまになってしまい、このままでは出る幕が無くなると急いで私もブログの記事を書き上げます。
376.J 2008/12/28 02:48
 とりあえず暫定版ながら、“正しい”「タイプⅠエラー」の解説書きました。
http://naked-kings.blog.so-net.ne.jp/2008-12-28
 これ以上恥かきながら場を荒らす前に、読みなさい。
 で、疑問、反論あれば、私のブログのコメント欄へ。
 まともな反論ができるまでは、ここで偉そうに統計を語るな。
 ついでに、統計も満足に理解しないで、データ、データ言うな。



【しおり5】

まずは、ABOFANクンのFSMさんへの回答
388.ABO FAN 2008/12/28 09:46
>>368
> ここに1枚のコインがあります。投げて表と裏が出る確率は丁度0.5づつのものです。本当に0.5づつか検定しましょう…ありゃ、5回続けて表が出ちゃった。0.5づつとすると、5回続けて表が出る確率は1/32<0.05。0.5づつという帰無仮説は有意水準5%で棄却されました!つまりこのコインは表と裏が出る確率が0.5づつじゃありません!…あれ?
> 考えてみてください>ABO FANさん
> このコメントへの返事は(私は)不要です。考えてさえいただければ。

う~ん、そういう前提で考えていたのですか…。
返事は不要と言うことですが、私の考えを理解していただくために一応書いておきます。

まず、大前提として、統計学は「補助科学」ということがあります。
「血液型と性格」では、心理学の補助科学です。
ですので、データに適した統計的(検定)方法を考える必要があります。

FSMさんは、「コイン」についての考え方が、そのまま「血液型と性格」に当てはまる、と考えているようですが、私は違います。
ですので、お答えしようがありません。
強いてお答えするなら、#377にもあるように、コインの裏表が出るかどうか4回試行して、それを更に100回行ったというイメージです。
この場合、いずれも帰無仮説は棄却できません。
そういうことです。

 「返答は不要」と言われているのに「返答する」。
 そのくせ、結論は「お答えしようがない」。だけど、何故か「強いて答える」。
 もうグダグダです。

 とりあえず、ロジックを見てみましょう

>まず、大前提として、統計学は「補助科学」ということがあります。

 はぁ、まず「統計学」=「補助科学」ね

>「血液型と性格」では、心理学の補助科学です。

 「統計学」=「補助科学」だから、これはこうなるよね
 『「血液型と性格」では、心理学の統計学です。』
 ???

>ですので、データに適した統計的(検定)方法を考える必要があります。

 意味が分からないロジックの上で、「ですので」と言われても...

 そもそも、「データに適した統計的(検定)方法を考える」とありますが、「そのデータに適した検定は何がいいか考える」という意味ではその通りでしょう(ただし、この人の場合勝手に新たな方法を考え出しちゃいそうで怖いけど)。ただ、そういう考え方は統計においては“普通”なんですね。わざわざ「補助科学」という用語を持ち出す必要が無いわけ。

 だから、まずここで「補助科学」の言葉を“わざわざ持ち出す”必要がまるで見えない。
 実は、私がABOFANクンのHPでやり取りをしていた時も、突然「補助科学」という言葉を使ってきたから、その意味を追求した事があるんだけど、その意味を聞いても曖昧な返事しかせず、最終的には「手元の統計学の入門書に書いてあったから使ってみただけで、他意はありません。」という、なんとも酷い回答でした。
 結局「難しそうな言葉を使って、自分の主張を高等に見えるよう装う。でも、その言葉の意味については、実は人に説明できるほど理解できてないし詳しく書くとボロが出そうなので、書かない。」だけ、ここでの用法も、きっと同じなんでしょうね(しかし、ロジックが崩壊している大失敗例)。

>FSMさんは、「コイン」についての考え方が、そのまま「血液型と性格」に当てはまる、
>と考えているようですが、私は違います。

 いや、別にFSMさんは、2項分布を「血液型と性格」に当てはめようとしているのではなく、ABOFANクンが統計についてあまりにもおかしな事を言うから、統計の原理を知っているか確認するために、タイプ1エラーを理解するための一番分かりやすいモデルを提示しているだけしょう。

 というか、そこまで警戒して「直接答える」のを拒否する理由が分からない。
 今まで散々「タイプ1エラー」をネタにFSMさんを「統計が分からない」とコケにしておいて、統計における「タイプ1エラー」の理解を確かめる問いを出されたとたん、「血液型と性格」を勝手に持ち出して、あたかもFSMさんの問いが不適切のように扱おうとするのだろうね?

ちなみに
>#377にもあるように
とあるので、念のため#377を見てみよう。

377.ABO FAN 2008/12/28 08:17
>>351
サンプルが少ないから差が出ないだけ、というのはタブーなんですかね?
そうとは思えませんが…。
----
476. ABO FAN — November 13, 2007 @23:37:56
> 470. ちがやまる — November 13, 2007 @19:17:34
お手数をおかけします。
> A型 はい 4104名(32.9%) いいえ 8362名(67.1%) 計 12466名
> B型 はい 2589名(37.8%) いいえ 4263名(62.2%) 計 6852名
> こうですね。Yatesの連続補正を使ったカイ2乗値が報告されていて、
> p<0.0001ということです。このまま全体を1/10に縮小して対象者数約2000名になるとp=0.0342になります。p=0.05になるのは対象者数約1500名あたりからです。
ありがとうございます。
では、(決して大きいとは言えないが)血液型によりデータに差があると考えていいですね?
> A型とB型で比べて(本人に尋ねた時)いちばん違いの大きく出ている質問でさえ、偶然というバックグラウンドから違いが浮かび上がるのは1500名も集めた場合である、という結果なんですね。
坂元データではおっしゃるとおりです。
従って、松井データで差が出ないのは、サンプルが少ないせいだ、ということなります。
つまり、松井データの松井さん自身の分析結果(統計的に有意な差がない)は間違いだ、ということになります。

 何か「古い証文持ち出して」って感じです(まぁ、証文にもなってないのですが)。
 この話もいろいろ突っ込みどころはあるのですが、そもそもちがやまるさんのこの話は、「効果量が小さい場合、それをサンプリング誤差と弁別するのは困難」という話でしょう。
 つまり、「帰無仮説が間違っている場合にそれが棄却されない(有意差が出ない)誤り」いわゆる「タイプ2エラー」の話なんですね。

 一方で、FSMさんは「投げて表と裏が出る確率は丁度0.5づつのものです」という前提を上げていて、明らかに「帰無仮説が正しい場合」における「タイプ1エラー」の問題を出しているわけです。

 「タイプ1エラー」の問いに対して、「タイプ2エラー」で答える、このちぐはぐさは、決して「強いてのお答え」ではなく、「答えになっていない」が正解です。

 さらに言えば、「#377にもあるように」と言っていますが、#377は「効果量が小さい場合、サンプルサイズを大きくする必要がある」という話。
 また、実際に#388で上げたABOFANクンの例は「コインの裏表が出るかどうか4回試行して、それを更に100回行ったというイメージ」といった、“そもそも原理的に5%水準の有意差が出るのは不可能”なケース。これは、後からコメントしているけど、最初からその水準で検定が出来ない事が分かっているのだから、その検定は無意味。そのような無意味な検定を繰り返す状況を想定する時点で無茶苦茶。

 ここで明らかな問題点。
・「タイプ1エラー」の問題に「タイプ2エラー」の話を参照する
・「#377にもあるように」と言いつつ、#377とは全く意味が違う例を持ち出す
・その例がそもそも「検定」の意味がない事が明らかな不適切な設定
 この3つが絡み合う訳の分からない事が、ABOFANクンにとって「理解して欲しい私の考え」なのだそうだ。

 なんて言っていいのかなぁ...

 バカの度合いを測れるスカウターがあるとして、それが“ボゥン”と壊れる感じ。
 
 分かったのは、全体的に正しい主張のうち1点が間違っている場合、それを正確に指摘するのは楽だけど、すみからすみまで間違った主張の事を正確に指摘するのは結構大変だ、と言う事。
 まさか、それがABOFANクンの作戦じゃ...

 ちなみに、#388に対するTAKESANさんの反応。
400.TAKESAN 2008/12/28 11:50
>>388
完全に意味が解りません。
もう一度説明をどうぞ。
他にも私と同じ思いの方はいらっしゃる事でしょう。

「完全に意味が解りません」は激しく同意。
ただ、私はもう彼の正常な対応は針の先ほども期待できないので、「もう一度の説明」はいらない。


【しおり6】

ところで、私が#376で「反論してみろ」と挑発したこのブログの記事に対する反応はと言うと...
393.ABO FAN 2008/12/28 10:23
>>376
お手数ですが、#388をご覧ください。

 はぁ?
 ブログの記事の言及は一切無しで、#388を読めという。
 でも、先に書いたように#388は、「タイプ1エラー」とは関係のない話。
 的外れな回答は、さては読んでないな。
 しかし、自分は「相手の主張を読む」という手数をかけないくせに、相手には平気で「お手数」を要求するのね。しかも、的外れだから「徒労」だし…
 と言う事で、そんなABOFANクンの心情をズバリ当てて見せて、挑発してみます。
394.J 2008/12/28 10:31
>>393
わーい、やっぱり都合の悪いコメントはスルーだ(笑)
ちょっと考えて分からなくて
でも認めるとまずそうなのは
相手の言っている事は全く無視して
「それっぽい事を書いてある自分のコメント」
(でも的外れ)を指示して「返事したフリ」なんですねぇ
人が読めと言うのは読まないで
自分の(ダメな)主張だけ読ませようとする
ここまでくると
何が何でも「正しい理解」を拒否せざるを得ないようですね
悲しいねぇ...

それに対し...
432.ABO FAN 2008/12/29 14:15
>>394
では、もう一度書いておくことにします。
コインの裏表が出るかどうか4回試行して、それを更に100回行ったというイメージです。 この場合、いずれも危険率5%では帰無仮説は棄却できません。
そういうことです。
仮に、表裏の出る確率に差があったとしても、すべてタイプ1エラーになります。(^^;;
よろしいでしょうか?

ついでに、上の説明についても、特に誰も触れてませんので、これまた都合が悪いということでよろしいでしょうか?

#正直、そうとは思えませんが…。

一つ目
だ・か・ら、返答としておかしいと言われた事を、そのまま「繰り返して」何の意味があるの?
二つ目
「上の説明についても、特に誰も触れてませんので」って、#400でTAKESANさんが「完全に意味が解りません。もう一度説明をどうぞ。」と言っているのですが、これでも「誰も触れていない」事になるの?

ちなみに「触れていた」TAKESANさんへの返答。
433.ABO FAN 2008/12/29 14:21
>>400
わかりやすいように、FSMさんの文章をそのまま使わせていただきます。
ご了承ください>FSMさん

ここに1枚のコインがあります。投げて表と裏が出る確率は丁度0.5づつのものです。本当に0.5づつか検定しましょう…ありゃ、4回続けて表が出ちゃった。0.5づつとすると、4回続けて表が出る確率は1/16>0.05。0.5づつという帰無仮説は有意水準5%で棄却できません!つまりこのコインは表と裏が出る確率が0.5づつです!…あれ?

#仮に、表裏の出る確率に差があったとしても、すべてタイプ1エラーになってしまいます。(^^;;

 「そのままじゃないじゃん!」というつっこみはおいておいて
 まず、根本的に、このケースには検定の意味がないという問題は相変わらずです。
 そして、ここまで来ると、自分でも何を言いたいのか分かっていないのでしょうね。
 「投げて表と裏が出る確率は丁度0.5づつのもの」という前提があって、それを確かめた結果「つまりこのコインは表と裏が出る確率が0.5づつ」という「正しい」結果が出たのに「あれ」って。
 
 この人、他人の口調を真似したがるのに、変に的外れなんですよね。
 単純に、「表と裏が出る確率は丁度0.5づつのコインを投げたとして、4回だけ投げた場合、最も偏った“全て表”であっても、有意水準5%で棄却できません。だからこのような場合、有意水準5%を設けてもタイプ1エラーが発生する確率は0です」と言えば少しは分かりやすいのに。
(まぁ、分かりやすく説明しても、それが「検定の意味がない」事は変わりませんが)

しかも、間違ってますね。すぐ気付くけど
434.ABO FAN 2008/12/29 14:25
>>433
すみません、タイプ1エラーではなく、タイプ2エラーの間違いです。
逆に、タイプ1エラーはゼロです。なにしろ「有意でない」のですから…。(^^;;

 まぁ、これはケアレスミスといってもいいかもしれませんが、#274の「タイプ2エラーの話をしているつもりなのですが?なぜタイプ1エラーの話になるなかわかりません。」を思い返すと、マジで混同している疑念も出てきますね。
 また、どうでもいい事なんですが、突っ込みどころが一つありますが、それは後ほどのTAKESANさんの発言で。

(ちなみに、#433も同様に間違っているんですが、それは訂正しないのカナ?)
(2回続けて、うっかり間違うものかなぁ)


ところで、ABOFANクンの深刻さに気付いたFSMさんが、それでも意志の疎通を頑張ります。
406.FSM 2008/12/29 00:54
>>388
> FSMさんは、「コイン」についての考え方が、そのまま「血液型と性格」に当てはまる、と考えているようですが、私は違います。
> ですので、お答えしようがありません。
> 強いてお答えするなら、#377にもあるように、コインの裏表が出るかどうか4回試行して、それを更に100回行ったというイメージです。
> この場合、いずれも帰無仮説は棄却できません。
> そういうことです。

だったら、血液型と性格の関係は証明できない、根拠がない、と主張されたいのですか?4回試行で5%水準で統計やってるようなもの、と言いたいわけですよね。
# 普通はそれでも何か言いたければ、1σでどうとか言うと思いますが。

コインでなくてもいいのですよ。たとえばA型とO型の人がそれぞれ1億人ずついる国があって、5人をランダムにピックアップする場合でもいいのです。

でも、それは徒労に終わるようです。
436.ABO FAN 2008/12/29 14:42
>>406
> だったら、血液型と性格の関係は証明できない、根拠がない、と主張されたいのですか?4回試行で5%水準で統計やってるようなもの、と言いたいわけですよね。
> # 普通はそれでも何か言いたければ、1σでどうとか言うと思いますが。

どうも誤解されているようですね。
私が言いたいのは、適切なサンプルサイズでなければ、仮に差があっても有意差が検出されない、ということです。
したがって、危険率5%だからといって、必ずしも5%ぐらい間違うとは言えません。
よろしいでしょうか?

余談ですが、「 1σでどうとか」であれば、松井さんの「差がない」結論は覆されるでしょう。
というのは、計算すると、あのデータでは4回とも同じ傾向が出るとは限らないからです。
「差がある」とした方が、現実のデータをうまく説明できるので。

> コインでなくてもいいのですよ。たとえばA型とO型の人がそれぞれ1億人ずついる国があって、5人をランダムにピックアップする場合でもいいのです。

すみません、もう少し具体例に書いていただけないと、なんとも…。

 誤解も何も、なんで「仮に差があっても有意差が検出されない」というタイプ2エラーの話と、「危険率5%だからといって、必ずしも5%ぐらい間違うとは言えません。」というタイプ1エラーの話を「したがって」で繋げるのでしょうね。

 「計算すると、あのデータでは4回とも同じ傾向が出るとは限らない」のであれば、再現性に難有りで、「差がない」結論は覆されないでしょうねぇ。また、そういうのは、科学的には「差がない」とした方が、現実のデータをうまく説明できると言えるでしょうね。

 何故この人は、平気で科学的な判断と逆の事を言えるのかさっぱり分からない。

 FSMさんは、「コインと血液型は違う」と言われたから、「じゃぁ血液型で」と言ってくれていて、また検定の仕組みを考える上では十分な状況設定なのに、何故か拒絶するんですね。
 しかも、「もう少し具体例に書いていただけないと」って、もう少し日本語としてまともに書いていただけないと、なんとも...。


【しおり7】

再びTAKESANさんの突っ込み
440.TAKESAN 2008/12/29 14:56
>>434
▼▼▼引用▼▼▼
逆に、タイプ1エラーはゼロです。なにしろ「有意でない」のですから…。(^^;;
▲▲引用終了▲▲
皆さん、かなり決定的なのがきましたよ。

 TAKESANが指摘したい意図とは違うかもしれませんが、この人、ちょっと前まで
 「本来相関がない場合なら、有意水準が何%だろうが、タイプ1エラー(間違い)は100%ということですよ。」と言っていたのですよねぇ。ゼロと100%は大違いですが、なんでこの人正反対の事を平気で言えるのでしょう。
441.TAKESAN 2008/12/29 14:57
>>436
▼▼▼引用▼▼▼
したがって、危険率5%だからといって、必ずしも5%ぐらい間違うとは言えません。
よろしいでしょうか?
▲▲引用終了▲▲
危険率の意味を調べるように。

ホントホント。
 ABOFANクンは絶対調べていないと思う。
 万一調べていたとしたら、調べているにもかかわらず、あえて間違った理解をしている事になるから、もっと悪い。

それに対するABOFANクンの逃げ腰。
465.ABO FAN 2008/12/29 16:54
TAKESANさんへ
「間違い」のご指摘をありがとうございます。
ところで、今までの経験では、私が答えても特に反応はないようです。
また、どこがどう間違っているかの指摘ないケースが多いので、そういう場合はお答えしようがありません。
さて、いくつか私宛の質問もあるようですが、私が質問してもお答えがないようので、相互主義により今回はお答えしません。
どうかよろしくお願いします。
なお、以下の#390は本当の相関ではないという意味で「疑似相関」を使っています。
> 母集団に複数のグループがあり、それぞれのグループで「血液型と性格」について、ρ= 0と仮定します。
> しかし、母集団ごとの比較では、血液型分布も性格も違っているものとします。
> この場合、サンプルサイズを大きくしてrを検定すれば、必ず「疑似相関」が現れます。
とにかく「見かけ上の相関」が現れるということでいいですね?
#特にお答えは期待していません。

 「相互主義」とは便利な言葉。
 今までABOFANクンの質問に答えまくってきた私は、残念ながらその「相互主義」とやらの恩恵に預かった記憶は殆どありません(いま、どのくらいストック溜まっているのかしらん)。
 相手によって都合の良いように主義を変えるのでしょうね。
 ついでに、やっぱりこの人「疑似相関」を間違って捉えているんだろうなぁ。
 サンプルサイズを大きくすれば、「必ず」疑似相関が現れるんだから。
 
 「本当の相関ではないという意味で」と曖昧な意味付けで、しかも「とにかく」と性急に結論に急ぐ、これではいつまでたっても間違いには気付かないでしょう。
466.TAKESAN 2008/12/29 17:40
>>465
別に回答は求めてませんて。間違っているのが解っているので、回答なんか要らないし。
「本当の相関ではない」という意味も説明出来ないだろうし。

再びFSMさんの根気強い説明
470.FSM 2008/12/29 22:55
>>433
> ここに1枚のコインがあります。投げて表と裏が出る確率は丁度0.5づつのものです。本当に0.5づつか検定しましょう…ありゃ、4回続けて表が出ちゃった。0.5づつとすると、4回続けて表が出る確率は1/16>0.05。0.5づつという帰無仮説は有意水準5%で棄却できません!つまりこのコインは表と裏が出る確率が0.5づつです!…あれ?
> #仮に、表裏の出る確率に差があったとしても、すべてタイプ1エラーになってしまいます。(^^;;
>>434
> すみません、タイプ1エラーではなく、タイプ2エラーの間違いです。
> 逆に、タイプ1エラーはゼロです。なにしろ「有意でない」のですから…。(^^;;

まず、4回の試行ではおっしゃるとおり有意水準5%を設定してしまうと帰無仮説を原理的に棄却できません。だから、0.5づつ、という結論でいいのです。「あれ?」ではありません。「よし!」です。なぜなら、0.5づつという帰無仮説の検定をしているからです。

帰無仮説をそう取る以上、有意水準を5%に設定したのがそもそもの間違いです。10%にでもすればいいのです。もちろん、その程度(10%でしか物を言えない)の結論、ということになりますが。

次に、いまは母集団に差がない場合、4回(ないし5回)の試行で母集団に差がないという結論を導き出せるのか、という話をしています(そもそもそういう話だったのですが、憶えてます?)。ですから、そもそもタイプ2エラーの話はしていません。「母集団に差がない」という結果がわかっている時に、ちゃんとそれを導けるか、あるいは差があると誤って結論してしまう可能性はどれだけあるのか、という話をしています。
 つまり、血液型で本当は差がないとしたら、間違えて差が有意だとしてしまう確率はどれくらいか、という話です。

最後に、(上に書いたことと重複しますが)4回の試行で有意水準5%に設定したら、タイプ1エラーはゼロです。やる前からわかります。タイプ1エラーがゼロということは、帰無仮説を原理的に棄却できないということです。わかりますか?

>帰無仮説をそう取る以上、有意水準を5%に設定したのがそもそもの間違いです。
>やる前からわかります。タイプ1エラーがゼロということは、帰無仮説を原理的に棄却できないということです。
 FSMさんも分かってらっしゃる。

 ABOFANクンは、検定に対する自分の主張が正しい事を示すために、検定をかけるべきではない誤った事例を持ち出している、というわけです。

 しかし、ABOFANクンの思考回路は(そんな回路があるのかも怪しいのですが)、そういう「自分の問題」をすぐ他に転化しようとします。
487.ABO FAN 2008/12/30 00:15
>>470
> 帰無仮説をそう取る以上、有意水準を5%に設定したのがそもそもの間違いです。10%にでもすればいいのです。もちろん、その程度(10%でしか物を言えない)の結論、ということになりますが。

まさしくそのとおりです。
心理学の調査では、「有意水準を5%に設定したのがそもそもの間違い」というケースが多いのです。
私の言いたいのはそういうことです。
具体的には、100人程度のサンプルのχ2検定をを想定しています。
そういうデータで「差がない」と結論づけているのが大半のケースです。
つまり、これら調査の結論は妥当とは言えません。

 FSMさんは、ちゃんと「血液型で本当は差がないとしたら、間違えて差が有意だとしてしまう確率はどれくらいか、という話」であると言っているにもかかわらず、そういうのは一切無視した話は続きます...


【しおり8】

519.J 2008/12/31 01:11
>コインの裏表が出るかどうか4回試行して、それを更に100回行ったというイメージです。
>この場合、いずれも危険率5%では帰無仮説は棄却できません。
>そういうことです。
>仮に、表裏の出る確率に差があったとしても、すべてタイプ1エラーになります。(^^;;

 まず、指摘される前に気付いたようだけど、「タイプ1エラー」と「タイプ2エラー」間違っているよねぇ。まぁケアレスミスとも思ったけど、ちょっと待って。
「基礎たるタイプ1エラーすらキチンと理解していない」 という私に対し
>タイプ2エラーの話をしているつもりなのですが?
>なぜタイプ1エラーの話になるなかわかりません。
とトチ狂った発言をしましたが、#291でさしたる弁解もせず、勝手に撤回したんだよね。  で、何でまた「タイプ2エラー」の話するの?

 さらに言えば、FSMさんとは「タイプ1エラー」の話していたんだよね。
 そして、私も「タイプ1エラー」の間違いを指摘したんだよね。
 で、な・ん・で「タイプ2エラー」の話をするの?
 頭大丈夫?

>すみません、タイプ1エラーではなく、タイプ2エラーの間違いです。
>逆に、タイプ1エラーはゼロです。なにしろ「有意でない」のですから…。(^^;;

と軽く言ってますが
「タイプ2エラー」を「タイプ1エラー」としたミスは挽回できるかもしれないけど
「タイプ1エラー」の話をしている人に、堂々と「タイプ2エラー」の話を投げかける狂った対話能力というより重大なミスが生じていますよ。

520.J 2008/12/31 01:13
というか、いきなり話し変えたでしょ。
ついこないだまで、「タイプ1エラー」を、『有意差の有無を無視して、任意の100項目を選択した場合、「5個は有意差が出てもおかしくない」のではありませんよ。しつこいようですが、有意差の出て いる任意の100項目を選択した場合、「5個は誤って有意差が出ていていてもおかしくない」ということです。(#335)』とか言ってて、それに対し私が#376で間違っていると言って、それに対するレスが
>お手数ですが、#388をご覧ください。
 だったわけで、で、その#388再掲が、この「タイプ2エラー」(笑)の話なのよね。

 まぁ、今読み返すと、問題とした文章は、「いずれも危険率5%では帰無仮説は棄却できません。」という“タイプ1エラー”が出ない事が主題であり(”いずれも”が示すものが非常に疑わしですが)、「仮に、表裏の出る確率に差があったとしても、すべてタイプ1エラーになってしまいます。」というのは、“タイプ1エラー”の話とは別としての、補足説明だったかもしれません。

 しかし、そうだとして、わざわざ「書かなくてもいい文章」でしかも肝心の用語をミスをし、さらなる混乱を招くのはABOFANクンらしい。

 とはいえ、#388も基本的には「タイプ1エラー」の話と読めない事もないとしても、FSMさん批判の根拠がすり替わっているのは明らかです。
 そもそも、これって、FSMさんから投げられた問いに、「お答えしようがないけれど、強いてお答えした」モデル(しかもTAKESANさんから突っ込まれ済み)だったはずなのに、いきなり「一押しの根拠」のようになっていますよね。
520.J 2008/12/31 01:13
 ねぇねぇ、なんでわざわざ話変えるのよぉ?
 間違っていると言われたのは『有意差の出ている任意の100項目を選択した場合、「5個は誤って有意差が出ていていてもおかしくない」』であり、何か言い訳するならそれが正しい理由じゃない?
 なのに、「有意差の出ている」状況の話から、「有意差の出ない」状況の話にコロッと変えるの?
 レスになってないよね。どう考えても。

だ・か・ら、こういうのが#394で私が言った
>ちょっと考えて分からなくて
>でも認めるとまずそうなのは
>相手の言っている事は全く無視して
>「それっぽい事を書いてある自分のコメント」
>(でも的外れ)を指示して「返事したフリ」なんですねぇ
なんだってば。
それとも、自分を貶めてまで、私の予言が当たるようにしてくれているの?

あと、以下は#470のFSMさんの話と概ね同じです。
521.J 2008/12/31 01:15
 あなたが言っているモデルの場合、「タイプ1エラー」は0%で、「タイプ2エラー」は100%と言うのは、ABOFANクン自身分かっているのよね。
 で、検定って何のためやるのかというと、ABOFANクンは知らないと思うけど、「仮説の確からしさ」を調べるためやるのよね。
 逆に言えば、「仮説の確からしさ」が調べられない検定を想定する事自体ナンセンスなの。
 ABOFANクンは知らないんだろうけど、基本的に検定では、まず有意水準(=「タイプ1エラー」)を決めたら、次に「タイプ2エラー」の値を小さくできるようにサンプルサイズを決定して、それからデータを取るのよ。
 分かるかなぁ、検定をやる前から「4個では何も分からない」事が分かっているなら、検定は成り立たないの。成り立たないなら当然やらないの。
 こんなこともわからないんでちゅか?
 わざわざ、「タイプ2エラー」が100%になるようにサンプルサイズを設定した上で“検定”の話を偉そうにする事は、『ボクは統計の理屈がまるでわかってないですよ~ん』と声を大にして言うのと同じ。
ひとごとながら恥ずかしいったらありゃしない。

さて、どんな言い訳をするのかな?
531.ABO FAN 2008/12/31 09:05
>>519
はい、自慢じゃないけど、ケアレスミス(だけじゃありませんが…)は結構あります。
極力早目に直すようにしてますので、ご容赦のほどを。

 ...いや、確かにケアレスミスも結構あるケドさ、そんな部分的な話よりも今まで指摘したように、全体の論調に致命的な欠陥がある事の方を気にした方がいいと思うよ。
531.ABO FAN 2008/12/31 09:05
>>520
> ねぇねぇ、なんでわざわざ話変えるのよぉ?
> 間違っていると言われたのは『有意差の出ている任意の100項目を選択した場合、「5個は誤って有意差が出ていていてもおかしくない」』であり、何か言い訳するならそれが正しい理由じゃない?
> なのに、「有意差の出ている」状況の話から、「有意差の出ない」状況の話にコロッと変えるの?
> レスになってないよね。どう考えても。
意味不明です。
『有意差の出ている任意の100項目を選択した場合、「5個は誤って有意差が出ていていてもおかしくない」』って、結局、誰からも反論はなかったと思うんですが?
よろしければ、お手数でも反論部分を引用していただければと思います。

念のため、タイプ1エラーの定義は、もちろんご存じのとおり、
・帰無仮説が真のときに、棄却する誤り
ですから、「有意差が出ていない」場合は、そもそも「帰無仮説を棄却してない」のですから、タイプ1エラーの定義には含まれません。
また、帰無仮説が偽でも、サンプルサイズや差が小さいなどの理由で、もともと全くといっていいほど有意差が出ない場合があります。
従って、危険率を5%として統計的検定を行った場合、一般的に「5個は誤って有意差が出ていていてもおかしくない」と言えないというのが私の主張です。
(もちろん、この場合は検定のやり方がおかしいので、統計学が間違っているのではありません)
まさに、統計学の教科書通りだと思うんですが…。

あるいは、私の説明がわかりにくいということですか?
#それは認めますが…苦笑。

 何が意味不明か意味不明。
 
 というのは、実際には反論や批判はあったけど、仮に無かったとしても、それは「話を変える」理由にはなりませんよね。むしろ、「反論が無い=正しい」と思うのであれば、「話を変える」必然性はどこにもないわけです。
 意味不明な理由で意味不明と言われてもねぇ。

 その後の説明もグダグダ
 タイプ1エラーの定義とは「帰無仮説が真のときに、棄却する誤り」はまぁ正解。
 しかし、次にいきなり「有意差が出ていない」時の話になるのかが、さっぱり分からない。そのあたりの説明が次にあるのかな、と思いきや突然タイプ2エラーの話になる(またかい)。
 で、「有意差が出ていない時」の話と「タイプ2エラーの話」をどんな風に繋げるのかな、と思うといきなり「従って」になって、『危険率を5%として統計的検定を行った場合、一般的に「5個は誤って有意差が出ていていてもおかしくない」と言えない』という、「自分が否定したくない結論」をそのまま付け加えただけ。

 『誤って有意差が出る』は
 つまり「タイプ1エラー」発生のケースがどのくらいあるか、という事だよね。
 なのに、ABOFANクンは「タイプ1エラー」に直接言及せずに、「タイプ1エラー」が生じないケースや、「タイプ2エラー」の話ばかり。
 で、結論だけいきなり「タイプ1エラー」の話に戻す。
 
 何が「教科書通り」なのかさっぱり分からない。
 強いて言えば、とりあえず主題とは関係無く「教科書」に書いてある事を並べ立ててみて、最後に脈略もなく主題に対する自分の結論だけを述べている、というかんじ。

 しかも、今まで「誤って有意差が出ない」ケースでABOFANクンが挙げられた根拠は、本来「検定として成り立たない」コイン4回の事例くらいで、このような極めて特異なケース(というか誤ったケース)では、どこをどう評価しても「一般的に」と言えるような話にはならない。

 ここまでくると、「説明がわかりにくい」云々の問題ではなく、間違った理解と間違ったロジックで、言いたい事を言っているだけだから、「説明」ですらない、というのが実情です。

 何より、一番言いたい事があります。
535.J 2008/12/31 09:47
>>531
>意味不明です。
>『有意差の出ている任意の100項目を選択した場合、
>「5個は誤って有意差が出ていていてもおかしくない」』って、結局、誰からも反論はなかったと思うんですが?
>よろしければ、お手数でも反論部分を引用していただければと思います

びっくりするなぁ
読みもしないで「反論は無い」だって。
「意味不明」だって。

376.J 2008/12/28 02:48
 とりあえず暫定版ながら、“正しい”「タイプⅠエラー」の解説書きました。
http://naked-kings.blog.so-net.ne.jp/2008-12-28
 これ以上恥かきながら場を荒らす前に、読みなさい。で、疑問、反論あれば、私のブログのコメント欄へ。

「反論が無い」ではなく
反論から目をそらしているだけでしょ

 そう、何のために私がタイプ1エラー関連の記事をブログに書いただけでなく、掲示板でも告知したというのだろう。
 で、ABOFANクンはそれに対して、「お手数ですが」と#388を読ませようとして。
 なのに今度は、「お手数でも」反論部分を引用してください、だって。

 読もうともしないクセに、相手には手数をかけさせ
 読まないから、また相手に手数をかけさせようとする
 なんだこりゃ。
536.ABO FAN 2008/12/31 10:08
普通は、他のサイトやブログまではチェックしないと思うんですが。(苦笑)

念のため、#531の再掲です。

--
また、帰無仮説が偽でも、サンプルサイズや差が小さいなどの理由で、もともと全くといっていいほど有意差が出ない場合があります。
従って、危険率を5%として統計的検定を行った場合、一般的に「5個は誤って有意差が出ていていてもおかしくない」と言えないというのが私の主張です。
(もちろん、この場合は検定のやり方がおかしいので、統計学が間違っているのではありません)
まさに、統計学の教科書通りだと思うんですが…。

あるいは、私の説明がわかりにくいということですか?
#それは認めますが…苦笑。
--
これって、Jさんの主張される内容と同じものですよね?
確かに、私の説明がわかりにくいのは認めます。(^^;;

それと、できれば統計の話になっているので、#527の議論に加わっていただけるとありがたいです。

 だ・か・ら、一度提示した物を二度提示する必要があるの?

 しかも今度の再掲は、曲がりなりにも「タイプ1エラー」について言及した部分を削り、「タイプ2エラー」に言及した部分のみになっちゃってるし。
 もう、正気の沙汰とはまるで思えませんね。

「Jさんの主張される内容と同じものですよね?」って言われても、違うって。

 ...ん?あれ
 私は、ここでは具体的な「タイプ1エラー」の話はしてないんだよね。
 タイプ1エラーに関する私の主張(というか正しい理解)はブログに書いておいたんですが。
 「普通は、他のサイトやブログまではチェックしないと思うんですが。」
 と言うから、チェックしなかったと思ったら、チェックしてるじゃん。

ところで、ここでちがやまるさんから
537.ちがやまる 2008/12/31 10:10
>>531
まとまった数のある特定の何かについて量った結果があるとします。そこにはもともと差なんてないのに、誤差があって上下にすそをひいたような分布ができている、とします。
判定の都合上、上下にはずれたどこかに線をひいて、その線よりはずれたものには差がある、と決めることにします。

もしもその線が、もともと差がない場合に5%が「差がある」になってしまうレベルに設定されていたなら、もともと差がない冒頭の結果のうち5%は誤って「差がある」にされてしまいます。

そういう特別な場合以外には、線よりはずれた値には、もともと差があるものに由来する結果がどれだけの数あるかわからない程度に存在するわけですから、「差がある」と判断されたものだけを100個取り出してきて、その中にどれだけ「もともと差がない」ものが入っているかなんて『わかりっこない』でしょう。

おそらく、ABOFANクンはちがやまるさんに対しては「同意してくれた人」という点で、他の人とは態度を変えるのでしょう。あっさり間違いを認めます。
543.ABO FAN 2008/12/31 14:10
>>537
確かにそのとおりです。
我ながら、迂闊なことを書いてしまって、お恥ずかしい限りです。(^^;;
取り得る可能性は次の4パターンですね。
a: 帰無仮説が真、有意差あり
b: 帰無仮説が真、有意差なし
c: 帰無仮説が偽、有意差あり
d: 帰無仮説が偽、有意差なし
で、aがタイプ1エラーになるt確率、dがタイプ2エラーになる確率です。
制約条件は、
1. a+b+c+d=1
2. a/(a+b)=0.05
の2つだけです。
求める値は、a/(a+c)ですから、決まるはずがありません。
4元連列方程式なら、制約条件か3つないと、値はユニークに決まりませんからね。
失礼しました。

544.ABO FAN 2008/12/31 14:16
>>543
う、ユニークな値なら、制約条件は4つ必要ですね。
他に間違いがあったら、ご指摘をお願いします。
まぁ、私のレベルなんて、そんなものです。(*_*)

あれ、どこかで見たぞ...これ。
 って、私のブログの「覚え書き」の(劣化)コピーじゃん
 しかも間違いだらけだし(前の記事参照)
548.J 2008/12/31 16:59
>従って、危険率を5%として統計的検定を行った場合、
>一般的に「5個は誤って有意差が出ていていてもおかしくない」
>と言えないというのが私の主張です。
 あれ、「有意差100個のうちの5個」っていう主張はどこいったの?
 説明できなそうになったから、有耶無耶にしたいの?

※見たら#543で間違いを認めてますね。
 というか、そこの解説って、笑っちゃうほど私のブログの内容そっくりじゃん?
 (本当は読んでるくせにぃ)。
 でも、これを既に批判していた私には、間違いを認めるご報告は無いわけね。
 ずるいなぁ。

 と、少しおちょっくってみましたが、まぁ、間違いを一つ気付かせるのには成功したから、もう一方に力を入れる事にします。
548.J 2008/12/31 16:59
あと自分で、
>もちろん、この場合は検定のやり方がおかしいので、
>統計学が間違っているのではありません
と言ってますが
>もともと全くといっていいほど有意差が出ない場合

 なんてのは、先に私が、まさに、検定として成立しない「おかしいやり方」だよ、と指摘しましたよね。

 それに対する明確な反論は無しに、相変わらずそのケースを挙げて、“「5個は誤って有意差が出ていていてもおかしくない」と言えない”と言うのは、やっぱり「統計無知」の言い分だなぁ。

 ついでに、そのような「おかしいやり方」での話なのに、それを“一般的に”と言い切れるちぐはぐさがすばらしい!

 あのさぁ、せめて“最低限検定として成り立つ状況で“、「有意水準程度にタイプ1エラーが出ない」事を示してから、こういう事いいなさいな。



【しおり9】

 しかし、さすがの私もABOFANクンの「人のせいにする病」が、どこまで深刻か把握していなかった。
 次のレスで、とんでもない事を言い始めます。
552.ABO FAN 2009/01/01 09:42
どうもはっきりしないので、確認させていただきたく。

#200からの引用です。
> 問題は、「意味のある」有意差というところです。大雑把にいえば、有意水準5%で統計やれば、100個質問項目があれば、5個ぐらいは本来相関がなくても相関が一見出ちゃうわけで。ここのハードルが高いですよね。

http://naked-kings.blog.so-net.ne.jp/2008-12-28
> FSMさんの『本来相関がない場合でも、5%水準であれば、100個のうち5個は有意差が出てしまう(出てしまってもおかしくない)』となるわけです。FSMさんの発言は、統計の概念そのままと言っていいでしょう。

①これは、
a: 帰無仮説が真、有意差あり →タイプ1エラーになる確率
b: 帰無仮説が真、有意差なし
c: 帰無仮説が偽、有意差あり
d: 帰無仮説が偽、有意差なし →タイプ2エラーになる確率
とした場合に、
②FSMさんの主張は、a/(a+c)=0.05ということになります。
③次に、a/(a+c)は不定ですので、ちがやまるさんの指摘のようにFSMさんの主張は必ずしも正しいとは言えません。
なぜなら、4元連列方程式で、方程式が、
1. a+b+c+d=1
2. a/(a+b)=0.05
の2つしかないからです。

ここまではよろしいですか?

結論として、「FSMさんの発言は、統計の概念そのまま」ではありません。

それとも、Jさんは「FSMさんはa/(a+b)=0.05」と言っているのだ、という意見なのかもしれません。
その場合は、「FSMさんの発言は、統計の概念そのまま」です。
しかし、統計で本当に関係があるかどうか判断しようと言っているのですから、帰無仮説の真偽はわかっていないのが前提のはずです。従って、現実に得られるデータは、有意差あり(a+c)、と有意差なし(b+d)しかありません。
これだけでは、a/(a+b)は計算できませんから、もしそうだとすると、最初からFSMさんの発言は「現実に測定しようがないデータ」についての説明ということなります。
測定しようがないのですから、「ハードルが高い」かどうかもわかりません。
ということで、どちらにせよ、FSMさんの発言は、意味があるとは思えません。

いかがですか?

狂ってる...
一度自分の間違いと認めたものを、FSMさんの間違いにしようとしている。
コレに関する批判はこの先に書いているので、割愛。

このあまりの酷さに、他の皆さんやFSMさんからの非難囂々
554.ちがやまる 2009/01/01 12:01
>>552
「#200からの引用です。
> 問題は、「意味のある」有意差というところです。大雑把にいえば、有意水準5%で統計やれば、100個質問項目があれば、5個ぐらいは本来相関がなくても相関が一見出ちゃうわけで。ここのハードルが高いですよね。
http://naked-kings.blog.so-net.ne.jp/2008-12-28
> FSMさんの『本来相関がない場合でも、5%水準であれば、100個のうち5個は有意差が出てしまう(出てしまってもおかしくない)』となるわけです。FSMさんの発言は、統計の概念そのままと言っていいでしょう。」(ABO FANさん)
ここで「相関がない場合」と言ってるのは、#537でいえば「もともと差がない」「特別な場合」のことですから、「100個質問項目があれば、5個ぐらいは」「出てしまってもおかしくない」ことになります(よく引き合いに出されるのは、「ひとつでも有意な相関が認められる確率」だったりします)。FSMさんやJさんはおかしなことは言ってないと思います。
ABO FANさんはa+b+c+d=1で何を足し合わせているか、出発点をきちんと考えておく必要があると思います。

 「a+b+c+d=1」で、間違いばればれですからね。
556.TAKESAN 2009/01/01 12:32
>>552
だ・か・ら。
相関関係が無い母集団から標本を採ってきて、検定統計量の分布を求め、検定統計量の実現値が棄却域に落ちる確率は? という話です。
FSMさんは、最初から「その話」をしているんですって。

559.FSM 2009/01/01 13:14
>>552
> > 問題は、「意味のある」有意差というところです。大雑把にいえば、有意水準5%で統計やれば、100個質問項目があれば、5個ぐらいは本来相関がなくても相関が一見出ちゃうわけで。ここのハードルが高いですよね。

> ①これは、
> a: 帰無仮説が真、有意差あり →タイプ1エラーになる確率
> b: 帰無仮説が真、有意差なし
> c: 帰無仮説が偽、有意差あり
> d: 帰無仮説が偽、有意差なし →タイプ2エラーになる確率
> とした場合に、
>
> ②FSMさんの主張は、a/(a+c)=0.05ということになります。

残念ながら、違います。
上の文章(「問題は、」で始まる文章)をよく読んでください。
ちなみに項目が1000個なら50個、10000個なら500個が、差が有意になってもおかしくないのが有意水準5%の意味です。

ところで、「有意水準5%」というのは、何に対して、何を5%とするということですか?ABO FANさんの言葉で説明していただけませんでしょうか。それを見ることが、おそらく食い違いの原因がどこにあるかを明確にできる方法だと思いますので。

また、タイプ1エラーというのは、「有意差のある項目100個のうち」という説明は撤回されてないんでしたっけ?

それでも、しれっとこんな事を言います。
562.ABO FAN 2009/01/01 20:40
>>552
すみません、また間違ってましたので訂正しておきます。
危険率が5%なら、条件は5%未満だから不等号になりますね。
(誤) ②FSMさんの主張は、a/(a+c)=0.05ということになります。
(正) ②FSMさんの主張は、a/(a+c)<0.05ということになります。
(誤) ③ 2. a/(a+b)=0.05
(正) ③ 2. a/(a+b)<0.05
もう、間違いないだろうなぁ…。(^^;;

 いや、そんな事よりもっと大きな間違い犯してますって。
(というか、#562の訂正でも深刻に間違っているんだけど)
563.ABO FAN 2009/01/01 20:54
>>554
> FSMさんの『本来相関がない場合でも、5%水準であれば、100個のうち5個は有意差が出てしまう(出てしまってもおかしくない)』となるわけです。FSMさんの発言は、統計の概念そのままと言っていいでしょう。」(ABO FANさん)
> ここで「相関がない場合」と言ってるのは、#537でいえば「もともと差がない」「特別な場合」のことですから、「100個質問項目があれば、5個ぐらいは」「出てしまってもおかしくない」ことになります(よく引き合いに出されるのは、「ひとつでも有意な相関が認められる確率」だったりします)。FSMさんやJさんはおかしなことは言ってないと思います。

#552に書いたとおりですが、一応繰り返しておくと、
①a/(a+c)<0.05かどうかはわかりません。
②a/(a+b)<0.05は確かですが、この数値は現実のデータでは確かめようがありません。
という意味です。

①を今まで一生懸命「それが5個ぐらいだ」と力説してたのにねぇ
②が非常に意味不明、というか説明できないから、「自分が間違いでない」結論“だけ”を述べているだけか。
564.ABO FAN 2009/01/01 20:55
>>554
> ABO FANさんはa+b+c+d=1で何を足し合わせているか、出発点をきちんと考えておく必要があると思います。
確かに、FSMさんの定義とは違うかもしれませんね。
回答を待ちたいと思います。

 ああ、せっかく間違いを教えてくれたのにねぇ。
 そもそも、a+b+c+d=1と足し合わせて見せたのはABOFANクン自身(FSMさんの定義なんて関係なく)。
 それを考えろ、と言われたのに、FSMさんの回答待ちって何だそりゃ?
 自分で説明しないくせに、無関係の人に説明させようとするってなんだろうね。
566.ABO FAN 2009/01/01 21:07
>>559 >>560
> ところで、「有意水準5%」というのは、何に対して、何を5%とするということですか?ABO FANさんの言葉で説明していただけませんでしょうか。それを見ることが、おそらく食い違いの原因がどこにあるかを明確にできる方法だと思いますので。

既に書いているつもりなのですが、わかりにくいようなので再掲します。
 a/(a+b)<0.05
です。ただし、この数値は、現実のデータからは計算できないので無意味と思っています。言い換えれば、ハードルかどうか認識しようがありません。
念のため、私がFSMさんの主張と思っているのは、
 a/(a+c)<0.05
です。この数値は、現実のデータから計算できます。

> また、タイプ1エラーというのは、「有意差のある項目100個のうち」という説明は撤回されてないんでしたっけ?

これは撤回しました。(^^;;
お恥ずかしい限りです。
よろしくお願いします。

...電波垂れ流し。

 およそ、ここから何らかの正しい知識を得ようとしても無駄だから、明らかにおかしいところを指摘しておこう。

・ a/(a+b)<0.05 が現実のデータからは計算できない。
・ a/(a+c)<0.05が現実のデータから計算できる。

なんで前者は現実のデータで計算する必要があるの?
なんで後者は現実のデータで計算できちゃうの?

...というか、なんで理由を具体的に述べないで、できるとか言い切れちゃうの?
てか、「a/(a+c)は不定です」ってついこの前まで言ってたよね。

FSMさんもさすがにどうでもよくなってきた模様
567.FSM 2009/01/01 22:33
>>566
> 既に書いているつもりなのですが、わかりにくいようなので再掲します。
>  a/(a+b)<0.05
> です。ただし、この数値は、現実のデータからは計算できないので無意味と思っています。言い換えれば、ハードルかどうか認識しようがありません。

了解しました。
じゃあ、帰無仮説が真の場合、有意水準5%で検定をやるとしたら、標本が100セットあったら、何セットぐらいは差が有意(帰無仮説が真にもかかわらず←もちろんこのことは検定をする人は知りません)となってしまってもおかしくないことになりますか?1000セットだったら?10000セットだったら?

# 「セット」という言葉は適当なんですが、検定理論ではなんというべきなんですかね?

FSMさんの「了解しました」は、私には
「ハイハイ、あんたが関係ない事ウダウダ言うのはよく分かったから」
に聞こえます。

ちなみに、ABOFANクンにはそうは聞こえないようですがね。
しかも、「了解」は「分かった」という事を示すだけのはずですが、彼は「同意」と勝手に解釈しているようですよ。
567.FSM 2009/01/01 22:33
>>566
> 念のため、私がFSMさんの主張と思っているのは、
>  a/(a+c)<0.05
> です。この数値は、現実のデータから計算できます。

違います。それは私の主張ではありません。

> > また、タイプ1エラーというのは、「有意差のある項目100個のうち」という説明は撤回されてないんでしたっけ?
> これは撤回しました。(^^;;

了解しました。
じゃ、上の質問、教えてくださいね。よろしくお願いします。

 ちなみに、「了解」を「同意」と拡大解釈するのに、ここで「違う事を明言している」にもかかわらず、それについては「申し訳ありませんが、FSMさんの主張が現時点では私にはわからないので、お答えできかねます。」って言ってたよ。
 どこまで都合良く人の話を解釈すれば気が済むのだろう。


【しおり10】

 さぁ、やっとここまで来ました(読んだ方もお疲れ様)。
 執筆中ABOFANクンのレスがありましたが、とりあえず私の1/2の投稿で締めくくります。
576.J 2009/01/02 02:57
>どうもはっきりしないので、確認させていただきたく。
確認するも何も、悪い冗談としか思えない事実誤認なわけですが、
>#200からの引用です。
(中略)
>> FSMさんの『本来相関がない場合でも、5%水準であれば、
>>100個のうち5個は有意差が出てしまう(出てしまってもおかしくない)』
>>となるわけです。
>>FSMさんの発言は、統計の概念そのままと言っていいでしょう。
>①これは、
>a: 帰無仮説が真、有意差あり →タイプ1エラーになる確率
>b: 帰無仮説が真、有意差なし
>c: 帰無仮説が偽、有意差あり
>d: 帰無仮説が偽、有意差なし →タイプ2エラーになる確率
>とした場合に、
>②FSMさんの主張は、a/(a+c)=0.05ということになります。
はぁ?
ニホンゴ読めますか?
正月早々頭になんか湧いていますかぁ?

私の書いたFSMさんの主張、最初になんて書いてあります?
『本来相関がない場合でも』だよね。
で?「5%水準であれば」
『100個のうち5個は有意差が出てしまってもおかしくない』
だよね。
どう見ても、FSMさんが言っているのは、aのみなんですが...。
いきなり飛ばしまくりですね。
むしろ、『本来相関がない場合でも、5%水準であれば、>100個のうち5個は有意差が出てしまう』が、「a/(a+c)=0.05」になってしまうABOFANクンの思考過程の詳細が知りたい。
(#567でFSMさんが「違います。それは私の主張ではありません。」と言ってます。念のため。)

577.J 2009/01/02 02:59
>それとも、Jさんは「FSMさんはa/(a+b)=0.05」と言っているのだ、
>という意見なのかもしれません。
>その場合は、「FSMさんの発言は、統計の概念そのまま」です。

はぁ…FSMさんもTAKESANさんも、ずっとその文脈で話していますよ。
それが分からないと言うのなら、統計の理解が絶望的か、文章の理解が絶望的か、あるいは両方か、というぐらい外野には分かりやすくね。

あ、でもそう言えば、ABOFANクン曰く「統計の概念そのまま」な『a/(a+b)=0.05』を否定している人がいましたね。

『「有意水準5%で統計やれば、100個質問項目があれば、5個ぐらいは本来相関がなくても相関が一見出ちゃう」というのは、妥当な記述とは思えません。「有意水準5%」というのは、タイプ1エラーが5%(以下)の確率で起こるということです。しかし、それだからと言って、どんな場合でも「100個質問項目があれば、5個ぐらいは本来相関がなくても相関が一見出ちゃう」のではありません。(#234)』

で、この人は続けてこう言うんですよ。

『FSMさんは、『100個「有意差のある」質問項目があれば、5個ぐらいは本来相関がなくても相関が一見出ちゃう』と言いたいのかもしれません。確か に、統計学的にはそういうことも言えるでしょう。しかし、巨大サンプルでは、疑似相関がもっと盛大に出ると考えられるので、これまた妥当とは思えません。(#234)』

しかも、同じ人は別のコメントではこんな事まで言ってます

『有意差の有無を無視して、任意の100項目を選択した場合、「5個は有意差が出てもおかしくない」のではありませんよ。しつこいようですが、有意差の出て いる任意の100項目を選択した場合、「5個は誤って有意差が出ていていてもおかしくない」ということです。(#335)』

ABOFANクン、「a/(a+c)=0.05」説を唱えているのは、FSMさんではなく、この人です!
この人が犯人です!!

...ありゃ?
...ありゃりゃりゃ?
#234も、#335も、ABOFANクンじゃないの!!

578.J 2009/01/02 02:59
 ちがやまるさんの#531も、アンタの上記のような「おかしな発言」に対してツッこんだのね。で、時を同じくして、下唇噛みながら私のブログを嫌々読んで(多分ね)、「あ、間違ってた」と気付いて#543で
>確かにそのとおりです。
>我ながら、迂闊なことを書いてしまって、お恥ずかしい限りです。(^^;;
と間違いを認めたわけじゃない。

しかし、年が明けて、と言っても24時間もたたないうちに...

>a/(a+c)は不定ですので、ちがやまるさんの指摘のように
>FSMさんの主張は必ずしも正しいとは言えません。

お~い!
「(自分が)迂闊なことを書いた」と間違いを認めたものが、いきなり「FSMさんの主張は正しいとは言えない」になってるよ!!

 ここまで酷い責任転嫁はまず見れないね。ブラボー!

578.J 2009/01/02 02:59
その後の言い訳がまさに『ザ・統計無知』
なんか、色んな事を有耶無耶にしようと、無い頭絞って「言い訳」を考えたようですが、所詮“無い頭”。グズグズの文章を書いて、“読む気を無くす”作戦には成功していますが、私には通用しません。

1 帰無仮説の真偽はわかっていないのが前提のはず。
2 現実に得られるデータは、有意差あり(a+c)、と有意差なし(b+d)しかない。
3 これだけでは、a/(a+b)は計算できません

おいおい、計算できないのは「a/(a+c)」だろ。
というか、(a+b)は、「帰無仮説が真」の事象全て(=100%)だから
a/(a+b)=a、a=タイプ1エラー=有意水準
変に数式いじって、自分で分からなくなった?
有意水準があらかじめ計算できないなら、どうやって有意水準に沿った検定ができるんだい?
人の考えをよく理解しないでパクるからこういう恥かくのよ。

>ということで、どちらにせよ、FSMさんの発言は、意味があるとは思えません。

「人の発言を、無意味にしたい」動機だけは十分伝わりましたが、そのために自分が意味不明(つうか大間違い)の発言を重ねる事は、デメリットにしかなりませんよ。

>いかがですか?

と言われても、0点としか言いようが無い...(できればマイナス点付けたい)



【おわりに】

まるで「狂人の観察日記」のようなものを最後まで読んで下さった皆様
お疲れ様でした。

文章量よりも、ABOFANクンの発言を「理解できる言語」に変換する事の方が大変だったでしょう。
私が挿入したコメントがその一助になれば幸いです。

で、気付いた方も多いと思いますが
これだけの文章を消費しているにもかかわらず
ABOFANクンの発言に、「そのままで統計のためになる」情報がほとんど含まれていない事です。
怖いでしょ。
nice!(0)  コメント(5)  トラックバック(0) 
共通テーマ:学問

nice! 0

コメント 5

FSM

…読んじゃった。読んじゃったよー。明日も寝不足だー。(^^;;

どうもおつかれさまでした。労作ですね。

しおり3から4への展開は、まさにSeagul-Xさんの地球の裏側の人のたとえ話そのものでした。

いやーしかしなかなか展開が読めませんね。そろそろ終結かな、と思ったら、新たなストーリーが始まって。スリルとサスペンスに満ちてます。もうドキドキ。(^^;;
by FSM (2009-01-09 02:34) 

TAKESAN

今日は。

お疲れ様です。

私も夜中に一気に読みました。いやー、こうやってまとめてもらえると、助かりますよ。

最近のやり取りで、ここまでABO FANさんはダメだったのか、というのが解ったのでした。ちょっと想像以上でした。元々相当ダメだと思ってたんですけどね。どこまでも先を行ってくれます。
by TAKESAN (2009-01-09 12:40) 

Judgement

うわー、ひまじん2人みっけ。(←失礼)

でも、なんか、そろそろ、ちょっと、もう...
って感じになってきましたね。

彼のリビドーは留まるところを知らず
強まれば強まるほど、コメディーがホラーになり
そして今、ホラーがシュールになってしまった感じ。

コメディーやホラーはストーリーがあるので解説のしがいもありますが
前衛すぎるのは、ちょっと扱いに困ります。
by Judgement (2009-01-10 02:11) 

トンデモブラウ

遅ればせながら、閑人3号参上です。

TAKESANさんの掲示板で分かっていたのに、ここのまとめだけみると本当に寒くなりますねぇ。
ラニーニャ現象の影響でしょうか。
サイコなスクラップ・ブックのようだ・・・
by トンデモブラウ (2009-01-10 23:49) 

Judgement

そのサイコなスクラップ・ブックについて
当の本人は、微塵のおかしさも無いといった風情で
辻褄が合うかのようにスラスラと解説してみせる

そんな態度はサイコなスクラップ・ブックそのものよりも
怖いのですね
by Judgement (2009-01-13 21:50) 

コメントを書く

お名前:[必須]
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

トラックバック 0

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。