「#統計「仮説検定とP値の誤解」佐藤俊哉現実への統計学の適切な応用の仕方の理解に繋がる重要事項は、以下…」黒木玄 Gen Kurokiのスレッド

221012022-04-01 13:35:06

#統計 https://t.co/eoKrk67JZ7 「仮説検定とP値の誤解」佐藤俊哉 現実への統計学の適切な応用の仕方の理解に繋がる重要事項は、以下に添付画像の形式で引用した「誤解」です。 動画を視聴するときには、このことの理解につながる具体的な事柄に意識を集中するべきです。 https://t.co/meMVVuY6pr

2022-04-01 13:35:06

#統計 「仮説検定は背理法か」の類は一見賢そうな人達がよく話題にしますが、上のツイートに引用した重要事項との相対比較では「つまらない」とみなされるべきです。 P値に関する低レベルな誤解にも関する話題も単に「誤解を修正しろ」でおしまいの「つまらない」話題だと思います。

2022-04-01 13:39:39

#統計 取得したデータが使用する統計モデルが前提としている条件を満たしていないことが疑われる場合は頻繁に生じるので(むしろそういう場合の方が普通)、P値の解釈で統計モデルが現実には決してぴったり一致しないことを常に意識することは非常に重要です。

2022-04-01 13:42:17

#統計 現実の事例:イベルメクチンの新型コロナウイルスに対する効果が非常に強いという結果が統計的に得られたと称する言説が拡散されてしまった。 こういう命に関わる情報を適切に処理するためには、このスレッドで重要性を強調したことへの理解が必要になります。

2022-04-01 13:45:11

関連 https://t.co/ytgplt7mBZ

重症化リスク因子を有し,発症から7日以内の18歳以上の新型コロナウイルス感染症に罹患した外来患者に対するイベルメクチン400μg/kgの3日間投与はプラセボと比して重症化アウトカムに有意差なし.発症3日以内に限定しても差はなし.1358例DB-RCT(N Engl J Med 2022 Mar30) https://t.co/Uzwg814G2a

2022-04-01 13:52:00

#統計 以下の添付画像に引用したように、統計モデルの妥当な使用で必要な前提は、統計分析の結果を疑うときに真っ先に考えることの多くを含んでいます。 このように、P値が統計モデル内確率であること及びその実践面での帰結について理解することは、統計学入門の中心的な部分だと考えられます。

2022-04-01 14:01:48

#統計 さらに、自分や家族の命を守ったり、社会の構成員としてどのような政策に賛成するかを決めるときに、「P値が統計モデル内確率であること及びその実践的帰結の理解」が重要な教養の1つになることもわかると思います。

2022-04-01 14:04:19

#統計 さらに、入門時点で統計モデルを常に意識することが必要なことを理解できていれば、より複雑な統計モデルを用いる場合の理解にも自然に繋がります。 より複雑な統計モデルを用いる場合には自然にベイズ統計も含まれる。 こういう流れに乗れば「主義に基く非科学的な統計学」も排除できます。

2022-04-01 14:08:48

#統計 イベルメクチン関連 #Julia言語 https://t.co/0QnpIQVcY8 悪い人達が20世紀からずっと「ベイズ統計は頻度論と違う主義思想哲学に基く」という極めてミスリーディングな解説をして来たせいで、ベイズ版でもP値版でも実践的には同等になる場合があるという事実が広まっていない。 https://t.co/3Qr3PFiFSG

2022-04-02 04:09:11

#統計 #Julia言語 イベルメクチンねた続き。 添付画像①は二項分布モデルの一様事前分布でのベイズ統計のプロット。 添付画像②はそのP値版です。Relative risk = 1.0 のP値がかなり大きい。 これらを比較すれば違う結論を出せるはずがないとすぐに分かると思います。 https://t.co/0QnpIQVcY8

2022-04-02 04:13:17

#統計 添付画像①はベイズ版の事後分布のグラフで、②は対応する場合のP値函数のグラフです。 これらを比較すれば、Rothmanさん達の疫学の教科書がすすめているP値函数全体の利用は、ベイズ統計での事後分布全体の利用にちょうど対応していることがわかります。 https://t.co/0QnpIQVcY8

2022-04-02 04:17:39

#統計 関連スレッド 添付画像①は平坦事前分布の事後分布のグラフなので、尤度函数の定数倍のグラフだともみなせます。 尤度函数と事後分布は事前分布の違い__しかない__という感覚が大事。統計モデルの根幹を変更することと比較すればおとなしめの事前分布を取り替えることは大した変更じゃない。 https://t.co/VCZWeyPFXn

#統計 尤度函数全体の情報は、ベイズ統計の事後分布の情報にも相当に近いです(事前分布の違いしかない)。 これによって、 * 検定や信頼区間におけるP値函数 * 最尤法における尤度函数 * ベイズ統計における事後分布 を「似たようなもの」と認識できるようになる。 一挙に使える道具が増える!

2022-04-02 04:22:47

#統計 尤度函数とP値函数は最尤法を基礎とするχ²検定で繋がっています。シンプルなケースでは、P値函数、尤度函数、事後分布は本質的に同じものを見ていると思って良い場合がたくさんあります。

2022-04-02 04:25:04

#統計 「ベイズ統計は通常の統計学とは異なる主義思想哲学に基く」と言って来た人たちは便利な道具であるベイズ統計の普及を大幅に遅らせた疑いがあると思います。 * シンプルなケースではどれを使っても同じ。 という事実を述べてから、 * トレードオフがある。 と説明するべきだと思います。

2022-04-02 04:28:22

#統計 多分、Rothmanさん達の疫学の教科書を読んでP値函数が便利だと思った人達は、最近のイベルメクチン論文 https://t.co/4MEr0uLgwi のSupplementary Appendixにある事後分布のグラフと対応するP値函数のグラフを比較して、事後分布も便利なことも理解できると思う。 https://t.co/0QnpIQVcY8

2022-04-02 04:36:38

数学の世界には、定義が全然違っていても、数学的理由によって、実践的には無意味なほど小さな数値的違いしか生じないことがあります。 この場合はそういう例になっています。この場合には事後分布とP値函数を使って行った区間推定は実践的には同じだとみなして問題ないです。

2022-04-02 04:40:42

#統計 P値函数、尤度函数、事後分布はシンプルなケースでは同じように使えるという数学的事実を知れば、このスレッドのトップで紹介した動画 https://t.co/eoKrk67JZ7 「仮説検定とP値の誤解」佐藤俊哉 で勉強した考え方が、最尤法やベイズ統計でもそのまま使えそうなことも分かると思います。

2022-04-02 04:49:24

#統計 https://t.co/0QnpIQVcY8 イベルメクチン論文の図の再現 では、オリジナルのベイズ版と対応するP値版の両方を実装しているのですが、P値版の方が面倒でした。以下のリンク先のコードが役に立った。 一般にP値版の実装の方が数学的に技巧的でめんどくさいことが多いと思います。 https://t.co/8xe2k51nhF

2022-04-02 04:57:54

#統計 添付画像は最近のイベルメクチン論文にあったベイズ版の図のP値版。 左側のグラフは二項分布モデルでのClopper-Pearsonの信頼区間を与えるP値函数です。 右側のグラフは仮想的な相対リスク比のP値函数でP値=0.05でグラフを切ると95%信頼区間が得られます。山のてっぺんが点推定を与える。

2022-04-02 10:50:49

#統計 Rothmanさん達の疫学の教科書(超有名)にも、以下のリンク先のようにP値函数のグラフが描いてあり、その使い方が説明されています。 P値函数のグラフはすべての閾値(信頼係数=1-有意水準)に関する信頼区間と点推定の情報を含んでいます。 https://t.co/YsSwnsQmJK

#統計 Rothmanさん達の疫学の教科書の添付画像の部分では、P値函数だけをプロットした図になっていて、有意水準という「閾値」の情報は書き込まれていません(ゆえに信頼区間もプロットされていない)。 もしかしたら、有意水準という「閾値」の呪縛から逃れるには良い方法かもしれないなと思いました。

2022-04-02 10:56:02

#統計 論文 https://t.co/4MEr0uLgwi のSupplementary Appendixにあったベイズ版の事後分布のグラフ。 ベイズ版95%信用区間にパラメータが含まれる確率をモデル内事後分布で測ると95%になります(その確率は現実ではなく、モデル内での確率)。 事後分布の山のてっぺんが点推定を与える。

2022-04-02 11:22:57

#統計 最近のイベルメクチン論文 https://t.co/4MEr0uLgwi でベイズ統計を使って結果を報告しているのを見て、「ベイズ統計は頻度論とは異なる主義思想哲学に基く」という悪しき解説を思い出してびびるのは良くないです。 このようなシンプルな場合には事後分布とP値函数のどちらを使っても実質同じ。

2022-04-02 11:27:16

#統計 数学的な理由で、事後分布とP値函数のどちらを使っても数値的には実質同じとみなせる場合には、ベイズ統計を使った結果の報告をこのスレッドトップで紹介した動画で学べるP値に関する考え方で解釈して問題ない。 「ベイズ統計は主義思想哲学が違う」というミスリーディングな説明は忘れるべき。

2022-04-02 11:30:19

一般に算数レベルの段階で、数学の実践的な応用では、「常に定義に忠実に解釈しなければいけない」という考え方は有害になります。 定義そのものではなく、定義の結果得られる性質の側を十分に理解して使う必要があります。

2022-04-02 11:44:28

例えば、かけ算の定義が3×4=3+3+3+3だと思っている人が、「かけ算の式は常にそのように解釈しなければいけない」と言い出すと、非常識でおかしな人扱いされることになるわけです。 シンプルなケースでのベイズ版信用区間と通常の信頼区間の関係も同様です。

2022-04-02 11:44:29

ベイズ版信用区間と通常の信頼区間の定義は全然違う。 しかし、数学的な理由でそれらが数値的によく一致することが保証される場合があります。 そういう場合にも定義の違いを主義思想哲学の違いに昇格させて異なる解釈を他人に強要する人達は、かけ算順序を他人に強要する人達と同様に有害です。

2022-04-02 11:44:31

統計モデルが現実をぴったり記述していることはありえないので、統計モデルを使ったすべての統計分析はなんらかの意味で「どんぶり勘定」にならざるを得ません。 そのような状況で、細かな数値的な違いにこだわっても意味がない。

2022-04-02 11:48:03

#統計 遊びで、グラフを作り直した。 https://t.co/0QnpIQVcY8 添付画像 ①相対リスクの事後分布の計算をモンテカルロ法ではなく、数値積分に取り替えた。モンテカルロ法が原因のグラフのがたつきが解消されて滑らかになった。 ②二項検定のP値函数を取り換えて「頭がとがる」ようにした。

2022-04-02 18:09:22

#統計 この場合の  ベイズ統計での事後分布で測った確率 ≈ P値 という数値の一致は、二項検定に付随する古典的なClopper-Pearson信頼区間の計算法を知っていれば理解できます。 ベイズ統計入門では信頼区間に関する理解が役に立ちます。 詳しくは添付画像を参照。 https://t.co/0QnpIQVcY8

2022-04-02 20:04:05

#統計 こういう数学的現象は二項分布モデルに限らず、サンプルサイズnを大きくしたときには広く成立しています。事後分布が正規分布に近付く最尤法が有効な場合ならほぼ同じようなことが成立していると思ってよいです。 有限のnでの違いは個別に確認するしかないし、最尤法が有効でない場合もある。

2022-04-02 20:07:46

#統計 約2年前に出版された豊田秀樹著『瀕死の統計学を救え!』という本では、P値を使うのをやめて、代わりに事後分布での仮説が成立する確率を使うことをすすめているのですが、~続く

2022-04-02 20:19:19

#統計 続き~、事後分布での仮説が成立する確率の例として数値的にP値に一致するものを扱っており、  P値を使うのをやめて、  その代わりにP値を使うことをすすめている ことになってしまっており、大変酷いことになっています。 知的に瀕死なのは統計学の側ではなく著者の側でしょう。🤣

2022-04-02 20:19:20

#統計 古典的なClopper-Pearson信頼区間の計算法を勉強して理解しないままで、「ベイズ統計は通常の統計学とは異なる主義思想哲学に基く」という言説を信じてそちらに進んでしまうと、そういう酷いことになります。 P値や信頼区間などに関係する基本的な事柄を勉強しておくことには損はないです。

2022-04-02 20:24:18

#統計 最近のイベルメクチン論文 https://t.co/4MEr0v2jyi ではベイズ統計を使っていますが、 https://t.co/0QnpIQD3K0 で示したように使わなくても結果は同じです。 青と赤と黒の線が通常のP値函数、オレンジとシアンと灰色の線が件の論文に登場する事後分布から作ったP値函数の類似物から得た結果。 https://t.co/sAXuu52ApY

2022-04-03 14:13:09

#統計 このグラフを見ると,通常のP値を使ってもベイズ統計を使っても結果は一致していることが明瞭です。 ベイズ統計を何も知らない人はベイズ統計を使う方が大変だと感じるので「どうしてわざわざベイズ統計を使ったのか!」と不満を感じるかもしれませんが、その不満の原因は単なる無知です。

2022-04-03 14:16:21

#統計 さらに、ベイズ統計について誤解誘導的な解説(ベイズ統計に関する大部分の解説がミスリーディング)を読んで信じてしまった人は、最近のイベルメクチン論文でベイズ統計が使われているのを見て、「ベイズ統計だと通常の統計学とは解釈が変わってしまう!」と騒ぎたくなるかもしれません。

2022-04-03 14:18:55

#統計 しかし、件のイベルメクチン論文の場合には、数学的理由によって、ベイズ統計を使っても使わなくてもほぼ同じ結果になることが保証されている場合になっており、ベイズ統計の事後分布を使った方がリスク比の区間推定の実装が圧倒的に平易な場合にもなっています。同じ結果が楽に得られる。

2022-04-03 14:23:57

#統計 新型コロナウイルスにどの薬が有効かに関する研究は我々人類にとって影響が大きな研究になるので、結果を発表するときに分かりやすさにも気を使うべきだと思います。続く

2022-04-03 14:27:20

#統計 リスク比の区間推定をベイズ統計の事後分布によるサンプル生成によってシンプルに行ったことを論文に書いておけば、私のようなど素人であっても同じ区間推定を10分程度で再現できます。 同じことをP値を使ってやろうとするとかなり大変になります。リスク比の区間推定の方法は色々あって複雑。

2022-04-03 14:30:46

#統計 添付画像は最近のイベルメクチン論文 https://t.co/4MEr0uLgwi のSupplementary Appendixのp.9です。 二項分布+一様事前分布のベイズ的な統計モデルを使っており(最も易しいベイズ統計の例!)、リスク比の区間推定はベータ分布の事後分布の乱数を100万個生成して行ったと書いてあります。

2022-04-03 14:41:45

#統計 この3行が視界に入れば、件の論文のTable 2(添付画像①)にある数値を使って、Supplementary AppendixのFigure S6(添付画像③)とそこに書いてあるベイズ版信用区間(この場合には通常の信頼区間に実質的に等しいと思ってよい)を10分程度で再現(添付画像③はその「清書」版)できます。

2022-04-03 14:46:25

#統計 私はたまに新型コロナウイルス関連の統計分析の再現をこっそり試みているのですが、以上で紹介したケースは今までやった中で最も易しい場合になった。 同じ結果を出せなくて苦しむ方が普通。私のようなど素人であっても簡単に同じ結果を再現できるように論文を書いてくれると非常にありがたい。

2022-04-03 14:49:48

#統計 10分でFigure S6の信用区間を再現できるという主張は誇張ではないことは以下のコードを #Julia言語 で実行すれば分かります。 using Distributions N = 10^6 a,m,c,n = 100,679,111,679 X = rand(Beta(1+a, 1+m-a), N) ./ rand(Beta(1+c, 1+n-c), N) quantile.(Ref(X), (0.5, 0.025, 0.975))

2022-04-03 15:12:56

#統計 #R言語 の場合 N <- 10^6 a <- 100 m <- 679 c <- 111 n <- 679 RR <- rbeta(N, 1+a, 1+m-a) / rbeta(N, 1+c, 1+n-c) q <- quantile(RR, c(0.025, 0.5, 0.975)) print(q) これを3回やればFigure S6にあるベイズ版信用区間を再現可能。 こんなに簡単に結果を再現できるのはベイズ統計だから。

2022-04-03 15:39:51

#統計 以上の例を見れば、統計モデルが非常にシンプルでかつ対応する通常のP値版の統計分析法があったとしても、ベイズ統計を使うことにメリットがあることがわかると思います。 こういう事実を「ベイズ統計は異なる主義思想哲学に基き、解釈も異なる」のような言説がおおい隠しており、かなり有害。

2022-04-03 15:41:44

#統計 しかし、通常のP値についても理解していなければ、シンプルなモデルでのベイズ統計を使っても通常のP値版分析と(ほぼ)同じ結果が得られることを理解できないし、他人に説明するときにも困ります。 このスレッドの最初で紹介した動画はベイズ統計ユーザーにとっても価値があります。

2022-04-03 15:45:29

#統計 ベイズ統計でのパラメータθの事後分布が単峰型になっているとき、仮説θ=θ₀の両側検定のP値の類似物を「事後分布で計算したθ≤θ₀の確率とθ≥θ₀の確率の小さい方の2倍」で定義できます。 P値についてしか知らない人であっても、これを知っていると、ベイズ統計が怖くなくなると思います。

2022-04-03 16:31:12

#統計 片側検定のP値のベイズ統計での類似物はさらにわかりやすいです。 仮説θ≤θ₀の片側検定のP値の類似物を「事後分布で計算した仮説θ≤θ₀が成立する確率」で定義できます。 仮説θ≤θ₀の片側検定のP値のベイズ的類似物は事後分布内でその仮説が成立する確率になるのでわかりやすい。

2022-04-03 17:01:33

#統計 P値のベイズ的類似物の以上の定義が「正しい」定義であることを示すためには、P値のベイズ的類似物と通常のP値が近い値になることを確認する必要があります。 コンピュータで計算して確認すると十分に「正しい」ことを納得できると思います。

2022-04-03 17:06:01

#統計 上では両側検定のP値のベイズ的類似物を「事後分布における片側確率に2倍」で定義しましたが、添付画像の下段のように定義することもできます。 一般に確率の2倍は確率ではなくなるので、P値の類似物を確率にしたければ後者がよいのですが、前者と比較して実装がかなり面倒になります。 https://t.co/Pf7wnAbdlf

#統計 ベイズ統計でのパラメータθの事後分布が単峰型になっているとき、仮説θ=θ₀の両側検定のP値の類似物を「事後分布で計算したθ≤θ₀の確率とθ≥θ₀の確率の小さい方の2倍」で定義できます。 P値についてしか知らない人であっても、これを知っていると、ベイズ統計が怖くなくなると思います。

2022-04-03 18:38:10

#統計 1つ前のツイートに述べたことは、ベイズ的でない場合の通常のP値や信頼区間を定義するときにも問題になることです。 「両側検定のP値を片側検定のP値の2倍で定義するべきだ」とする不合理な議論が(日本語圏に限らず)はびこっているので要注意。 本当はトレードオフの問題にしかなりません。

2022-04-03 18:42:51

#統計 母比率の信頼区間では古典的な  Clopper-Pearsonの信頼区間 が  P値を片側確率の2倍で定義する流儀 に対応しており、  Sterneの信頼区間 が  P値を以下の添付画像の②で定義する流儀 に対応しています。Sterneの信頼区間の方が大抵狭くなります。

2022-04-03 19:29:03

#統計 添付画像はSterneの信頼区間の原論文 Sterne (1954) https://t.co/ckcFV0Oo7k より。 母比率のClopper-Pearsonの信頼区間は片側確率の2倍という確率にならない値を正確に計算する流儀のせいで、Sterneの信頼区間と比較すると多くの場合に無駄に広くなります。 実装はCPの側が圧倒的に楽。

2022-04-03 19:32:02

#統計 検定における検出力や信頼区間における被覆確率のような道具の性能を表す指標を悪化させる代わりに伝統(←これは不合理)や実装のシンプルさを取るなら、Clopper-Pearsonの流儀を採用し、逆ならSterneの流儀を採用すればよい。 トレードオフの問題でしかない。 そしてnが大きければ大差ない。

2022-04-03 19:35:20

#統計 #R言語 Rのbinom.testが表示するP値はSterneの流儀で、信頼区間はClopper-Pearsonの流儀なので、整合性がありません。 Rのfisher.testが表示するP値と信頼区間にも同様の不整合がある。 どうしてこういう整合性に欠ける仕様にしたかが不思議。論文での報告のための道具としてはひどい欠点。 https://t.co/8HnFNbUpdd

#統計 #R言語 デフォルトの binom.test(8, 20, p = 0.2) の結果は P値 0.04367 95%信頼区間 [0.1911901, 0.6394574] 帰無仮説 0.2 でP値と信頼区間が不整合! library(exactci) binom.exact(8, 20, p = 0.2) なら、binom.testの信頼区間に合わせた P値 0.06429 ≥ 0.05 が得られ、続く

2022-04-03 20:41:47

#統計 5%やら95%のような科学的に無意味な閾値にこだわることは非科学的であり、みんなが当然ダメだと思うようにならないとまずいと思うのですが、表裏一体のはずの  P値と信頼区間の整合性を壊す仕様😰 にするのはやめた方が良いと思う。

2022-04-03 20:46:28

#統計 #R言語 binom.testとfisher.testで表示されるP値と信頼区間の不整合は、それらの代わりに、 library(exactci)のbinom.exact library(exact2x2)のexact2x2 を使えば解決する。plot=TオプションをつければP値函数をプロットしてくれる優れもの! https://t.co/1EMZKYiMGt

#統計 #R言語 library(exactci)のbinom.exactやlibrary(exact2x2)のexact2x2ではplot=TRUEオプションをつけるとP値函数をプロットしてくれます。 P値函数のプロットの使い方については以下のリンク先を参照。Rothmanさん達の疫学の教科書に書いてある話。 https://t.co/YsSwnsQmJK

2022-04-03 21:21:47

#統計 既出の図を改訂合体させて、  通常のP値 と  ベイズ統計でのP値の類似物 の説明を比較できるようにして、これらの違いと類似を認識し易くしてみた。 「ベイズ統計は通常の統計学とは異なる主義思想哲学に基く」 の様に解説することを否定して、こういう話をもっとした方が良いと思う。

2022-04-04 01:45:26

#統計 P値が定義されると「P値がα以上になるパラメータの全体」として通常の信頼区間も定義され、同様にしてベイズ統計でのP値の類似物からベイズ版信用区間が得られます。 だから、通常の信頼区間とベイズ版信用区間の比較は、通常のP値とベイズ統計でのP値の類似物の比較と同じになります。

2022-04-04 01:49:07

#統計 そのとき注意するべきことの1つは、平坦事前分布の事後分布が尤度函数の定数倍になることを理由に、平坦事前分布のベイズ統計は尤度函数を使う頻度論と同じになるというような過剰に単純化されたデタラメな考え方をしないことです。 そう単純な話ではない。

2022-04-04 01:52:13

#統計 通常のP値は統計モデル内の標本分布における確率(もしくはその近似値)として定義され、それと比較されるべきそのベイズ統計でのP値の類似物はベイズ的な統計モデル内の事後分布における確率(もしくはその近似値)として定義されます。 確率として定義される舞台(確率分布)が全然違うことに注意!

2022-04-04 01:56:09

#統計 通常のP値とそのベイズ統計での類似物の定義は全然違っていて、それらの比較はそれなりに非自明な問題になります。 こういう話の理解は数学が強くないと相当に厳しいと思うので、まずはコンピュータで具体的な場合の計算をして両者を比較して感覚をつかむべきだと思います。

2022-04-04 01:58:56

#統計 「通常の信頼区間とベイズ版信用区間を比較せよ」という問題は、「ベイズ版信用区間を生み出すベイズ統計でのP値の類似物を新たに定義して、通常のP値と比較せよ」という問題に書き換えられます。 後者の問題の方が数学的に扱い易いし、コンピュータでプロットして確認することも容易です。 https://t.co/UwjziSIotj

#統計 P値が定義されると「P値がα以上になるパラメータの全体」として通常の信頼区間も定義され、同様にしてベイズ統計でのP値の類似物からベイズ版信用区間が得られます。 だから、通常の信頼区間とベイズ版信用区間の比較は、通常のP値とベイズ統計でのP値の類似物の比較と同じになります。

2022-04-04 11:35:05

#統計 『数理統計学』と題された売れ線の教科書には、P値(検定)と信頼区間が表裏一体であることの解説がしっかり書いてあります。 その考え方はベイズ統計における信用区間にも適用できます。上で述べたベイズ統計でのP値の類似物はそのようにして定義を見つけました。 https://t.co/VfRsCgv9Hm

#統計 一般に○○検定の勉強には受験勉強特有の深い理解に踏み込もうとしなくなるリスクがあると思うのですが、仮説検定と信頼区間の双対性(表裏一体性)が 竹内啓『数理統計学』 竹村彰通『現代数理統計学』 久保川達也『現代数理統計学の基礎』 に書いてあることを知ればリスクを下げられるかも。 https://t.co/SXhI5mRAKG

2022-04-04 11:39:31

#統計 ベイズ統計ではないP値や信頼区間に関する解説の多くが、ベイズ統計を理解するときにも役に立ちます。 最尤法やAICなどの話題になると、ベイズ統計を理解するためにさらに役に立つ知識になります。 敵は「ベイズ統計は異なる主義思想哲学に基く」という考え方を他人に強制して来た人達。

2022-04-04 11:45:14

#統計 P値函数のグラフは、横軸をパラメータ、縦軸をP値とするグラフになるのですが、信頼係数1-αの信頼区間の両端の値(横軸)をすべての有意水準α(縦軸)についてプロットしたものになっています。 P値函数全体のグラフは有意水準や信頼係数のような閾値を設けない場合のP値や信頼区間のグラフになる。 https://t.co/ZizczttRUm

#統計 最近のイベルメクチン論文 https://t.co/4MEr0v2jyi ではベイズ統計を使っていますが、 https://t.co/0QnpIQD3K0 で示したように使わなくても結果は同じです。 青と赤と黒の線が通常のP値函数、オレンジとシアンと灰色の線が件の論文に登場する事後分布から作ったP値函数の類似物から得た結果。 https://t.co/sAXuu52ApY

2022-04-04 13:05:31

#統計 正規分布近似でP値を定義することが非常に多いので、それも追加した。 https://t.co/rMyVG0dscl

#統計 通常のP値は統計モデル内の標本分布における確率(もしくはその近似値)として定義され、それと比較されるべきそのベイズ統計でのP値の類似物はベイズ的な統計モデル内の事後分布における確率(もしくはその近似値)として定義されます。 確率として定義される舞台(確率分布)が全然違うことに注意!

2022-04-04 22:19:19

#統計 1つ前のツイートの添付画像中の図の清書版 両側検定のP値の作り方のパターン * 片側確率の2倍 * 確率もしくは確率密度がデータ以下のモデル内事象の確率の足し上げ * 正規分布近似 https://t.co/8CkQfwVUL7

2022-04-04 22:27:46

#統計 nuisanceパラメータがある場合に標本分布からP値を作る手続きは数学的にややこしくなり、『数理統計学』と題された売れ線の教科書には、そのための道具(完備十分統計量の話など)が載っている。 しかし、ベイズ統計の方法を使うとその辺の取り扱いが非常にシンプルになる。

2022-04-04 22:27:47

#統計 件のイベルメクチン論文 https://t.co/4MEr0uLgwi では、ベイズ統計の方法でリスク比の区間推定を行なっているお陰で、nuisanceパラメータの問題に悩まされずに、極めてシンプルな方法で計算をすませている。 再現も10分で可能! https://t.co/2rimebWhjZ

2022-04-04 22:33:05

#統計 リスク比(=相対リスク)の推定の問題について説明します。 薬Aを与えた側では「ひどい目」に会う確率がpで、与えなかった場合の確率がqであるという統計モデルにおいて、pとqをリスクと呼び、ρ = p/q をリスク比(または相対リスク)と呼びます。 続く

2022-04-04 23:25:35

#統計 リスク比が1より小さければ薬Aに効き目があることになる。 薬Aを与えた側はm人中のa人が「ひどい目」にあっていて、与えなかった側はn人中c人が「ひどい目」にあっていたというデータが得られたときの、リスク比(相対リスク)を推定したい。 非常にシンプルな設定です。続く

2022-04-04 23:25:36

#統計 高校生レベルの確率論を知っていれば、ひどい目に会う確率がpのm人中の何人が実際にひどい目に会うかは、二項分布でモデル化できることを実質的に知っているとみなせます。 二項分布モデルの最尤法を使えば、m人中a人が「ひどい目」にあったというデータから、pはp̂ = a/mで点推定されます。

2022-04-04 23:25:36

#統計 qは同様に q̂ = c/n で点推定される。 だから、リスク比は ρ̂ = p̂/q̂ = (a/m)/(c/n) で点推定されます。 しかし、これらの点推定は、データの確率的ゆらぎの情報を含んでおらず、現実の意思決定をするためには不十分な情報に過ぎません。続く

2022-04-04 23:25:37

#統計 データの確率的ゆらぎによって、以上で行ったリスク比の点推定の誤差がどれだけ大きくなりそうかを見積もる必要がある。(そのための方法がP値や信頼区間やベイズ統計の方法です。)

2022-04-04 23:25:37

#統計 そのためには、 2つの二項分布の積Binomial(m, p)×Binomial(n, q)内において、リスク比の推定量ρ̂ = (a/m)/(c/n)がモデル内リスク比ρ = p/qと確率的にどれだけ違う値になるかを知る必要があります。

2022-04-04 23:25:38

#統計 しかし、 2つの二項分布の積モデルでの確率分布はリスク比ρだけでは決まらず、q (またはp)の値にも依存します。 興味があるパラメータであるリスク比ρ以外のパラメータの値を決めないと、ρとその推定量ρ̂の確率的関係が決まらない。 こういう状況のときにnuisanceパラメータがあると言います。

2022-04-04 23:25:38

#統計 nuisanceパラメータは実際にうざいパラメータであり、このうざいパラメータが存在する場合を取り扱うための道具だてが、『数理統計学』と題された売れ線の教科書の中で扱われているわけです(十分統計量の話)。

2022-04-04 23:25:39

#統計 私は件のイベルメクチン論文でベイズ統計の方法でリスク比を区間推定している部分を、通常のP値や信頼区間で扱うために最尤法のWilksの定理を使った実装を採用しました。 多分、予備知識がないと https://t.co/0QnpIQVcY8 のコードで最も謎な部分になる。なぜか2次方程式を解いている(笑)

2022-04-04 23:33:03

#統計 Binominal(m,p)×Binomial(n,q)における通常のP値や信頼区間に関する処方箋によってnuisanceパラメータの問題を解決して、リスク比(相対リスク)の信頼区間を得ることはひと仕事になります。 この部分をベイズ統計の方法を使えば瞬殺できるわけです!

2022-04-04 23:36:10

#統計 ベイズ統計の方法を使えば、パラメータpとqの事後分布が得られ、したがってリスク比ρ=p/qの事後分布も得られます。リスク比の確率分布が得られました。 やっていることは通常のP値や信頼区間とは全然違いますが、この場合には数値的にほぼぴったり同じになります。 https://t.co/0QnpIQVcY8

2022-04-04 23:40:39

#統計 この場合のリスク比の通常の信頼区間とベイズ統計の方法で求めた信用区間の近似的な一致(実践的に違いは無視できる程度に小さい)は、偶然ではなく、数学的に根拠があるものです。 数学における解析学の重要な教えに、定義が全く異なる量の値が近似的に等しくなる場合があることがあります。

2022-04-04 23:44:47

#統計 この場合には、ベイズ統計の方法を使っても使わなくても結果は同じになります。そして、計算の仕方はベイズ統計の方法の方が圧倒的にシンプルで分かりやすい。

2022-04-04 23:46:15

#統計 ベイズ統計の方法でのリスク比の区間推定の計算がどれだけシンプルであるかは、以下のリンク先のコード(リンク先の次のツイートにR言語版がある)を見ればすぐに分かると思います。 謎の2次方程式を解いて漸近的なχ²検定統計量を作る必要はありません。しかも数値的にほぼ同じ結果が得られます。 https://t.co/2rimebWhjZ

#統計 10分でFigure S6の信用区間を再現できるという主張は誇張ではないことは以下のコードを #Julia言語 で実行すれば分かります。 using Distributions N = 10^6 a,m,c,n = 100,679,111,679 X = rand(Beta(1+a, 1+m-a), N) ./ rand(Beta(1+c, 1+n-c), N) quantile.(Ref(X), (0.5, 0.025, 0.975))

2022-04-04 23:53:32

#統計 二項分布モデルは無作為抽出(独立同分布性)という仮定を含み、このスレッドで扱った現実的な場合では、ほぼ確実にぴったりそのまま正しいとは言えないモデルになります。続く

2022-04-05 00:03:40

#統計 論文のSupple. Appendixにある以下の図に、intention-to-treat, modified intention-to-treat, per-protocolの3つのグラフが載っていることは、モデルがぴったり現実のデータ生成の仕方を記述していないことが原因の失敗の可能性を減らすための処方箋の1つだとみなされると思います。

2022-04-05 00:03:43

#統計 この手の現実のデータは確実に偏っている点に注意が必要です。 データがどのように偏っている可能性があるかは、データの数値を見ただけでは絶対にわからない。当該分野特有の専門知識が決定的に重要。

2022-04-05 00:06:20

#統計 このスレッドのトップで紹介した佐藤俊哉さんの解説動画(リンクをたどれば佐藤俊哉さんの別の動画も視聴できる)は、データは確実に偏っていると思った方がよいことと、その事実と統計モデルの取り扱いの関係を強調した説明になっており、その手のことはそのままベイズ統計でも重要になります。

2022-04-05 00:15:07

#統計 P値についての誤解の解説は他にもたくさんありますが、佐藤俊哉さんの解説動画と違って、単なる初歩的な誤解を扱っているだけで、統計学の使用において普遍的に重要な事柄から大きくずれているものが多いと思う。 佐藤俊哉さんの解説はP値だけではなくベイズ統計でも役に立ちます。

2022-04-05 00:18:50

#統計 件のイベルメクチン論文の事後分布のグラフFigure S6のRothmanさん達の疫学の教科書ですすめているP値函数版に変換したものが添付画像のグラフです(既出)。 現論文のベイズ版を変換したものと私が実装したP値函数を同時プロットしている。ほぼぴったり重なっている。 https://t.co/0QnpIQVcY8

2022-04-05 00:26:11

#統計 #Julia言語 せっかく作った動画なので放流。 二項分布モデルの場合の、3つの通常のP値函数と3つのベイズ統計でのP値函数の類似物を同時プロット。 n=40なので結構一致しています。 https://t.co/8CkQfwVUL7

2022-04-05 00:34:03

#統計 通常のP値函数を正規分布で作ったものだけにした場合の動画。

2022-04-05 00:35:11

訂正 ❌n=40なので結構一致しています。 ⭕️n=40なのに結構一致しています。 意味が逆。😭 #統計 n=1000でkが小さい場合の動画 ↓ https://t.co/lOc7koMOJs

#統計 #Julia言語 せっかく作った動画なので放流。 二項分布モデルの場合の、3つの通常のP値函数と3つのベイズ統計でのP値函数の類似物を同時プロット。 n=40なので結構一致しています。 https://t.co/8CkQfwVUL7

2022-04-05 01:11:33
シェア

私については https://t.co/4Rn1NBazJQ と https://t.co/WbWjr95AmF と https://t.co/P7WOMn2ay1 と https://t.co/ouhJUcBE7E を見て下さい。

ツイノートは、Twitterのスレッドをまとめるサービスです。まとめたいスレッドの最後のスレッドに「@twinotes まとめて」と返信するとまとめが作成されます

関連するスレッド

黒木玄 Gen Kuroki @genkuroki
14572022-06-20 20:20:05

#統計 (1) これ↓を見て、フィッシャーの正確確率検定(やピアソンのχ²検定)をいきなり適用しようとした人はちょっとまずすぎ。 (2)あと「ベイズ」とか言っている人達もかなり変なことを言っている人が目立つ感じ。 解説に続く。 https://t.co/YuHHZ4umUC

黒木玄 Gen Kuroki @genkuroki
5272022-07-28 11:41:13

#統計 https://t.co/jDabzRCSms 生態学におけるAICの誤用 : AICは正しいモデルを選ぶためのものではないので正しいモデルを選ばない 粕谷 英一 2015 へのコメント そこで扱われている場合は、本質的に  有意水準15.7%の検定では、真のモデルを約15.7%で棄却する と同じです。続く https://t.co/KIDWuTJ2I0

黒木玄 Gen Kuroki @genkuroki
5282022-08-26 23:05:06

#統計 東大出版会の『統計学入門』を信頼できる教科書だと思ってしまうと、ミスリーディングな解説を受け入れてひどいことになるので要注意。 信頼区間、尤度、パラメトリック、…、基本概念達についてことごとくミスリーディングな解説が並んでいる。 信頼区間の解説のまずさの説明に続く。 https://t.co/DOrKVqjOcN

黒木玄 Gen Kuroki @genkuroki
34019552022-03-02 10:50:00

#統計 何度も「これはいい!」と言っているのですが、 https://t.co/eoKrk67JZ7 京都大学大学院医学研究科 聴講コース 臨床研究者のための生物統計学「仮説検定とP値の誤解」佐藤 俊哉 医学研究科教授 は非常にいいです。 特に大学で統計学の入門的講義をしている人達はこれをみておくべき。

黒木玄 Gen Kuroki @genkuroki
9322022-07-15 11:19:23

#統計 「統計的に有意でない」の真の意味は「判断を保留する」です。 しかし、「統計的に有意でない」という言い方の強い響きによって「統計的には意味がない」のように誤解されがちだと思う。 さらに、「判断を保留する」と言うだけだと、「何にも分からなかった」という誤解を生むかもしれない。 https://t.co/IkV7sYNjBJ

黒木玄 Gen Kuroki @genkuroki
2182022-09-22 19:26:25

#統計 参考になります。 なるほど、準一級のワークブックにこういう書き方がしてあるせいで、ノンパラメトリック検定について誤解する人達が継続的に生産され続けているのか! 青線と橙線及び青字と橙字は私による。 Wilcoxonの順位和検定では、母集団分布について非常に強い仮定を使います。 https://t.co/MfD0v58Pz9

黒木玄 Gen Kuroki @genkuroki
132022-09-19 16:23:38

#統計 ううむ、ヒストグラムはビンの取り方によって全然違う印象のグラフが出来上がることは、教育のどこかの段階で強調しなければいけないことだと思うのですが、ググってもよい解説を見つけることができないでいます。 よい解説があったら教えて下さい。

covid-19 i Sverige @living_sweden
1012682022-02-22 05:43:34

これは大変な問題です。 JAMAに掲載されたマレーシアの論文がイベルメクチンが無効だと結論付けているのですが イベルメクチン群の28日以内の院内死亡率が対象群と比較して69%も低下しているのです! オッズ比0.31 P値0.09 人工呼吸器装着率も59%低下! オッズ比0.41 P値0.17 https://t.co/Uep9bqxL8A

仙人Hermit @Z4dxQW4fSWableD
791252021-08-11 01:23:02

#アビガン #イベルメクチン #PMDA アビガンの有効性は判断できないと言う厚労官僚、 イベルメクチンは有効性が確認できないと言う医師 そういう厚労官僚や医師は間違っているということを示すPMDAの内部報告書を要約して記載する https://t.co/KWWDrqp4Vy https://t.co/p4lU1qoLY1

Shirai @inform_ts
8842022-09-03 18:43:59

はっきり申し上げます。ワクチンの添付文書には、もちろん記載されております。これは、毒として作用しない範囲になります。ワクチン接種後の有害事象と因果関係の定義の違いをご説明いただけますか? https://t.co/Usuje3gioo

ののわ @nonowa_keizai
171728472022-10-02 21:54:06

発足早々各方面から批判を集めている日本ファクトチェックセンター。週末ツイッターを眺めてたら ファクトチェック: 「沖縄県知事選3ヶ月前から那覇市だけでも100人以上人口増」は不正確 との記事が流れてきました。 https://t.co/vz0dUE646H

influenzer @influenzer3
1362222022-03-12 19:38:34

●欧州でオミクロン株とデルタ株の組み換え型、「デルタミクロン」が発生している →プレプリントですが、気になるので取り上げておきます。 欧州で分離された15株を系統樹上で提示し、これが昨年12月に発生した事を推定しています。

倉持仁 @kuramochijin
216365122022-05-21 13:00:47

みなし陽性、感染爆発期に医師が診断するなら良いですが、保健所がみなしたり、自分で抗原検査してみなしたり、そんな事が横行。診断は医師しかできないはずですが、そんなの関係なく無症状と勝手に診断し、治療が受けられない!きちんとした統計学的データも取れず、薬ワクチン効果の検証もできない

influenzer @influenzer3
5648732022-05-14 20:39:51

●オピニオン:Long COVIDのリスクを無視するな! →今回は、ワシントンポストに掲載されたopinionを取り上げます。 著者は米国のCOVID-19諮問委員会の委員歴のあるペンシルバニア大学のi医療倫理学者。 「パンデミックは終わった」とする社会の空気に警鐘を鳴らす内容になっています。

プログラミングに興味のある医療従事者が結構多いので、自分がどのようにして学習してきたかをまとめておきます。3年半の軌跡です。ちなみに高額なプログラミングスクールを薦めることはありませんのでご安心下さい(そもそも通ったことない) (▶︎続く)

mizuki_tohru @mizuki_tohru
2735152022-08-01 21:21:09

ロシアの偵察衛星は、解像度33センチのペルソナ(Персона:人)衛星のうち生きているのが1機、怪しいのが1機、後はロシア版ALOSのバー(Барс)Mが解像度1.1mで3機、デュアルユースで解像度2.1mのカノープス(Канопус)Vが6機という構成が現状です。

再現性の危機 https://t.co/zYNF8u8fzi >1500人の科学者を対象にした2016年の調査によれば…[4]。 化学: 90% (60%)  生命科学: 80% (60%)  物理学と工学: 70% (50%)  医学: 70% (60%)  地球科学と環境科学: 60% (40%) /メモ引用。

ᅟ ⁠ @5fLRVU7TTzNEwM7
002022-05-15 05:01:34

シャニマス G.R.A.D. ノウハウブック掘り 狙うアビリティ:(Le○◎) (Ce○◎) Vi○◎ オルラン○◎ スローダッシュ (除去メラン12) (ひかえめ) (Me回復量+) 思い出高低 ※括弧は取れたら取る カタストロフ連打路線

仙人Hermit @Z4dxQW4fSWableD
51842022-06-25 18:23:50

COVID UPDATE: What is the truth? "医師が早期治療を行うことが許されていれば、これらの死の殆どは防げたはずだ " 権威ある科学専門誌「SNI - Surgical Neurology International」に掲載された論説記事「COVID UPDATE: What is the truth?」の筆者、 1/ https://t.co/mfcTeJsmt3

説教おじさん @partyhike
46837622022-07-29 13:28:29

コロナで42万人も死なないし、東京は2週間後にNYにならないし、子供が1000人以上死ぬこともないんだよ。日本にはもう2年半分のデータの蓄積があるんだから、日本のコロナは日本のデータで語ろうよ。