コロラド先生の計算はまちがっていない話（PCR検査の感度と独立事象）

noteにエントリを公開しました。

以下に転載しておきますが、誤記修正や修文などはnoteのほうに行いますので、できるだけnoteのエントリを参照してください。

また、問題を提起された「コロラド先生」の本が出ますので、よければどうぞ。

誰が日本のコロナ禍を悪化させたのか?

牧田寛

1,400円(01/09 19:37時点)

Amazon

■ そもそも

そもそも話の発端は、日本に新型コロナウイルスが上陸してきた当時、国内でも「PCR検査を広く行うべきかどうか」という議論でした。

PCR検査を広く実施すれば、体の不調を感じている人のウイルス感染を判定できるだけでなく、気付かずに感染している人も発見できますので、市中への感染拡大を早期に防止することができます。

もちろん全国すべての人を一斉に検査するのは無理なのですが、少なくとも自分の感染を疑っている人や、新型コロナの初期症状に当てはまる人だけでもPCR検査を実施して、拡大を早期に止めることが、市中感染の拡大抑止には有効です。

ところが、日本だけは、なぜか「積極的なPCR検査はしてはいけない」という珍説が流布され、感染対策を誤った結果、たいへんなことになってしまいました。このへんの話をコロラド先生こと牧田寛さんが書かれたのが、下の記事です。
なぜ日本だけが囚われる「PCR検査抑制デマ」が生まれたのか？　その根源に迫る

また、本も出るようなので、よかったら読まれるといいと思います。

リンク

■ この記事の目的

どうしてこんなことになったのかは、前掲の記事にも書かれていますし、本も出されるので、そちらを読んでいただくのも良いと思います。
しかし、そうした説明ではなかなか納得できない人も多いです。

世の中には、まじめに説明しても「話が長い」「難しい」「ややこしい」「一言で説明して」とかいう人が出てきますし、そもそも思い違いをしている人たちが繰り返し珍説を振り回すので、話についていけなくなる人が続出します。
Twitterでは、そういう不毛なやりとりが繰り返され、僕も暇なときは相手の言い分を聴いてみたりします。

しかし、コロラド先生の説明を否定する人の多くは、もはや「言い分」などというものはなく、単に「コロラド先生は独立事象として計算しているが、それは違うような気がする」と思っているだけなのです。

そこで、このエントリでは、話をわかりやすく説明してみようと思います。

■ 大砲とサイコロの話

コロラド先生の前掲記事では、大砲の命中率がたとえ話として出てきます。
大砲の命中率、すなわち「既知の確率」が5%なら、9発撃てば40%弱になるという話です。

具体的に計算すると、外れる確率 0.95 なので、9発撃つと 0.95^9 ≒ 0.63 が1発も当たらない確率です。
つまり、1-0.63=0.37 、少なくとも1発は当たる確率は37%ですね。

コロラド先生は変なところで真面目なので、このたとえ話にも補足説明を加えていますが、これでも頭が付いていけない人や、時間のない人にとって、余計な話のような気がします。

ここでは単純に、50%が命中するミサイルを考えます。
この「ミサイルの命中率」をPk（Probability of Kill）と呼んでいて、その数値は実際の戦闘シミュレーションでも使用されます。

Pk=0.5（50%が当たる）であることが既知であるミサイルを2発撃てば、先ほどと同じ計算で、75%は当たる、と考えるのです。
これは、サイコロを2回振ったとき、1回でも「1」が出る確率を計算するのと同じです。
つまり、それぞれの確率は「独立事象」として扱います。

確率の「独立事象」とは、複数の試行を行う場合、ある確率が他の試行結果の影響を受けないということです。
1回目に撃ったミサイルが当たろうが外れようが、ミサイルの性能は変わりませんので、そのミサイルの命中率は50%のままです。
（今回の結果をミサイルの命中率に反映するのは別の話です。）

サイコロだって、1回目に「1」の目が出たからと言って、「このサイコロは100％の確率で「1」が出るイカサマ・サイコロだ！」と言い出す人がいたら、たぶん頭おかしいです。

しかし、もし本当に100%の確率で「1」が出るサイコロだったりしたら？
ミサイルの命中率50%が、もし机上計算だけの話だったら？

こうした場合は、1/6とか50%という「確率」は既知のものではありませんので、実際の結果を大量に積み重ねて「確率」を検証しなければいけません。
さきほど言った「既知の確率」とは、そういうふうに確定された「確率」だということです。

ミサイルの場合は、発射試験や過去の実績をPkとしますが、実際の戦場では相手も変わってきますので、そうした新しい実績を採り入れながら、シミュレーションで使用するPkを決めていきます。

■ その確率ってなんなのか

コロラド先生の示した「計算」における「確率」は、PCR検査の「感度」です。病気がある群での検査の陽性率（真陽性率）を検査の感度と言います。
つまり、PCR検査の感度とは、新型コロナ罹患者の中から、正しく陽性者を判定できる確率です。

コロラド先生の記事では、こう書かれています。

さて、確かに検体採取の制限から、SARS-CoV-2におけるPCR検査の感度は、痰で70%強、鼻腔スワブ液で60%強と高感度というわけではありません。鼻咽頭スワブ液は、痰に近い感度を持つようですが、保守的に65%強程度と想定します。唾も同様に65%程度と想定します。

当時の実績が70～60%（低い）と言われていたで、そのへんの数値を既知の確率として計算しています。（現在では100%に近い感度が得られているのが実情のようです）

そして、痰検体（70%）と鼻腔スワブ検体（65%）で検査すれば、89.5%の感度（確率）になるというのが、問題とされている「計算」です。

（陰性と誤判定する確率 0.3 × 0.35 = 0.105 なので、89.5%が「感度」）

■ 従属事象ではない

さて、先の計算にある70%と65%が「従属事象」だという人がいます。
（間違いです）

確率論の従属事象というのは、「複数の試行を行う場合、ある確率が他の試行結果の影響を受ける」ということです。
つまり、従属事象だと言うことは「痰検体を検査した結果、鼻腔スワブ検体に対する検査感度が変わる」ということです。

これは少し考えるとおかしいことに気付きます。
1万人のコロナ罹患者を検査して、7000人あるいは6500人が陽性の結果になる、というのが70%と65%の意味ですから、1回の試行結果が、正しく陽性判定、または誤って陰性判定であっても、次に行う検査の感度が変わるわけはないのです。

ところが、この「従属事象」という概念を誤解している人がいます。

https://twitter.com/tsukuru_ouu/status/1294972077120688140

これは、ある感染者について、1回目の検査が陽性（陰性）だったら、2回目（別の検査）で陽性（陰性）である確率が変わるだろう、ということです。
しかし、既知の検査感度が変わるわけではないので、まったく間違っています。

■ 反証が反証になっていない例

こんな例を持ち出す人がいたのですが、これはこれで面白いので、参考にお目にかけます。

これは30人の感染者に3種類のPCR検査を実施しています。
すると、次のような結果になりました。
・自己採取の鼻腔スワブ・・・・12名陽性判定
・医師採取の鼻腔スワブ・・・・11名陽性判定
・医師採取の咽頭スワブ・・・・11名陽性判定

すると、陽性判定が出た感染者は、それぞれの検査で重複しているため、30人の感染者中、12名しか検出できなかった、というものです。

もちろん、これをそれぞれのPCR検査感度と見なし、確率の独立事象として計算するのは間違いです。

大砲やミサイルの命中率に例えると、外れる射撃の中には、射程距離外の的を撃ってしまったものも混じっているでしょう。それらも含めての命中率なのです。もし、そういう「射程外の的」に何度繰り返し射撃を行っても、その的に当たる確率は上がりません。
また、世の中にたくさんあるサイコロの中には、「1」の目が出る確率がゼロに近い個体があって、それを何度振っても「1」は出ないかもしれません。しかし、世の中のサイコロすべてを統計的に見て、「1」の目が出る確率が1/6であると既知であれば、その確率計算は「独立事象」として扱うのです。

（ちなみに、この例で言えることは、検体を自己採取しても、医師によって採取しても、あまり違わないよね、ということですね。）

■ おわりに

とりあえず、思いついたことの一部を、できるだけ簡単にまとめました。

そのうち、書き足したりすることもあると思いますが、あまり長々といろんなことを書くと、結局「読まれない」記事になってしまうので、ほどほどのところにしてあります。

「コロラド先生の計算はまちがっていない話（PCR検査の感度と独立事象）」への1件のフィードバック

twitter 使わないのでここに投下します（細切れになるのが嫌なので。なりすまし除けにidだけ作っといた）。

本題に関しては、複数の検査をした結果の表を作ってそれぞれの間の相関を扱うことができるモデルを考えるのは勝手だけど、そのモデルを使うためにはどういう測定が必要で、その結果どれだけ誤差が減ると思っているのかを、彼ら自身が示さないと意味がないということで終わってます。「東京から大阪に新幹線で行くのにかかる時間を求めるのにニュートン力学を使うのは誤りで、速度に応じて時間や空間が縮むのを考慮したモデルを使え。でもどれだけ縮むのかよくわかってないけどな」という主張を「科学的」だとは言えないということです。独立として計算したときの誤差に関しては、当時感度を70%まで下げていた原因の主要なものが検体採取ミスということは明らかで、これは検査ごとに独立とみなせるため、計算結果の誤差が無視できる量だろうというのは妥当な判断でしょう。

さて、このコメントの本題はそこではなく、ウイルス量が鼻と痰で相関するから鼻と痰の検査結果は従属で、二つの検査後に陽性と判定できる可能性は70～90%とか言ってますが、数学的に誤ってます、という話です。

単純化のために検体採取ミスの可能性は除いて考えます。

ウイルス量が鼻で100万、痰で100万のケース: 40%、検査結果はどちらも陽性
ウイルス量が鼻で1000,痰で0(検出限界以下)のケース: 30%、検査結果は鼻陽性、痰陰性
ウイルス量が鼻で0(検出限界以下),痰で1000のケース: 30%、検査結果は鼻陰性、痰陽性
両方0(検出限界以下)のケース: 0%、検査結果は両方陰性

という結果が得られたとします。

このような結果は、感染する可能性がある場所が鼻か喉(痰)で、感染の初期は最初に感染したところでウイルスが増殖し、ウイルス量が増えてくると両方に広がる場合に得られます。

両方陰性の結果が存在しないのは、感染者を対象にしていることが前提なので不思議なことではありません(両方陰性という結果が得られた場合、感染している根拠がないので感染者ではないと判断しているということ)。両方陰性のケースを考える場合は、検査で陰性しか出ていない人をなぜ感染者とみなせるかを検討する必要が発生します。別の検査で陽性という結果が得られるという話なら、それも含めて3つの検査で3次元の表がつくれて、結局、全検査で陰性の項目の数は０になり、以下同様の議論が適用できます。

この例では、鼻と痰のウイルス量は正の相関があります。そして、鼻で陰性の結果が出た場合、痰で陽性が出る可能性は100%です。なぜこんなことが起きるかというと、感度について議論しているため、どこかは感染しているのが前提で、鼻からウイルスが検出されなかった場合、喉だけ感染していることが確定するためです。「二つの箱の少なくとも一つに玉が入っている」という条件があるときに、片方の箱を開けて何も入ってなければもう一つの箱に玉が入っている確率は100%になります。それと同じです。

感度について議論している場合、感染しているという前提が検査結果に影響することには注意が必要です。感染者という条件があるとき、二つ目の検査の結果は一つ目の検査に従属していて、一つ目の検査で陰性という結果が出たときに二つ目の検査で陽性が得られる可能性は上がります。(牧田さんの例では、感度を下げている主要な原因が検体採取ミスという前提で、これは検査ごとに独立とみなせるという話なので、影響があるとしても検体採取ミスより小さそうだし、陽性率が上がる方向なので無視するのは妥当)

上で示した例に対して、両方の検査で陰性の結果が得られた事例の数を追加していくと、鼻の検査で陰性が得られたときに、痰の検査で陰性が出る可能性を0%から上げて100%に近づけることが可能です。独立、正の相関、負の相関、任意の結果が得られます。このとき、付け加えられるデータは、ウイルス量は鼻痰ともに測定限界以下になるため、鼻と痰のウイルス量に正の相関があるという条件は変わりません。つまり、鼻の検査で陰性という結果が得られたとき、痰の検査結果の陽性率を決めるのは、ウイルス量の相関ではなく、両方の検査で陰性という結果が得られる事例の比率なのです。

両方の検査で陰性の事例の比率を増やせば、陰性の確率を高くできるのは当然です。そのような事例を追加する人は、追加した例が感染者と言える理由と、そのモデルが現実に得られている測定結果を説明できることを立証する必要があります。そのハードルをクリアできないなら、そのような主張はニセ科学に分類してかまわないでしょう。「感染しているという根拠はないけど、全検査で陰性が得られている事例の一部を適当に移動してきて、偽陰性が＊＊%ぐらいあると仮定すれば感度はこれぐらいになる」と主張しているのと同じなので。そのような主張に意味を認めることはできません。

以上、ウイルス量に正の相関があるという条件を満たしつつ、二つの検査後に陽性と判定できる確率が100%の事例が作れて、「二つの検査後に陽性と判定できる可能性は70～90%」は誤りということを示しました。「ウイルス量に相関があるから」とか言っている人は数学がわかってないと結論していいでしょう。「高校数学も理解できていないのか」というハッタリが痛々しいです。

返信

flekram へ返信するコメントをキャンセル

flekram より:

2021年8月1日 19:12

twitter 使わないのでここに投下します（細切れになるのが嫌なので。なりすまし除けにidだけ作っといた）。

本題に関しては、複数の検査をした結果の表を作ってそれぞれの間の相関を扱うことができるモデルを考えるのは勝手だけど、そのモデルを使うためにはどういう測定が必要で、その結果どれだけ誤差が減ると思っているのかを、彼ら自身が示さないと意味がないということで終わってます。「東京から大阪に新幹線で行くのにかかる時間を求めるのにニュートン力学を使うのは誤りで、速度に応じて時間や空間が縮むのを考慮したモデルを使え。でもどれだけ縮むのかよくわかってないけどな」という主張を「科学的」だとは言えないということです。独立として計算したときの誤差に関しては、当時感度を70%まで下げていた原因の主要なものが検体採取ミスということは明らかで、これは検査ごとに独立とみなせるため、計算結果の誤差が無視できる量だろうというのは妥当な判断でしょう。

さて、このコメントの本題はそこではなく、ウイルス量が鼻と痰で相関するから鼻と痰の検査結果は従属で、二つの検査後に陽性と判定できる可能性は70～90%とか言ってますが、数学的に誤ってます、という話です。

単純化のために検体採取ミスの可能性は除いて考えます。

ウイルス量が鼻で100万、痰で100万のケース: 40%、検査結果はどちらも陽性
ウイルス量が鼻で1000,痰で0(検出限界以下)のケース: 30%、検査結果は鼻陽性、痰陰性
ウイルス量が鼻で0(検出限界以下),痰で1000のケース: 30%、検査結果は鼻陰性、痰陽性
両方0(検出限界以下)のケース: 0%、検査結果は両方陰性

という結果が得られたとします。

このような結果は、感染する可能性がある場所が鼻か喉(痰)で、感染の初期は最初に感染したところでウイルスが増殖し、ウイルス量が増えてくると両方に広がる場合に得られます。

両方陰性の結果が存在しないのは、感染者を対象にしていることが前提なので不思議なことではありません(両方陰性という結果が得られた場合、感染している根拠がないので感染者ではないと判断しているということ)。両方陰性のケースを考える場合は、検査で陰性しか出ていない人をなぜ感染者とみなせるかを検討する必要が発生します。別の検査で陽性という結果が得られるという話なら、それも含めて3つの検査で3次元の表がつくれて、結局、全検査で陰性の項目の数は０になり、以下同様の議論が適用できます。

この例では、鼻と痰のウイルス量は正の相関があります。そして、鼻で陰性の結果が出た場合、痰で陽性が出る可能性は100%です。なぜこんなことが起きるかというと、感度について議論しているため、どこかは感染しているのが前提で、鼻からウイルスが検出されなかった場合、喉だけ感染していることが確定するためです。「二つの箱の少なくとも一つに玉が入っている」という条件があるときに、片方の箱を開けて何も入ってなければもう一つの箱に玉が入っている確率は100%になります。それと同じです。

感度について議論している場合、感染しているという前提が検査結果に影響することには注意が必要です。感染者という条件があるとき、二つ目の検査の結果は一つ目の検査に従属していて、一つ目の検査で陰性という結果が出たときに二つ目の検査で陽性が得られる可能性は上がります。(牧田さんの例では、感度を下げている主要な原因が検体採取ミスという前提で、これは検査ごとに独立とみなせるという話なので、影響があるとしても検体採取ミスより小さそうだし、陽性率が上がる方向なので無視するのは妥当)

上で示した例に対して、両方の検査で陰性の結果が得られた事例の数を追加していくと、鼻の検査で陰性が得られたときに、痰の検査で陰性が出る可能性を0%から上げて100%に近づけることが可能です。独立、正の相関、負の相関、任意の結果が得られます。このとき、付け加えられるデータは、ウイルス量は鼻痰ともに測定限界以下になるため、鼻と痰のウイルス量に正の相関があるという条件は変わりません。つまり、鼻の検査で陰性という結果が得られたとき、痰の検査結果の陽性率を決めるのは、ウイルス量の相関ではなく、両方の検査で陰性という結果が得られる事例の比率なのです。

両方の検査で陰性の事例の比率を増やせば、陰性の確率を高くできるのは当然です。そのような事例を追加する人は、追加した例が感染者と言える理由と、そのモデルが現実に得られている測定結果を説明できることを立証する必要があります。そのハードルをクリアできないなら、そのような主張はニセ科学に分類してかまわないでしょう。「感染しているという根拠はないけど、全検査で陰性が得られている事例の一部を適当に移動してきて、偽陰性が＊＊%ぐらいあると仮定すれば感度はこれぐらいになる」と主張しているのと同じなので。そのような主張に意味を認めることはできません。

以上、ウイルス量に正の相関があるという条件を満たしつつ、二つの検査後に陽性と判定できる確率が100%の事例が作れて、「二つの検査後に陽性と判定できる可能性は70～90%」は誤りということを示しました。「ウイルス量に相関があるから」とか言っている人は数学がわかってないと結論していいでしょう。「高校数学も理解できていないのか」というハッタリが痛々しいです。

返信

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください。