n=5の臨床研究から学ぶ
昨日4年生のゼミで測定の話や統計の話をしていたときに提供した話題。
6月30日の産経新聞WEB版によれば、病腎移植の臨床研究が始まるとのこと。
徳洲会グループによると、7月15日に外部の専門家を交えた徳洲会グループ共同倫理委員会で承認されるとみられる臨床研究計画書に、第三者間における病腎移植の手術手順などを明記。そのうえで「腎がん患者をドナーとする移植を5年以内に少なくとも5件実施する」(能宗事務総長)との計画を盛り込むという。
臨床研究の結果、病腎移植が腎臓移植の新しい技術としての成果が得られれば、厚労省に対し患者の入院費用などが医療保険で支払われるよう求める。
一般の人が新聞を読めば、良い結果が出れば保険適用になるのかもしれないと考えるかもしれないですが、研究者の立場からすると、そういう結果を出すことは理論的に困難だと言えます。
たとえば、下の左図に示したように5件の病腎移植と15件の生体腎移植の結果を示します。移植の場合術直後の拒絶反応などが多いので、生存率曲線は右の図のようになるかと思います。仮に病腎移植は5年間5人が全員生存したとします。
![]()
![]()
このような生存率曲線の違いを判定するために一般的にはLog Rankテストという方法が取られますが、実際に計算するとP=.163と一般的に用いられる有意水準を5%とした場合には、有意な違いが見られないということになります。グラフでは明確に違いがあるように見えますが、こういうことは偶然に起こりうると統計学的には説明できるということです。
このデータをコピペして、サンプル数を10件と30件に増やすと、Log Rankテストの結果はP=.045と有意になります。
実際には病腎移植をした結果、途中で亡くなる方も出てくるでしょうから、この生存率の差を科学的(統計学的)に明らかにすることは、最初から困難だと言えるでしょう。
サンプル数と検出力の関係を理解するのにとてもよい機会であったと思います。
私自身が懸念しているのは、臨床研究において、新しい治療法が従来の治療法に比べ明らかに悪い結果の場合に、研究を打ち切らなければいけないのですが、検出力が弱いため、この場合の判定も困難にする点ではないかと思います。
もっとも考え方を変えて、対照群に末期の腎不全患者を持ってきて、全員が1年以内になくなるようなデータを持ってきたら、病腎移植は意味があるということになるでしょう。
これはあくまでも研究としての話で、この臨床研究で、臨床的に救われる患者さんがいるのだとすれば、そこまで否定することではありません。
ただ、この研究で治療法が良いとか悪いとかを検討することは難しいだろうということと、そのことをマスコミが吟味した感じもなく報道していることは覚えていたほうがよいと思います。

