ようこそ、米順医療統計情報クリニックホームページへ。
あなたは 番目の訪問者です!
集団からのサンプルを用いた症例・対象研究、コホート研究、介入研究などの関連解析での医療統計では、2グループ間の差、比を解析することが多いですが、この場合に分割表(偶現表)、またはクロス集計表を作成することが多くなります。最近はやりの生存率を使った有意差検定も、結局はイベントが起こるたびの分割表の有意差を計算して、それをすべてに渡って加えています。
分割表の有意差を計算する際の注意点がありますのでそれを述べてみたいと思います。
この関連解析ではどのようなパラメータを推定するとよいのでしょうか。例えば遺伝子BRCA1と疾病(乳がん)の関連を調べる場合には、
遺伝子多型としてBRCA1異変あり/なし、
形質として乳がん罹患あり/なしで、
4種類にグループに分けられることになります。ここで、まず関連を知りたいのは、BRCA1に異変があることによる乳がん罹患の確率、つまり
BRCA1に異変があることによる乳がんの発生人数
対
BRCA1に異変がある総人数
この割合ではないでしょうか。この比のことをリスクと言います。
そして、
BRCA1に異変がある場合のリスク
対
BRCA1に異変がない場合のリスク
この比のことをリスク比:RR(Risk Ratio)と言います。つまり、式で表すと少し長くなりますが、
BRCA1に異変があることによる乳がんの発生人数 / BRCA1に異変がある総人数
対
BRCA1に異変がないことによる乳がんの発生人数 / BRCA1に異変がない総人数
ここで注意が必要なのは、BRCA1に異変がある人数とBRCA1に異変がない人数に乳がん発症ありと乳がん発症なしの人数が加算されていると言うことです。これは、母集団からサンプリングをして、そのサンプリングからの計算により母集団の特性を推定することを考えると、乳がん発症あり人数と乳がん発症なし人数が母集団内でのその比率を正確に再現している必要があります。症例・対象研究、コホー ト研究、介入研究のなかで、コホート研究、介入研究は、その比率が保たれていると考えられますが、症例・対象研究の場合は症例数、対象数がそれぞれ別々に 集められることが多いためリスク比を計算することには問題が発生します。尚、コホート研究、介入研究でもサンプルの割り当てに同様な注意が必要です。
それでは、どのようなパラメータならば計算可能でしょうか。乳がん発症人数の中の人数の比較であれば問題ないと考えられ、リスクとの比較を考えると、
乳がん発症患者中のBRCA1に異変がある人数
対
乳がん発症総人数
が考えられますが、面白いことに、一般的にこの比を用いるのではなく、
乳がん発症患者中のBRCA1に異変がある人数
対
乳がん発症患者中のBRCA1に異変がない人数
この比が用いられ、これをオッズと言い、その
乳がん発症あり オッズ
対
乳がん発症なし オッズ
の比のことをオッズ比:OR(Odd ratio)と言います。
このオッズ比は、回帰分析との相性が良いために用いられることが多いのですが、数学的な都合より、人の受け取り方を優先すれば数学ももう少し身近に感じられるのではないかと感じられる例となります。
さらに、このオッズ比には、新たな注意が必要です。
それは、リスク比とオッズ比は、BRCA1に異変がある割合 が少ないと数値が
似通った値となり、10%を切るとほぼ同一とみなしてよい値となります。これゆえ、まれな遺伝子異変では、オッズ比を使うことが妥当なような記述が多いで
すが、しかしそれは必ずしも正しいわけでなく、オッズ比自体が意味をなさなくなる場合が多いので、サンプルの取り方などを考慮し慎重な検 討が必要です。
意味をなさない原因は、まず日本の選挙制のように、一票の格差があるからです、つまり
1/100と2/100の差と49/100の50/100差を比較しますと、
リスク比の場合の
2/100 – 1/100= 1/100= 0.01と50/100 – 49/100 = 1/100= 0.01と
オッズ比の場合の
2/98 – 1/99 = 0.01と50/50 – 49/51 =
0.02
が同等でないからです。
胃がんの解析の例
なんなりとお問い合わせ下さい。
お問い合わせ メールを送る:
詳細は以下です。
結局、次のような表に関しての有意差を計算することになります。
新薬の効果の場合
原因 | 結果 | 小計 | ||
効果あり | 効果なし | |||
新薬Aを投与 | a | b | a+b | |
プラセボを投与 | c | d | c+d | |
小計 | a+c | b+d | a+b+c+d |
BRCA1と乳がんの場合
原因 | 結果 | 小計 | ||
乳がん発症 | 乳がん非発症 | |||
遺伝子BRCA1を 持つ |
a | b | a+b | |
遺伝子BRCA1を 持たない |
c | d | c+d | |
小計 | a+c | b+d | a+b+c+d |
ここでリスクは、A=a/a+b,
C= c/c+d で、オッズはB=a/c, D=b/dで表され、
リスク比は、A/C =
a(c+d)/c(a+b)で、オッズ比は、B/D = ad/bc で表されます。
関連解析において推定すべきパラメータは、関連の強さ、つまり原因が結果に及ぼす影響の強さです。原因ごとの結果の確率、つまり新薬Aの投与による効果:a/a+bです。これをリスクと言います。リスクと言われるのは、例えばある遺伝子を持つことによる疾病の確率などに使われることが多いからです。
BRCA1と乳がんの場合は、遺伝子BRCA1を持つことによる乳がんの発症リスクとなりますが、下記説明するように、この割合が意味のない場合がありますので注意が必要です。
2013年度の乳ガン罹患者数は、女性総人口当たり0.09%、1万人中9名が乳がんに罹患したことになります。これより、上記テーブルを日本人の女性総人口を母数としたい場合は、(a+c) : (b+d) = 9 : 10,000 としなければいけません。しかし、一般的に症例・対象研究の場合は、乳がん罹患者と乳がん非罹患者を別々に集め、この比は満たしません。その場合は、a
: a+bや a : bが意味のない比となりますので、a
: a+cや a : cを計算することになります。
そこで、症例・対象研究の場合は、一般的に、オッズa : cを計算し、そのオッズの症例と対象の比、オッズ比OR(Odd ratio)、B/D = ad/bcを計算することになります。
一方、コホー ト研究、介入研究の場合はその比は群分けを適切に決定し、二重盲目を適切に行えば、a : a+bや a : bを計算することが出来、リスク比は、A/C =
a(c+d)/c(a+b)を計算することが出来ます。ただし、乳がん発症あり/なしのクラス分けの調査をした場合には、その結果に対して乳がんの発症割合、9 : 10,000を元に解釈をする必要性が出てくることが多くなりますので注意が必要です。
もう一つの注意は、この表自体が、原因と結果を表すわけではなく、そのデータを集める中にこの原因と結果を関連付けるものがなければいけません。つまり、原因と結果の因果関係はこの表を作成する前段階でなされていなければいけません。
また、RRとORは、効果あり、a、cの比率が少ないと数値が似通った値となり、10%を切るとほぼ同一とみなしてよい値となります。これゆえ、まれな疾病では、ORを使うことが妥当なような記述が多いですが、しかしそれは必ずしも正しいわけでなく、ORもRRも意味をなさなくなる場合が多いので、サンプルの取り方などを考慮し慎重な検討が必要です。
1/100と2/100の差と49/100の50/100差、
2/100 – 1/100= 1/100= 0.01と50/100 – 49/100 = 1/100= 0.01と
オッズ比の場合の
2/98 – 1/99 = 0.01と50/50 – 49/51 =
0.02が同等でないからです。
このようなデータの重み付けは、意図が明確で、明示的につけるならば良いですが、このように暗黙的に付くのは良いことではありません。
オッズ比の代わりに、a/(a+c)やb/(b+d)を使えばよいと思います。つまり、
乳がん発病者の遺伝子BRCA1を持つ人数:乳がん発病者数
対
乳がん非発病者の遺伝子BRCA1を持つ:乳がん非発病者数
を計算すればよいと思います。ただし、これは
遺伝子BRCA1を持つことによる乳がんの発症リスク
対
遺伝子BRCA1を持つ乳がん発症者数:遺伝子BRCA1を持つ総人数