この記事をご覧いただき、ありがとうございます。この記事は病気の原因を調べるための研究分野である「疫学研究」の基礎を知ることを目的に書きました。疫学論文を読んで理解するための最低限の知識を得ることを目的に書いています。疫学という言葉をはじめて言葉を聞くような方に向けて書いているので、専門家やご自身の研究で必要な情報を探しているという方にとっては物足りないかもしれませんが、ご了承ください。
この記事を書いている私のプロフィールはこちらにのっています。この記事では、症例対照研究(Case-Control study)について紹介をします。個人的には、症例対照研究はメチャクチャ難しいと思っていて、とくにコントロールの決め方についてはこのブログを読んで理解したと思わずに、デザインを考えたところで、ちゃんと分かる方とディスカッションしてから進めたほうが良いと思います。
それでは早速、本文の方に入っていきたいと思います。
ケースコントロール研究のデザイン
概要
初めに、ある病気と曝露に何か関連があるな?と思ったらどんな調査をするでしょうか?例えば肺がんで入院する成人男性の多くが喫煙者だったとします。肺がん患者の喫煙者割合が80%以上なら、関連があると言えるでしょうか?
80%も喫煙者なら関連があるだろうと思うかもしれませんが、これは科学的な判断とは言えません。なぜならば、肺がんではない人の喫煙率が分からないからです。今では違和感があるかもしれませんが、1950年頃であれば、男性のほとんどがたばこを吸っていたので、成人男性ならば、肺がんでない人でも80%以上の喫煙率だったでしょう。
つまり、1950年代であれば、上の説明だけでは肺がんと喫煙に関連があるとは言い切れないのです。
ではどうするのか?これはとてもシンプルで、肺がんにならなかった人での喫煙率を調べて比較すればよいのです。このようにある病気に罹患した場合とそうでない場合の曝露の分布を比較して解析することを症例対照研究(ケースコントロール研究)と言います。
ケースコントロール研究のデザイン
ケースコントロール研究では病気に罹患した場合をケース、そうでない場合をコントロールと呼びます。そしてケースの集団とコントロールの集団それぞれで曝露の割合を比較します。
曝露の割合の計算は、ケース、コントロールそれぞれで曝露がありの人数をそれぞれの集団の合計人数で割ります。一般的には、下記のようにケース、コントロール、曝露あり、曝露なしの四分割表を作成して計算します。
曝露歴 | ケース(疾病あり) | コントロール(疾病なし) |
曝露歴あり | a | b |
曝露歴なし | c | d |
合計 | a+c | b+d |
曝露歴ありの割合 | a/(a+c) | b/(b+d) |
例えば、喫煙と肺がんであれば、下記のようになります(参考文献2より改変引用)。
曝露歴:喫煙歴 | ケース:肺がん患者 | コントロール:肺がんなし |
<1日平均15本 | 551 | 760 |
≧1日平均15本 | 806 | 597 |
合計 | 551+806=1,357 | 760+597=1,357 |
ヘビースモーカーの割合 | 806/1,357=0.59 | 597/1,357=0.44 |
このようにケースとコントロールそれぞれでヘビースモーカーの割合を計算し、比較することで初めて肺がんと喫煙の関係も説明がつくという訳です。
ケースとコントロールの選択
ケースコントロール研究ではこのケースとコントロールをどのようにとってくるか?と言うことがとても重要なポイントになります。
ちょっと考えれば、とても当たり前のことですが、ケースとコントロールの集団の背景因子がそろっている、つまり、疾患あり、なし以外の特徴がそろっていることが大前提となります。
ケースコントロール研究では珍しい疾患を扱うことも多いのでケースの選び方は選択肢が少ない場合が多いと思います。一方で、コントロールの選び方は色々と考えられる場合が多く、適切なコントロールの選び方というのは非常に難しいです。
個人的には、ケースコントロール研究で頭に入れておいた方が良い一番のポイントは、「コントロールの選び方は非常に難しく、非常に重要」ということに尽きると思っています。研究デザインが悪いと、解析にも影響しますし、論文を書くときにはもっと苦労します。
ケースを選ぶうえで一つポイントがあるとしたら、望ましくは新規症例を用いることです。既存症例の場合には治療行為も含め、病気になる前と明らかに異なる行動、状況となってしまいますので、病気の原因を知りたい場合には避けたほうが良いです。
コントロールの選び方としては、研究を行った同じ地域の一般住民やおなじ病院でケース以外の症例で入院している患者などから選ぶことができますが、これがケースと背景因子が同じ集団と言えるのか?というのが必ず議論になります。
例えば、広い地域患者が集まる大病院であれば、出身地域を完全にそろえるのは困難です。別の症例で入院している患者の場合には、ケース、コントロール以外の背景因子をそろえるのは困難です。そして、同時に、コントロールが一般集団を十分に反映しているかどうかもとても難しく、研究結果の解釈にも影響を及ぼします。
ケースの選び方もいくつか方法がありますが、良く行われる方法としてはマッチングがあります。これは、ケースと性別、年齢、地域など背景因子が同じ人を対応するように選ぶ方法になります。一人一人マッチングする場合もあれば、集団としてマッチングする場合もあります。また、近年では傾向スコアを用いたマッチングも多く行われます。
ケースとコントロールの選び方は、実際に研究を行う場合には専門書から学んだうえで、専門家のアドバイスももらうと良いと思います。
アウトカムの評価にはオッズ比を用いる
最後にケースコントロール研究で求めるオッズ比について紹介したいと思います。簡単にポイントを述べると、
- オッズとは曝露歴ありを曝露歴なしで割ったもの
- オッズ比とはケースとコントロールのオッズの比(基本的にはコントロールを1としたときのケースの値を用いる)
先ほど紹介した四分割表を使ってまた紹介したいと思います。
曝露歴 | ケース (疾病あり) | コントロール (疾病なし) |
曝露歴あり | a | b |
曝露歴なし | c | d |
オッズ | a/c | b/d |
オッズ比:a/c ÷ b/d = ad/bc
上記のように、ケース、コントロールそれぞれのオッズはa/c、b/dとなり、オッズ比は、ad/bcとなります。
ここで非常に重要なことはオッズ比は疾患の発生率比(リスク比)と近似するということです。ただし、オッズ比と発生率比が近似するには対象疾患の発生が稀であるという条件が満たされるときです。
本来発生率というのは、病気の発生率が分からなければ計算できない値ですがケースコントロール研究では、発生率も有病率も分からなくても、発生率比がケースとコントロールのそれぞれのオッズから簡単な式で求めることができるということは、単純な話なのに面白い点です。
一方でオッズ比を扱う上で注意すべきことは、オッズ比は原則、結果を誇張してしまいます。発生率の小さな疾病であれば、その影響は小さいのですが、いずれにしてもオッズ比=1.0から遠い値にシフトしてしまいます。オッズ比についてはまた詳細を紹介したいと思いますが、先ずはここに書いてある程度が頭に入っていれば良いのではないかなと思うところを紹介させていただきました。
参考資料