Multivariable analysis
by Makoto Kaneko MD, MClSc (Family Medicine), PhD
今回はLogistic and Multivariable Regressionという授業で事前課題として
と
https://www.ahajournals.org/doi/full/10.1161/CIRCULATIONAHA.106.682658
Optional readingとして
の2つが挙げられています。
には
多変量解析: Multivariable analysisをなぜ用いるのか?:複数の変数を調整し、交絡を取り除き、曝露とアウトカムの因果関係を推論する
多変量解析の種類: 大きく分けると下記の3つがあります
・multiple linear regression: アウトカムが連続変数の場合
・multiple logistic regression: アウトカムが2値の場合
・Cox回帰(比例ハザードモデル): アウトカムが発生するまでの期間を考慮する生存時間分析で複数の変数を調整する場合
多変量解析の前提
・multiple linear regressionでは説明変数とアウトカムが線形の関係にある、という前提がある(そうでない時は対数化やスプラインを用いることがある)
・multiple logistic regressionについては後述
・Cox回帰:2群間のハザード比が時間に限らず常に一定であること
モデルの適合性をどの様に確認するか?
などについて一つ一つ書かれています。
もう一つのロジスティック回帰分析の論文
https://www.ahajournals.org/doi/full/10.1161/CIRCULATIONAHA.106.682658
では
一つ目の論文に近い内容がロジスティック回帰分析にfocusして紹介されています。
例えば
ロジスティック回帰分析は
・アウトカムが2値で、複数の変数を調整したいときに用いられる
・カテゴリー変数、連続変数含めて調整変数に含めることが出来る
・調整変数が連続変数の場合は、「1単位増えるごとのオッズ比の変化が線形である」という前提がある→それが成り立たない場合は連続変数をカテゴリー変数に分けて用いる方が望ましい(スプラインを用いる場合もある)
・ロジスティック回帰分析の結果は通常オッズ比として表現され、解釈される
・ロジスティック回帰分析のサンプルサイズはアウトカムの少ない方の数×10を目安にする
・モデルの適合度を見るための指標として、R squared, Hosmer and Lemeshow test evaluatesなどがある
・アウトカムを2値でなく3値以上の場合はロジスティック回帰分析を拡張した多項ロジスティック回帰分析を用いることもある
ということが例を挙げながら書かれています。