« 人間と科学 第333回 医療統計学リテラシー(5)―②  | トップページ | パンドラ文書を解読する (下) ④ »

2022年4月 1日 (金)

人間と科学 第333回 医療統計学リテラシー (5)―③

続き:

◎観察研究のデータから背景のそろった比較群を抽出する傾向スコアマッチング

 最近は、電子カルテやレセプトデータ等、何百何千万人というビッグデータを臨床研究に用いられるようになってきた。ビッグデータ解析などでよく使われる背景調整の手法に、傾向スコアによるマッチングがある。背景の揃っていない観察研究のデータから背景の揃った被験者のみを抜き出し、まるで無作為化されたようなデータを作り出す手法である。傾向スコアとは、複数の背景因子を一つの連続スコアに集約したもので、傾向スコアが同じ被験者をアスピリン使用群と非使用群からそれぞれ選びマッチングし、マッチされた症例のみを解析に用いる。背景が揃ったら、最終解析は無作為化研究のようにアウトカムを直接比較することができる。

 表 2に Gum の観察研究のデータからマッチングされた被験者のみを抜き出し、比較群の背景を示す。表 1と異なり、マッチング後の背景はまるで無作為化したかのように揃っているのが分かる。

 傾向スコアの「傾向」とは、背景情報から推測したそrぞれの被験者が研究対象となる治療を受けている確率である。例えば、より重篤な人のほうが治療を受けやすいといった場合は、傾向スコアは重篤スコアに類似する。治療あり・なし群など 2群を比較する場合の傾向スコアは通常、2値のロジスティック回帰モデルを用いて行う。無料の統計ソフトの EZR でもロジスティック回帰モデルの画面に傾向スコアを作成するというオプションがあり、またまたマッチングまで自動的に行うことができる。

« 人間と科学 第333回 医療統計学リテラシー(5)―②  | トップページ | パンドラ文書を解読する (下) ④ »

日記・コラム・つぶやき」カテゴリの記事