« 人間と科学 第332回 医療統計学リテラシー(4) ② | トップページ | Report 2022 Student Dentist ① »

2022年5月 6日 (金)

人間と科学 第332回 医療統計学リテラシー(4) ③

続き:

(4)アウトカムが連続変数の場合その分布は正規分布であるか?

  正規分とは、データの分布が平均値に近い値の患者が一番多く、平均値から離れるに従って左右対称に数が減っていくような釣鐘型の分布のことをいう。大抵の医療データは正規分布に従わない。入院日数、入院費用、検査値、薬の使用量などはすべて歪んだ分布を取る。正規分布であればスチューデントの t 検定のようなパラメトリック検定、そうでなければマンホイットニー検定のようなノンパラメトリック検定が選ばれる。

(5) グループ間で比較を行うとき 2 つか 3つ以上か?

  血圧を表す変数が正規分布に従う場合、男女のような対応のない 2 群間で血圧を比べる場合はスチューデントの t 検査が使えるが、白人・黒人・アジア人など、対応のない 3 郡以上の群間で比べる場合は分散分析(ANOVA) が用いられる。この場合、血圧の分布が正規分布に従わなければクルスカルワリス検定が用いられる。

(6) サンプルの総数は?

  新薬と既存薬を投与した対応のない 2 群間で、生存者の割合( 2 値変数)を比べる場合は、総症例数が 40 以上あればピアソンのカイ二乗検定が使えるが、20 未満の場合はフィッシャーの直接確率検定を使う。20 以上 40 未満の場合は、新薬群の生存者と死亡者数、既存薬群の生存者と死亡者の数の 1つでも 5 未満の数がある場合はフィッシャーの直接確率検定を使う。

 最近では無料の統計ソフトの R をベースとした EZR (Easy R) などで、自動的に正しい検定手法を判断し、データの集計と比較を自動で行ってくれるありがたい機能もあり、動画で詳細を見ることができる。

 また統計ソフトを用いた解析には、データ入力の仕方を学ぶ必要があるので、ビデオも併せて見ることもできる。

 

« 人間と科学 第332回 医療統計学リテラシー(4) ② | トップページ | Report 2022 Student Dentist ① »

日記・コラム・つぶやき」カテゴリの記事