C統計量。 定義、例、重み付け、有意性

Share on

ROC Curve > C-Statistic

最初にこの記事を読むとよいだろう。 C-統計量とは、ROC曲線の下での面積に相当します。

C-統計量(「コンコーダンス」統計量またはC-インデックスとも呼ばれます)は、ロジスティック回帰モデルにおけるバイナリ結果に対する適合度を表す指標です。 臨床研究では、C-統計量は、イベント(例えば、病気や状態)を経験した無作為抽出の患者が、イベントを経験していない患者よりも高いリスクスコアを持つ確率を示します。 これは、Receiver Operating Characteristic (ROC) 曲線の下の面積に等しく、0.5 から 1 の範囲です。

  • 0.5 より下の値は、非常に悪いモデルを示します。
  • 0.5 の値は、そのモデルがランダムチャンスより結果を予測するよりも良くないということを意味します。
  • 0.7以上の値は良いモデルを示す。
  • 0.8以上の値は強いモデルを示す。
  • 1の値は、モデルが特定の結果を経験するグループメンバーとそうでないメンバーを完全に予測することを意味している。

C統計量は、モデルについての一般的な考えを与えるだけなので、あまり使われません。

重み付け

加重C-インデックスは、正の結果(がんのテストのように)を予測できないコストが負の結果を正しく予測するメリットよりも高い場合に使用されます。 重み付けは、正と負の結果について小さな確率差をもたらすモデルを罰するが、C統計量の値は変えない。 また、層別無作為抽出の調整に使用することもできる。


Statistical Significance

ほとんどの統計と同様に、C 統計量は信頼区間と対になっていることもある。 例えば、0.63の結果と0.53から0.73の範囲の信頼区間がある場合があります)。 一般に、どんな結果も、たとえ関連するC統計量を含んでいても、0.5を含んでいれば有意ではありません。 例えば、信頼区間が0.43から0.83の範囲で0.63の結果は、その範囲に0.5が含まれるので有意ではないでしょう。

参考文献:
Hosmer DW, Lemeshow S. Applied Logistic Regression (2nd Edition). New York, NY: John Wiley & Sons; 2000.


CITE THIS AS:
Stephanie Glen. “C-統計”。 定義、例、重み付け、有意性” StatisticsHowTo.comより。 私たちのための初歩的な統計学 https://www.statisticshowto.com/c-statistic/

———————————————————-

Need help with a homework or test question? Chegg Studyでは、その分野の専門家からステップバイステップの解決策を得ることができます。 Cheggのチューターとの最初の30分間は無料です!

コメントする