ROC-Kurve > C-Statistik
Diesen Artikel sollten Sie vielleicht zuerst lesen: Was ist eine ROC-Kurve (Receiver Operating Characteristic)?
Was ist eine C-Statistik?
Die Konkordanzstatistik ist gleich der Fläche unter einer ROC-Kurve.
Die C-Statistik (manchmal auch als „Konkordanz“-Statistik oder C-Index bezeichnet) ist ein Maß für die Anpassungsgüte binärer Ergebnisse in einem logistischen Regressionsmodell. In klinischen Studien gibt die C-Statistik die Wahrscheinlichkeit an, dass ein zufällig ausgewählter Patient, bei dem ein Ereignis (z. B. eine Krankheit oder ein Zustand) eingetreten ist, einen höheren Risikowert aufweist als ein Patient, bei dem das Ereignis nicht eingetreten ist. Sie entspricht der Fläche unter der ROC-Kurve (Receiver Operating Characteristic) und reicht von 0,5 bis 1.
- Ein Wert unter 0,5 weist auf ein sehr schlechtes Modell hin.
- Ein Wert von 0,5 bedeutet, dass das Modell ein Ergebnis nicht besser vorhersagen kann als der Zufall.
- Werte über 0,7 weisen auf ein gutes Modell hin.
- Werte über 0,8 weisen auf ein starkes Modell hin.
- Ein Wert von 1 bedeutet, dass das Modell perfekt vorhersagt, welche Gruppenmitglieder ein bestimmtes Ergebnis erleben werden und welche nicht.
Die C-Statistik wird nicht sehr häufig verwendet, da sie nur einen allgemeinen Eindruck von einem Modell vermittelt; eine ROC-Kurve enthält viel mehr Informationen über Genauigkeit, Sensitivität und Spezifität.
Gewichtung
Ein gewichteter C-Index wird verwendet, wenn die Kosten für die Nichtvorhersage eines positiven Ergebnisses (z. B. eines Krebstests) höher sind als der Nutzen der korrekten Vorhersage eines negativen Ergebnisses. Die Gewichtung bestraft Modelle, die zu kleinen Wahrscheinlichkeitsunterschieden für positive und negative Ergebnisse führen, ändert aber nicht den Wert der C-Statistik. Sie kann auch zur Anpassung an geschichtete Zufallsstichproben verwendet werden.
Statistische Signifikanz
Wie die meisten Statistiken ist die C-Statistik manchmal mit einem Konfidenzintervall gepaart. Zum Beispiel könnte ein Ergebnis von 0,63 mit einem Konfidenzintervall von 0,53 bis 0,73 vorliegen.) Im Allgemeinen ist ein Ergebnis nicht signifikant, wenn es 0,5 einschließt, auch wenn es die relevante C-Statistik einschließt. Zum Beispiel wäre ein Ergebnis von 0,63 mit einem KI zwischen 0,43 und 0,83 nicht signifikant, weil es 0,5 in diesem Bereich einschließt.
Referenz:
Hosmer DW, Lemeshow S. Applied Logistic Regression (2nd Edition). New York, NY: John Wiley & Sons; 2000.
Stephanie Glen. „C-Statistik: Definition, Beispiele, Gewichtung und Signifikanz“ von StatisticsHowTo.com: Elementare Statistik für den Rest von uns! https://www.statisticshowto.com/c-statistic/
——————————————————————————
Brauchen Sie Hilfe bei einer Hausaufgabe oder einer Prüfungsfrage? Mit Chegg Study können Sie Schritt-für-Schritt-Lösungen für Ihre Fragen von einem Experten auf dem Gebiet erhalten. Ihre ersten 30 Minuten mit einem Chegg Tutor sind kostenlos!