C-statistik: Definition, eksempler, vægtning og betydning

Del på

ROC-kurve > C-statistik

Du bør måske læse denne artikel først: Hvad er en ROC-kurve (Receiver Operating Characteristic)?

Hvad er en C-statistik?

C-statistik

Konordansstatistikken er lig med arealet under en ROC-kurve.

C-statistikken (undertiden kaldet “concordance”-statistikken eller C-indekset) er et mål for god tilpasning for binære resultater i en logistisk regressionsmodel. I kliniske undersøgelser angiver C-statistikken sandsynligheden for, at en tilfældigt udvalgt patient, der har oplevet en begivenhed (f.eks. en sygdom eller tilstand), havde en højere risikoscore end en patient, der ikke havde oplevet begivenheden. Den er lig med arealet under ROC-kurven (Receiver Operating Characteristic) og ligger mellem 0,5 og 1.

  • En værdi under 0,5 indikerer en meget dårlig model.
  • En værdi på 0,5 betyder, at modellen ikke er bedre til at forudsige et udfald end tilfældighederne.
  • Værdier over 0,7 indikerer en god model.
  • Værdier over 0,8 indikerer en stærk model.
  • En værdi på 1 betyder, at modellen perfekt forudsiger de gruppemedlemmer, der vil opleve et bestemt udfald, og dem, der ikke vil opleve et bestemt udfald.

C-statistikken bruges ikke særlig ofte, da den kun giver en generel idé om en model; en ROC-kurve indeholder meget mere information om nøjagtighed, sensitivitet og specificitet.

Vægtning

Et vægtet c-indeks bruges, når omkostningerne ved ikke at forudsige et positivt udfald (som f.eks. en test for kræft) er højere end fordelen ved at forudsige et negativt udfald korrekt. Vægtning straffer modeller, der resulterer i små sandsynlighedsforskelle for positive og negative udfald, men ændrer ikke værdien af C-statistikken. Det kan også bruges til at justere for stratificeret tilfældig stikprøveudtagning.


Statistisk signifikans

Som de fleste statistikker er C-statistikken nogle gange parret med et konfidensinterval. Du kan f.eks. have et resultat på 0,63 med et konfidensinterval, der spænder fra 0,53 til 0,73). Generelt er et resultat ikke signifikant, hvis det omfatter 0,5, selv om det omfatter den relevante C-statistik. F.eks. ville et resultat på 0,63 med et CI, der spænder fra 0,43 til 0,83, ikke være signifikant, fordi det omfatter 0,5 i dette interval.

Reference:
Hosmer DW, Lemeshow S. Applied Logistic Regression (2nd Edition). New York, NY: John Wiley & Sons; 2000.


CITER DENNE SOM:
Stephanie Glen. “C-Statistic: Definition, eksempler, vægtning og signifikans” Fra StatisticsHowTo.com: Elementær statistik for resten af os! https://www.statisticshowto.com/c-statistic/

——————————————————————————

Har du brug for hjælp til en lektielæsning eller et spørgsmål til en prøve? Med Chegg Study kan du få trin-for-trin-løsninger på dine spørgsmål fra en ekspert på området. Dine første 30 minutter med en Chegg-underviser er gratis!

Skriv en kommentar