C-statistik: Definition, exempel, viktning och betydelse

Dela på

ROC-kurva > C-statistik

Du kanske vill läsa denna artikel först:

Vad är en C-statistik?

C-statistik

Korrespondensstatistiken är lika med arean under en ROC-kurva.

C-statistiken (ibland kallad ”concordance”-statistik eller C-index) är ett mått på god anpassning för binära resultat i en logistisk regressionsmodell. I kliniska studier anger C-statistiken sannolikheten för att en slumpmässigt utvald patient som drabbats av en händelse (t.ex. en sjukdom eller ett tillstånd) hade en högre riskpoäng än en patient som inte drabbats av händelsen. Den är lika med arean under ROC-kurvan (Receiver Operating Characteristic) och sträcker sig från 0,5 till 1.

  • Ett värde under 0,5 indikerar en mycket dålig modell.
  • Ett värde på 0,5 innebär att modellen inte är bättre än slumpen på att förutsäga ett resultat.
  • Värden över 0,7 indikerar en bra modell.
  • Värden över 0,8 indikerar en stark modell.
  • Värde 1 innebär att modellen perfekt förutspår de gruppmedlemmar som kommer att uppleva ett visst utfall och de som inte kommer att göra det.

C-statistiken används inte så ofta eftersom den bara ger en allmän uppfattning om en modell; en ROC-kurva innehåller mycket mer information om noggrannhet, känslighet och specificitet.

Viktning

Ett viktat c-index används när kostnaden för att misslyckas med att förutsäga ett positivt utfall (t.ex. ett test för cancer) är högre än nyttan av att korrekt förutsäga ett negativt utfall. Viktning straffar modeller som resulterar i små sannolikhetsskillnader för positiva och negativa utfall, men ändrar inte värdet på C-statistiken. Det kan också användas för att justera för stratifierat slumpmässigt urval.


Statistisk signifikans

Som de flesta statistiska uppgifter är C-statistiken ibland kopplad till ett konfidensintervall. Du kan till exempel ha ett resultat på 0,63 med ett konfidensintervall som sträcker sig från 0,53 till 0,73). I allmänhet är ett resultat inte signifikant om det innehåller 0,5, även om det innehåller den relevanta C-statistiken. Ett resultat på 0,63 med ett konfidensintervall som sträcker sig från 0,43 till 0,83 skulle till exempel inte vara signifikant eftersom det inkluderar 0,5 i det intervallet.

Referens:
Hosmer DW, Lemeshow S. Applied Logistic Regression (2nd Edition). New York, NY: John Wiley & Sons; 2000.


CITE THIS AS:
Stephanie Glen. ”C-Statistic: Definition, exempel, viktning och betydelse” från StatisticsHowTo.com: Elementär statistik för oss andra! https://www.statisticshowto.com/c-statistic/

——————————————————————————

Har du behov av hjälp med en läxa eller en provfråga? Med Chegg Study kan du få steg-för-steg-lösningar på dina frågor från en expert inom området. Dina första 30 minuter med en Chegg-handledare är gratis!

Lämna en kommentar