ROC-curve > C-Statistic
Je kunt dit artikel misschien beter eerst even lezen: Wat is een Receiver Operating Characteristic (ROC)-curve?
Wat is een C-Statistic?
De concordantiestatistiek is gelijk aan het gebied onder een ROC-curve.
De C-statistiek (soms de “concordantie”-statistiek of C-index genoemd) is een maat voor de goodness of fit voor binaire uitkomsten in een logistisch regressiemodel. In klinische studies geeft de C-statistiek de waarschijnlijkheid aan dat een willekeurig geselecteerde patiënt die een gebeurtenis (bv. een ziekte of aandoening) doormaakte, een hogere risicoscore had dan een patiënt die de gebeurtenis niet had doorgemaakt. Hij is gelijk aan het gebied onder de Receiver Operating Characteristic (ROC)-curve en varieert van 0,5 tot 1.
- Een waarde onder 0,5 wijst op een zeer slecht model.
- Een waarde van 0,5 betekent dat het model een uitkomst niet beter voorspelt dan het toeval.
- Waarden boven 0,7 wijzen op een goed model.
- Waarden boven 0,8 wijzen op een sterk model.
- Een waarde van 1 betekent dat het model perfect voorspelt welke groepsleden een bepaalde uitkomst zullen ervaren en welke niet.
De C-statistiek wordt niet vaak gebruikt, omdat deze alleen een algemeen beeld geeft van een model; een ROC-curve bevat veel meer informatie over nauwkeurigheid, gevoeligheid en specificiteit.
Weging
Een gewogen c-index wordt gebruikt wanneer de kosten van het niet voorspellen van een positieve uitkomst (zoals een test op kanker) hoger zijn dan de baten van het correct voorspellen van een negatieve uitkomst. Weging bestraft modellen die resulteren in kleine waarschijnlijkheidsverschillen voor positieve en negatieve uitkomsten, maar verandert de waarde van de C-statistiek niet. Het kan ook worden gebruikt om te corrigeren voor gestratificeerde aselecte steekproeven.
Statistische significantie
Zoals de meeste statistieken, wordt de C-statistiek soms gekoppeld aan een betrouwbaarheidsinterval. U kunt bijvoorbeeld een resultaat van 0,63 hebben met een betrouwbaarheidsinterval van 0,53 tot 0,73). In het algemeen is een resultaat niet significant als het 0,5 omvat, zelfs als het de relevante C-statistiek omvat. Bijvoorbeeld, een resultaat van 0,63 met een CI variërend van 0,43 tot 0,83 zou niet significant zijn omdat het 0,5 in dat bereik omvat.
Reference:
Hosmer DW, Lemeshow S. Applied Logistic Regression (2nd Edition). New York, NY: John Wiley & Sons; 2000.
Stephanie Glen. “C-statistiek: Definition, Examples, Weighting and Significance” (Definitie, voorbeelden, weging en significantie) van StatisticsHowTo.com: Elementaire Statistiek voor de rest van ons! https://www.statisticshowto.com/c-statistic/
——————————————————————————
Heb je hulp nodig bij een huiswerk- of toetsvraag? Met Chegg Study kunt u stap-voor-stap oplossingen voor uw vragen krijgen van een expert op dit gebied. Uw eerste 30 minuten met een Chegg-leraar zijn gratis!