C-statisztika:

Megosztás

ROC-görbe > C-statisztika

Ezt a cikket érdemes először elolvasni: Mi az a Receiver Operating Characteristic (ROC) görbe?

Mi a C-statisztika?

C-statisztika

A konkordancia-statisztika egyenlő a ROC-görbe alatti területtel.

A C-statisztika (néha “konkordancia” statisztikának vagy C-indexnek nevezik) a logisztikus regressziós modellben a bináris kimenetek illeszkedésének jóságát jelzi. Klinikai vizsgálatokban a C-statisztika megadja annak valószínűségét, hogy egy véletlenszerűen kiválasztott, egy eseményt (pl. betegséget vagy állapotot) átélt betegnek magasabb a kockázati pontszáma, mint egy olyan betegnek, aki nem élte át az eseményt. Ez megegyezik a Receiver Operating Characteristic (ROC) görbe alatti területtel, és 0,5 és 1 között mozog.

  • A 0,5 alatti érték nagyon rossz modellt jelez.
  • A 0,5-ös érték azt jelenti, hogy a modell a véletlenszerűnél nem jobb előrejelző a kimenetelre.
  • A 0,7 feletti értékek jó modellt jeleznek.
  • A 0,8 feletti értékek erős modellt jeleznek.
  • Az 1-es érték azt jelenti, hogy a modell tökéletesen megjósolja azokat a csoporttagokat, akik egy bizonyos kimenetet fognak tapasztalni, és azokat, akik nem.

A C-statisztikát nem használják túl gyakran, mivel csak általános képet ad a modellről; a ROC-görbe sokkal több információt tartalmaz a pontosságról, érzékenységről és specificitásról.

Súlyozás

A súlyozott c-indexet akkor használják, ha egy pozitív kimenetel (például egy rákvizsgálat) előrejelzésének elmaradásának költsége magasabb, mint a negatív kimenetel helyes előrejelzésének haszna. A súlyozás bünteti azokat a modelleket, amelyek kis valószínűségi különbségeket eredményeznek a pozitív és negatív kimenetelek esetében, de nem változtatja meg a C-statisztika értékét. Használható a rétegzett véletlen mintavételezés kiigazítására is.


Statisztikai szignifikancia

A legtöbb statisztikához hasonlóan a C-statisztikát néha konfidenciaintervallummal párosítják. Például egy 0,63-as eredményt kaphatunk egy 0,53 és 0,73 közötti konfidenciaintervallummal). Általában bármely eredmény nem szignifikáns, ha 0,5-t tartalmaz, még akkor sem, ha tartalmazza a vonatkozó C-statisztikát. Például egy 0,63-as eredmény 0,43-tól 0,83-ig terjedő CI-vel nem lenne szignifikáns, mert ebben a tartományban 0,5-öt tartalmaz.

Hivatkozás:
Hosmer DW, Lemeshow S. Applied Logistic Regression (2nd Edition). New York, NY: John Wiley & Sons; 2000.


CITE THIS AS:
Stephanie Glen. “C-statisztika: Definíció, példák, súlyozás és szignifikancia” From StatisticsHowTo.com: Elementary Statistics for the rest of us! https://www.statisticshowto.com/c-statistic/

——————————————————————————

Segítségre van szüksége egy házi feladathoz vagy tesztkérdéshez? A Chegg Study segítségével lépésről lépésre megoldásokat kaphat kérdéseire a terület szakértőjétől. Az első 30 perc egy Chegg oktatóval ingyenes!

Szólj hozzá!