C-Statistică: Definiție, exemple, ponderare și semnificație

Share on

Curba ROC > Statistica C

S-ar putea să doriți să citiți mai întâi acest articol: Ce este o curbă ROC (Receiver Operating Characteristic)?

Ce este o statistică C?

Statistica C

Statistica de concordanță este egală cu aria de sub o curbă ROC.

Statistica C (numită uneori statistica „concordanței” sau indicele C) este o măsură a bonității de potrivire pentru rezultatele binare într-un model de regresie logistică. În studiile clinice, statistica C oferă probabilitatea ca un pacient selectat aleatoriu care a experimentat un eveniment (de exemplu, o boală sau o afecțiune) să aibă un scor de risc mai mare decât un pacient care nu a experimentat evenimentul respectiv. Este egală cu aria de sub curba Receiver Operating Characteristic (ROC) și variază de la 0,5 la 1.

  • O valoare sub 0,5 indică un model foarte slab.
  • O valoare de 0,5 înseamnă că modelul nu este mai bun decât să prezică un rezultat decât șansa aleatorie.
  • Valorile de peste 0,7 indică un model bun.
  • Valorile de peste 0,8 indică un model puternic.
  • O valoare de 1 înseamnă că modelul prezice perfect acei membri ai grupului care vor experimenta un anumit rezultat și cei care nu.

Statistica C nu este folosită foarte des, deoarece vă oferă doar o idee generală despre un model; o curbă ROC conține mult mai multe informații despre acuratețe, sensibilitate și specificitate.

Ponderea

Un indice C ponderat este folosit atunci când costul eșecului de a prezice un rezultat pozitiv (cum ar fi un test pentru cancer) este mai mare decât beneficiul de a prezice corect un rezultat negativ. Ponderarea penalizează modelele care generează diferențe mici de probabilitate pentru rezultatele pozitive și negative, dar nu modifică valoarea statisticii C. De asemenea, poate fi utilizată pentru a ajusta pentru eșantionarea aleatorie stratificată.


Semnificație statistică

Ca majoritatea statisticilor, statistica C este uneori asociată cu un interval de încredere. De exemplu, este posibil să aveți un rezultat de 0,63 cu un interval de încredere cuprins între 0,53 și 0,73). În general, orice rezultat nu este semnificativ dacă include 0,5, chiar dacă include statistica C relevantă. De exemplu, un rezultat de 0,63 cu un IC variind de la 0,43 la 0,83 nu ar fi semnificativ deoarece include 0,5 în acest interval.

Referință:
Hosmer DW, Lemeshow S. Applied Logistic Regression (Ediția a 2-a). New York, NY: John Wiley & Sons; 2000.


CITEAZĂ CEA CE:
Stephanie Glen. „C-Statistic: Definition, Examples, Weighting and Significance” de pe StatisticsHowTo.com: Statistică elementară pentru noi toți ceilalți! https://www.statisticshowto.com/c-statistic/

——————————————————————————

Nevoie de ajutor cu o temă pentru acasă sau o întrebare de test? Cu Chegg Study, puteți obține soluții pas cu pas la întrebările dvs. de la un expert în domeniu. Primele 30 de minute cu un tutore Chegg sunt gratuite!

Lasă un comentariu