Curva ROC >Statistica C
Potresti voler leggere prima questo articolo: Che cos’è una curva ROC (Receiver Operating Characteristic).
Che cos’è una statistica C?
La statistica di concordanza è uguale all’area sotto una curva ROC.
La statistica C (talvolta chiamata “concordanza” o C-index) è una misura della bontà di adattamento per i risultati binari in un modello di regressione logistica. Negli studi clinici, la statistica C dà la probabilità che un paziente selezionato a caso che ha sperimentato un evento (ad esempio una malattia o una condizione) abbia un punteggio di rischio più alto di un paziente che non ha sperimentato l’evento. È uguale all’area sotto la curva ROC (Receiver Operating Characteristic) e varia da 0,5 a 1.
- Un valore inferiore a 0,5 indica un modello molto povero.
- Un valore di 0,5 significa che il modello non è migliore della previsione di un risultato rispetto alla casualità.
- I valori superiori a 0,7 indicano un buon modello.
- I valori superiori a 0,8 indicano un modello forte.
- Un valore di 1 significa che il modello predice perfettamente i membri del gruppo che avranno un certo risultato e quelli che non lo avranno.
La statistica C non è usata molto spesso perché dà solo un’idea generale di un modello; una curva ROC contiene molte più informazioni sull’accuratezza, la sensibilità e la specificità.
Ponderazione
Un indice C ponderato è usato quando il costo di non riuscire a predire un risultato positivo (come un test per il cancro) è più alto del beneficio di prevedere correttamente un risultato negativo. La ponderazione penalizza i modelli che risultano in piccole differenze di probabilità per gli esiti positivi e negativi, ma non cambia il valore della statistica C. Può anche essere usata per aggiustare il campionamento casuale stratificato.
Significatività statistica
Come la maggior parte delle statistiche, la statistica C è talvolta associata a un intervallo di confidenza. Per esempio, si potrebbe avere un risultato di 0,63 con un intervallo di confidenza che va da 0,53 a 0,73). In generale, qualsiasi risultato non è significativo se include 0,5, anche se include la relativa statistica C. Per esempio, un risultato di 0,63 con un CI che va da 0,43 a 0,83 non sarebbe significativo perché include 0,5 in quell’intervallo.
Riferimento:
Hosmer DW, Lemeshow S. Applied Logistic Regression (2nd Edition). New York, NY: John Wiley & Sons; 2000.
Stephanie Glen. “Statistica C: Definizione, Esempi, Ponderazione e Significatività” Da StatisticsHowTo.com: Statistica elementare per il resto di noi! https://www.statisticshowto.com/c-statistic/
——————————————————————————
Hai bisogno di aiuto per un compito a casa o per un test? Con Chegg Study, puoi ottenere soluzioni passo dopo passo alle tue domande da un esperto del settore. I tuoi primi 30 minuti con un tutor Chegg sono gratuiti!