Courbe ROC > Statistique C
Vous pouvez lire cet article en premier : Qu’est-ce qu’une courbe ROC (Receiver Operating Characteristic) ?.
Qu’est-ce qu’une statistique C ?
La statistique de concordance est égale à l’aire sous une courbe ROC.
La statistique C (parfois appelée statistique de « concordance » ou indice C) est une mesure de la qualité de l’ajustement pour les résultats binaires dans un modèle de régression logistique. Dans les études cliniques, la statistique C donne la probabilité qu’un patient sélectionné au hasard qui a subi un événement (par exemple une maladie ou un état) ait un score de risque plus élevé qu’un patient qui n’a pas subi cet événement. Elle est égale à l’aire sous la courbe ROC (Receiver Operating Characteristic) et varie de 0,5 à 1.
- Une valeur inférieure à 0,5 indique un très mauvais modèle.
- Une valeur de 0,5 signifie que le modèle ne prédit pas mieux un résultat que le hasard.
- Des valeurs supérieures à 0,7 indiquent un bon modèle.
- Des valeurs supérieures à 0,8 indiquent un modèle fort.
- Une valeur de 1 signifie que le modèle prédit parfaitement les membres du groupe qui connaîtront un certain résultat et ceux qui ne le connaîtront pas.
La statistique C n’est pas très souvent utilisée car elle ne vous donne qu’une idée générale d’un modèle ; une courbe ROC contient beaucoup plus d’informations sur la précision, la sensibilité et la spécificité.
Pondération
Un indice c pondéré est utilisé lorsque le coût de ne pas prédire un résultat positif (comme un test pour le cancer) est plus élevé que le bénéfice de prédire correctement un résultat négatif. La pondération pénalise les modèles qui aboutissent à de faibles différences de probabilité pour les résultats positifs et négatifs, mais ne change pas la valeur de la statistique C. Elle peut également être utilisée pour ajuster l’échantillonnage aléatoire stratifié.
Significativité statistique
Comme la plupart des statistiques, la statistique C est parfois associée à un intervalle de confiance. Par exemple, vous pouvez avoir un résultat de 0,63 avec un intervalle de confiance allant de 0,53 à 0,73). En général, tout résultat n’est pas significatif s’il comprend 0,5, même s’il comprend la statistique C pertinente. Par exemple, un résultat de 0,63 avec un IC allant de 0,43 à 0,83 ne serait pas significatif car il inclut 0,5 dans cet intervalle.
Référence:
Hosmer DW, Lemeshow S. Applied Logistic Regression (2e édition). New York, NY : John Wiley & Sons ; 2000.
Stephanie Glen. » C-Statistic : Définition, exemples, pondération et signification » De StatisticsHowTo.com : Des statistiques élémentaires pour le reste d’entre nous ! https://www.statisticshowto.com/c-statistic/
——————————————————————————
Vous avez besoin d’aide pour un devoir ou une question de test ? Avec Chegg Study, vous pouvez obtenir des solutions étape par étape à vos questions de la part d’un expert dans le domaine. Vos 30 premières minutes avec un tuteur Chegg sont gratuites !