Krzywa ROC >Statystyka C
Możesz chcieć najpierw przeczytać ten artykuł: Co to jest krzywa ROC (Receiver Operating Characteristic)?.
Co to jest statystyka C?
Statystyka zgodności jest równa powierzchni pod krzywą ROC.
Statystyka C (czasami nazywana statystyką „zgodności” lub indeksem C) jest miarą dobroci dopasowania dla wyników binarnych w modelu regresji logistycznej. W badaniach klinicznych, statystyka C daje prawdopodobieństwo, że losowo wybrany pacjent, który doświadczył zdarzenia (np. choroby lub stanu) miał wyższy wynik ryzyka niż pacjent, który nie doświadczył tego zdarzenia. Jest ona równa powierzchni pod krzywą ROC (Receiver Operating Characteristic) i waha się od 0,5 do 1.
- Wartość poniżej 0,5 wskazuje na bardzo słaby model.
- Wartość 0,5 oznacza, że model nie jest lepszy od przewidywania wyniku niż przypadek losowy.
- Wartości powyżej 0,7 wskazują na dobry model.
- Wartości powyżej 0,8 wskazują na silny model.
- Wartość 1 oznacza, że model doskonale przewiduje tych członków grupy, którzy doświadczą określonego wyniku i tych, którzy nie doświadczą.
Statystyka C nie jest używana zbyt często, ponieważ daje ona tylko ogólne pojęcie o modelu; krzywa ROC zawiera znacznie więcej informacji o dokładności, czułości i specyficzności.
Ważenie
Ważony indeks c jest używany, gdy koszt nieprzewidzenia pozytywnego wyniku (jak test na raka) jest wyższy niż korzyść z prawidłowego przewidzenia negatywnego wyniku. Ważenie penalizuje modele, które skutkują małymi różnicami prawdopodobieństwa dla pozytywnych i negatywnych wyników, ale nie zmienia wartości statystyki C. Może być również używane do dostosowania do stratyfikowanego losowego próbkowania.
Ważność statystyczna
Jak większość statystyk, statystyka C jest czasami sparowana z przedziałem ufności. Na przykład, możesz mieć wynik 0,63 z przedziałem ufności od 0,53 do 0,73). Ogólnie rzecz biorąc, każdy wynik nie jest znaczący, jeśli zawiera 0,5, nawet jeśli zawiera odpowiednią statystykę C. Na przykład, wynik 0,63 z przedziałem ufności od 0,43 do 0,83 nie byłby znaczący, ponieważ zawiera 0,5 w tym zakresie.
Referencja:
Hosmer DW, Lemeshow S. Applied Logistic Regression (2nd Edition). New York, NY: John Wiley & Sons; 2000.
Stephanie Glen. „C-Statistic: Definition, Examples, Weighting and Significance” From StatisticsHowTo.com: Elementarna statystyka dla reszty z nas! https://www.statisticshowto.com/c-statistic/
——————————————————————————
Potrzebujesz pomocy z zadaniem domowym lub pytaniem testowym? Dzięki Chegg Study możesz uzyskać rozwiązania swoich pytań krok po kroku od eksperta w danej dziedzinie. Pierwsze 30 minut z korepetytorem Chegg jest bezpłatne!