Gevoelig worden: Diagnostic Sensitivity and Specificity Simplified

What Do We Mean by Diagnostic Sensitivity?

In de klinische diagnostiek zullen onvermijdelijk vragen opduiken over de gevoeligheid van een assay. Maar wat betekent “gevoeligheid” nu precies? De laagste hoeveelheid van een analyt die een assay kan detecteren wordt vaak gevoeligheid genoemd – en voor alle duidelijkheid, deze hoeveelheid is de analytische gevoeligheid of Limit of Detection (LoD). De term analytisch is het sleutelwoord voor deze definitie, dus laten we dat nu we toch bezig zijn eens vergelijken met de term diagnostisch. De diagnostische gevoeligheid heeft te maken met het vermogen van een assay om populaties van individuen met de ziekte correct te identificeren, en hoewel dit zeker een functie is van de analytische gevoeligheid, garandeert een hoge analytische gevoeligheid (wat betekent dat u zeer minieme hoeveelheden van uw analyt kunt detecteren) niet noodzakelijkerwijs een bruikbare diagnostische gevoeligheid.

Zoals u zich kunt voorstellen, zijn de twee metingen zeer verschillend – de eerste vertelt u iets over de prestaties van uw assay in het buisje en de tweede vertelt u hoe uw assay presteert op een gegeven populatie. Daarom is het belangrijk om de termen analytisch of diagnostisch te koppelen aan de term gevoeligheid wanneer u uw assay beschrijft.

Hoe berekent u de diagnostische gevoeligheid?

Een andere manier om over diagnostische gevoeligheid na te denken, is na te gaan hoe goed de assay ware positieven kan detecteren. Maar als je te maken hebt met onbekende monsters, hoe weet je dan wat een echt resultaat is? Dat is een soort kip-en-ei-vraag, maar laten we dit eens overwegen.

Zeg dat je een assay hebt die kan bepalen of een patiënt vijf of zes vingers aan elke hand heeft. Je kunt een monster nemen, de proefpersoon blinddoeken en een resultaat verkrijgen. Laat diezelfde patiënt vervolgens onderzoeken door een arts die gewoon het aantal vingers aan elke hand telt. Vergelijk vervolgens de notities – bij hoeveel monsters kwamen uw test en de waarnemingen van de arts overeen? De waarnemingen van de arts zouden in dit geval als de gouden standaard worden beschouwd, aangezien je niet echt objectiever kunt zijn dan het tellen van vingers! Als het doel is personen met zes vingers op te sporen (d.w.z. zes is een positief resultaat), zou een testresultaat dat overeenkomt met een telling van zes een echt positief resultaat zijn, terwijl een testresultaat van vijf voor een patiënt met vijf vingers een echt negatief resultaat zou zijn. Evenzo zou een analyseresultaat van zes voor een persoon met vijf vingers een vals-positief resultaat zijn en een analyseresultaat van vijf voor een patiënt met zes vingers een vals-negatief resultaat. Als we onderstaande denkbeeldige gegevensreeks nemen, kunnen we de diagnostische gevoeligheid berekenen door het percentage opgespoorde ware positieven te berekenen op het totale aantal werkelijke positieven in de monsters (ware positieven plus vals negatieven).

Patiënt
Nr.
Geconstateerde
Nr. vingers
Assay resultaat
(No. Vingers)
True
Positive
False
Positive
True
Negative
False
Negative
1 6 6 X
2 6 6 X
3 5 X
4 6 5 X
5 5 5 X
6 6 6 X
7 6 6 X
8 5 5 X
9 5 5 X
10 5 X
Totals 4 1 4 1

De bovenstaande gegevens kunnen in de onderstaande waarheidstabel worden getabelleerd en gebruikt om de diagnostische gevoeligheid met behulp van de volgende vergelijking te berekenen. Hier berekenen we het percentage personen die de aandoening hebben en een testresultaat hebben dat positief is voor de aandoening.

True Condition

Positive Negative
Toestand voorspeld door assay Positief TP FP
Negatief FN TN

True Condition
Positive Negative
Condition voorspeld door assay Positief 4 1
Negatief 1 4



Vevoeligheid = \frac{\mathrm{TP} gevoeligheid = \frac{\mathrm{TP+FN}} = \frac{\mathrm{4}} 4+1}} } = 4/5 = 80 %


Niet slecht, toch? Zullen we eens kijken naar een voorbeeld uit de praktijk? Stel, u ontwikkelt een qPCR-test voor het opsporen van een bacteriële ziekteverwekker. De resultaten die u met uw qPCR-test verkrijgt, zouden gegevens opleveren voor de voorspelde toestand en deze zouden worden vergeleken met de resultaten die u verkrijgt met een klassieke kweek. Waarom? In dit voorbeeld is het terugvinden van het organisme door middel van kweken bij de zieke patiënt een van de postulaten van Koch en daarom zou een bacteriekweek als de gouden standaard worden beschouwd. Als we deze verzonnen dataset hadden:

True Condition
Positief Negatief
Conditie voorspeld door
assay (d.w.z.e. qPCR positief)
Positief 238 (TP) 21 (FP)
Negatief 2 (FN) 103 (TN)

Wij zouden deze diagnostische gevoeligheid berekenen als:


\frac{\mathrm{238} = 238/240 = 0,992 × 100 = 99,2%

Dit betekent dat als we deze qPCR gebruiken om patiënten op deze bacteriële ziekteverwekker te testen, we in 99% van de gevallen de juiste uitslag krijgen. Maar hoe zit het met de valse positieven? Die zou je inderdaad ook detecteren met deze assay omdat een qPCR DNA detecteert van zowel levensvatbare als niet-levensvatbare organismen, terwijl een kweek alleen levensvatbare organismen zou detecteren. Bovendien heeft qPCR waarschijnlijk een veel betere analytische gevoeligheid dan de meeste op kweek gebaseerde methodes. Door deze twee methoden te vergelijken en kweken als de gouden standaard te beschouwen, zouden kwekenegatieve/qPCR-positieve monsters als vals-positief worden gedefinieerd. In dit scenario zou u waarschijnlijk een bevestigingstest willen uitvoeren om er zeker van te zijn dat een qPCR-positieve patiënt werkelijk geïnfecteerd was met een levensvatbare ziekteverwekker.

Hoe zit het met de diagnostische specificiteit?

Hoewel het aantal vals-positieven in het bovenstaande voorbeeld u zorgen kan baren, hangt de echte beoordeling van de prestaties af van hoe uw assay wordt gebruikt. Als het de bedoeling is gezonde patiënten uit te sluiten om bevestigingstests te vermijden, dan is een hoge diagnostische specificiteit de sleutel. Oh wacht, ik introduceerde net een andere term – diagnostische specificiteit! Dit is een gerelateerde meting van hoe groot de kans is dat uw test de individuen zonder de ziekte correct identificeert. Denk aan het correct identificeren van patiënten met vijf vingers, of het detecteren van patiënten die niet besmet zijn met de bacteriële ziekteverwekker. Hier berekenen we het percentage personen zonder de aandoening die correct negatief testen op de aandoening. Die berekening volgt:


Diagnosticiteit = \frac{\mathrm{TN} specificiteit = \frac{\mathrm{TN+FP}} = \frac{\mathrm{103}} = 103/124 = 0,831 × 100 = 83,1 %


Dat betekent dat we 83 % van de tijd de gezonde patiënten correct identificeren. Aangezien de qPCR-test veel sneller is dan wachten tot de bacteriën groeien, zou het nuttig zijn de qPCR-test uit te voeren en zou u vertrouwen kunnen hebben in de negatieve resultaten van de qPCR, aangezien we weinig fout-negatieve resultaten hadden in deze gekunstelde gegevensreeks. Positieve patiënten moeten natuurlijk opnieuw worden getest met een kweek, maar er zouden minder patiënten hoeven te worden getest. Je kunt deze berekeningen ook gebruiken om een nieuwe qPCR assay te vergelijken met een assay die nu in gebruik is of een qPCR met een ELISA. En als wiskunde niet uw ding is, zijn er een reeks gratis on-line calculators, zoals deze van medcalc, om deze getallen voor u uit te rekenen!

Heeft dit u geholpen? Deel het dan met uw netwerk.

Geschreven door Heinz Reiske
Image Credit:freepik

Plaats een reactie