Чи є чутливість чи специфічність функцією поширеності?


10

Стандартне навчання говорить, що чутливість та специфічність є властивостями тесту і не залежать від поширеності. Але це не просто припущення?

Принципи внутрішньої медицини Харрісона говорить 19-е видання

Вже давно стверджується, що чутливість та специфічність є незалежними від поширеності параметрами точності тестування, і багато текстів все ще роблять це твердження. Однак це статистично корисне припущення є клінічно спрощеним. ... чутливість тесту, ймовірно, буде вищою у госпіталізованих пацієнтів, а специфічність тесту вища у амбулаторних.

(Поширеність зазвичай є більшим у стаціонарних, ніж у амбулаторних)

Чи існує математичне чи приблизне графічне відношення між цими параметрами?

Навіть це посилання називає це "спрощенням". Чому?

Редагувати: Я знаю, як визначається чутливість. Як не зазначається у відповідях, немає жодного терміну поширеності. Я сам стверджував, що це властивості тесту, на який не впливає використовувана група населення, поки я не натрапив на це твердження, звідси і питання. Але я припускаю, що ця плутанина виникає не через визначення, а на практичному обчисленні цих значень. Специфічність та чутливість обчислюються за допомогою 2х2 таблиць, чи має значення поширеність референтної сукупності тут? Це те, про що вони мають на увазі? Якщо це так, яка функція?

Відповіді:


4

Хоча відповіді @ Tim ♦ та @ gung ♦ в значній мірі охоплюють усе, я спробую їх синтезувати як єдину, так і надавати додаткові роз'яснення.

Контекст цитованих рядків здебільшого може стосуватися клінічних тестів у формі певного Порогового значення, як це найбільш часто. Уявіть хворобу , і все, крім включаючи здоровий стан, який називається . Ми, для нашого тесту, хотіли б знайти деякий показник проксі, який дозволяє нам отримати хороший прогноз для (1). Причина, по якій ми не отримуємо абсолютної специфічності / чутливості, полягає в тому, що значення нашої кількості проксі не ідеально співвідносяться з стан захворювання, але тільки в цілому асоціюється з ним, і, отже, в окремих вимірах ми можемо мати шанс цієї кількості перетнути наш поріг дляD D c D D cDDDcDDcіндивіди і навпаки. Для наочності припустимо модель Гаусса для мінливості.

Скажімо, ми використовуємо як величину проксі. Якщо було обрано чудово, то повинен бути вище ( - оператор очікуваного значення). Тепер проблема виникає тоді , коли ми розуміємо , що є складовою ситуацією (так ), на самому ділі зроблено з 3 -х класів тяжкості , , , з послідовно збільшуються очікуваними значеннями . Для однієї особи, обраної або з категорії або зx E [ x D ] E [ x D c ] E D D c D 1 D 2 D 3 x D D c x T D D c x T D x D cxxE[xD]E[xDc]EDDcD1D2D3xDDcкатегорія, ймовірність того, що "тест" буде позитивним чи ні, залежатиме від обраного вами порогу. Скажімо, ми обираємо на основі вивчення дійсно випадкової вибірки, що має як особини і . Наш спричинить помилкові позитиви та негативи. Якщо ми вибираємо людину випадковим чином, ймовірність, що регулює його / її значення якщо вона задана зеленим графіком, а випадково вибраної людини червоним графіком.xTDDcxTDxDcвведіть тут опис зображення

Фактичні отримані числа залежатимуть від фактичної кількості особин і однак отримана специфіка та чутливість не будуть. Нехай - сукупна функція ймовірності. Тоді, щодо поширеності захворювання , ось таблиця 2х2, як можна було б очікувати від загального випадку, коли ми намагаємось побачити, як працює наш тест у комбінованій сукупності.D c F ( ) p DDDcF()pD

(D,+)=p(1FD(xT))
(Dc,)=(1p)(1FDc(xT))
(D,)=p(FD(xT))
(Dc,+)=(1p)FDc(xT)

Фактичні числа залежать від , але чутливість та специфічність не залежать від . Але обидва вони залежать від та . Отже, всі фактори, які впливають на них, безумовно, змінять ці показники. Якби ми, наприклад, працювали в відділенні інтенсивної терапії, наш замінили б , а якби ми говорили про амбулаторних, замінили . Окремим питанням є те, що в лікарні поширеність також різна,p F D F D c F D F D 3 F D 1 D c D c x D D c F D F D c D F FppFDFDcFDFD3FD1але це не інша поширеність, яка спричиняє різницю чутливості та особливості, а різний розподіл, оскільки модель, за якою визначено поріг, не застосовується до населення, яке постає амбулаторними або стаціонарними . Ви можете йти вперед і розбивати на декілька субпопуляцій, оскільки стаціонарна частина також має підвищений через інші причини (оскільки більшість представників також "підвищені" в інших серйозних умовах). Розбиття популяції на субпопуляцію пояснює зміну чутливості, тоді як популяція пояснює зміну специфічності (відповідними змінами іDcDcxDDcFDFDc ). Це те, з чого складається фактично складений графік. Кожен з кольорів насправді матиме власний , а отже, поки це відрізнятиметься від на якому було розраховано початкову чутливість та специфічність, ці показники будуть змінюватися.DFF

введіть тут опис зображення

Приклад

Припустимо, чисельність населення 11550 з 10000 Dc, 500,750,300 D1, D2, D3 відповідно. Коментована частина - це код, який використовується для наведених графіків.

set.seed(12345)
dc<-rnorm(10000,mean = 9, sd = 3)
d1<-rnorm(500,mean = 15,sd=2)
d2<-rnorm(750,mean=17,sd=2)
d3<-rnorm(300,mean=20,sd=2)
d<-cbind(c(d1,d2,d3),c(rep('1',500),rep('2',750),rep('3',300)))
library(ggplot2)
#ggplot(data.frame(dc))+geom_density(aes(x=dc),alpha=0.5,fill='green')+geom_density(data=data.frame(c(d1,d2,d3)),aes(x=c(d1,d2,d3)),alpha=0.5, fill='red')+geom_vline(xintercept = 13.5,color='black',size=2)+scale_x_continuous(name='Values for x',breaks=c(mean(dc),mean(as.numeric(d[,1])),13.5),labels=c('x_dc','x_d','x_T'))

#ggplot(data.frame(d))+geom_density(aes(x=as.numeric(d[,1]),..count..,fill=d[,2]),position='stack',alpha=0.5)+xlab('x-values')

Ми можемо легко обчислити значення x для різних груп населення, включаючи Dc, D1, D2, D3 і композитний D.

mean(dc) 
mean(d1) 
mean(d2) 
mean(d3) 
mean(as.numeric(d[,1]))

> mean(dc) [1] 8.997931
> mean(d1) [1] 14.95559
> mean(d2) [1] 17.01523
> mean(d3) [1] 19.76903
> mean(as.numeric(d[,1])) [1] 16.88382

Щоб отримати таблицю 2x2 для нашого початкового тестового випадку, спершу встановлюємо поріг на основі даних (який у реальному випадку буде встановлений після запуску тесту, як показує @gung). У будь-якому випадку, припускаючи поріг 13,5, ми отримуємо таку чутливість та специфічність, якщо обчислювати всю сукупність.

sdc<-sample(dc,0.1*length(dc)) 
sdcomposite<-sample(c(d1,d2,d3),0.1*length(c(d1,d2,d3))) 
threshold<-13.5 
truepositive<-sum(sdcomposite>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sdcomposite<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity<-truepositive/length(sdcomposite) 
specificity<-truenegative/length(sdc) 
print(c(sensitivity,specificity))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]139 928  72  16
> print(c(sensitivity,specificity)) [1] 0.8967742 0.9280000

Припустимо, що ми працюємо з амбулаторними, і ми хворіємо пацієнтами лише із пропорції D1, або ми працюємо в диспансері, де отримуємо лише D3. (для більш загального випадку нам також потрібно розділити компонент Dc) Як змінюються наша чутливість та специфічність? Змінюючи поширеність (тобто, змінюючи відносну частку пацієнтів, що належать до будь-якого випадку, ми взагалі не змінюємо специфіку та чутливість. Так буває, що ця поширеність змінюється також при зміні розподілу)

sdc<-sample(dc,0.1*length(dc)) 
sd1<-sample(d1,0.1*length(d1)) 
truepositive<-sum(sd1>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd1<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity1<-truepositive/length(sd1) 
specificity1<-truenegative/length(sdc) 
print(c(sensitivity1,specificity1)) 
sdc<-sample(dc,0.1*length(dc)) 
sd3<-sample(d3,0.1*length(d3)) 
truepositive<-sum(sd3>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd3<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity3<-truepositive/length(sd3) 
specificity3<-truenegative/length(sdc) 
print(c(sensitivity3,specificity3))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  38 931  69  12
> print(c(sensitivity1,specificity1)) [1] 0.760 0.931
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  30 944  56   0
> print(c(sensitivity3,specificity3)) [1] 1.000 0.944

Підводячи підсумок, графік, який показує зміну чутливості (специфічність пішла б за аналогічною тенденцією, якби ми також склали популяцію Dc з субпопуляцій) з різним середнім значенням x для населення, ось графік

df<-data.frame(V1=c(sensitivity,sensitivity1,sensitivity3),V2=c(mean(c(d1,d2,d3)),mean(d1),mean(d3))) 
ggplot(df)+geom_point(aes(x=V2,y=V1),size=2)+geom_line(aes(x=V2,y=V1))

введіть тут опис зображення

  1. Якби це не проксі, ми технічно мали б 100% специфічність та чутливість. Скажімо, наприклад, що ми визначаємо як такий, що має конкретну об'єктивно визначену патологічну картину, скажімо, на біопсії печінки, тоді тест біопсії печінки стане золотим стандартом, і наша чутливість буде вимірюватися щодо себе, а отже, і отримає 100%D

9

По-перше, варто визнати, що типово не можна змінювати чутливість незалежно від конкретності, і навпаки. Це точка кривої ROC. Враховуючи характер процесу генерації даних, а також ваші конкретні дані та модель, ви завжди будете дотримуватися певного компромісу між чутливістю та специфічністю. Звичайно, ви б воліли одночасно мати 100% чутливість і 100% специфічність, але зазвичай не можете. Ви можете отримати кращу чутливість, але за рахунок гіршої специфічності або кращої специфічності, але за рахунок гіршої чутливості. Крива ROC показує вам набір компромісів, які ви змушені обирати. (Пара зауважень: 1. Ви можете часом отримати один вимір, не втрачаючи нічого в іншому, тому що у вашому наборі даних є розрив, але це здебільшого ілюзорно; 2.Крива ROC - це чутливість як функція 1-специфіки, побудова графіку чутливості проти специфіки буде відображеною кривою ROC.)

введіть тут опис зображення

Як у будь-якому випадку, як уявна чутливість та специфічність можуть змінюватись із поширеністю? Це питання, коли воно допомагає імітувати та грати з деякими даними, щоб побачити, як це може вийти на практиці. Уявімо, що модель підходить до досить великого набору даних, який має особливу поширеність, і по осі x 1 встановлюється поріг . Пізніше результативність цього тесту обчислюється зразками, які мають суттєво різну поширеність (і, отже, різні значення x). Результат полягає в тому, що одна і та ж модель, використовуючи один і той же поріг, буде працювати по-різному, коли застосовується до наборів даних з різною поширеністю.

library(caret)  # we'll use these packages
library(binom)
  # we'll use this function to convert log odds to probabilities
lo2p = function(lo){ exp(lo)/(1+exp(lo)) }

##### training dataset for original model
set.seed(734)                     # these make the examples exactly reproducible
Nt = 1000
xt = rnorm(Nt, mean=5, sd=1)      # this is the distribution of X
lo = -1.386 + .308*xt             # this is the data generating process
pt = lo2p(lo)
yt = rbinom(Nt, size=1, prob=pt)
mt = glm(yt~xt, family=binomial)
summary(mt)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)    
# (Intercept) -1.16736    0.32794  -3.560 0.000371 ***
# xt           0.24980    0.06429   3.886 0.000102 ***
# ...
#     Null deviance: 1384.5  on 999  degrees of freedom
# Residual deviance: 1369.1  on 998  degrees of freedom
# AIC: 1373.1

## determine threshold
# prob(Y) = 50%, where log odds = 0, so:
-coef(mt)[1]/coef(mt)[2]  # 4.673159
threshold = 4.7  # a simple round number
classt    = ifelse(xt>threshold, 1, 0)
tabt      = table(classt, yt)[2:1,2:1]

confusionMatrix(tabt)
#       yt
# classt   1   0
#      1 346 279
#      0 175 200
#                                           
#                Accuracy : 0.546           
#                     ...                                          
#             Sensitivity : 0.6641          
#             Specificity : 0.4175          
#          Pos Pred Value : 0.5536          
#          Neg Pred Value : 0.5333          
#              Prevalence : 0.5210          


##### high prevalence dataset from hospital
set.seed(4528)
Nh = 500
xh = rnorm(Nh, mean=6, sd=1)  # a different distribution of X
lo = -1.386 + .308*xh         # but the same data generating process
ph = lo2p(lo)
yh = rbinom(Nh, size=1, prob=ph)
classh = ifelse(xh>threshold, 1, 0)  # the same threshold is used
tabh   = table(classh, yh)[2:1,2:1]

confusionMatrix(tabh)
#       yh
# classh   1   0
#      1 284 163
#      0  20  33
#                                           
#                Accuracy : 0.634           
#                     ...
#             Sensitivity : 0.9342          
#             Specificity : 0.1684          
#          Pos Pred Value : 0.6353          
#          Neg Pred Value : 0.6226          
#              Prevalence : 0.6080          


##### low prevalence dataset from outpatients
set.seed(1027)
Nl = 500
xl = rnorm(Nl, mean=3, sd=1)
lo = -1.386 + .308*xl
pl = lo2p(lo)
yl = rbinom(Nl, size=1, prob=pl)
classl = ifelse(xl>threshold, 1, 0)
tabl   = table(classl, yl)[2:1,2:1]

confusionMatrix(tabl)
#       yl
# classl   1   0
#      1   9  14
#      0 190 287
#                                           
#                Accuracy : 0.592           
#                     ...
#             Sensitivity : 0.04523         
#             Specificity : 0.95349         
#          Pos Pred Value : 0.39130         
#          Neg Pred Value : 0.60168         
#              Prevalence : 0.39800         


##### sensitivities
binom.confint(346, 521, method="e")
#   method   x   n      mean     lower    upper
# 1  exact 346 521 0.6641075 0.6217484 0.704592
binom.confint(284, 304, method="e")
#   method   x   n      mean   lower     upper
# 1  exact 284 304 0.9342105 0.90022 0.9593543
binom.confint(  9, 199, method="e")
#   method x   n       mean      lower      upper
# 1  exact 9 199 0.04522613 0.02088589 0.08411464

##### specificities
binom.confint(200, 479, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 200 479 0.4175365 0.3729575 0.4631398
binom.confint( 33, 196, method="e")
#   method  x   n      mean     lower     upper
# 1  exact 33 196 0.1683673 0.1188206 0.2282441
binom.confint(287, 301, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 287 301 0.9534884 0.9231921 0.9743417

Ось чутливість та специфічність як функція поширеності з точними довірчими інтервалами 95%:

введіть тут опис зображення

То що тут відбувається? Вважайте, що прототипічна логістична регресія може виглядати приблизно як на малюнку нижче. Зауважте, що вся "дія" відбувається в інтервалі [4, 6] на осі x. Наведені нижче дані будуть мати дуже низьку поширеність, і модель покаже погану дискримінацію та чутливість. Дані, що перевищують цей інтервал, матимуть дуже високу поширеність, але модель знову не буде добре розмежовуватись та матиме низьку специфіку.

введіть тут опис зображення

Щоб зрозуміти, як це могло статися, розглянемо тестування аланінової трансамінази, щоб визначити, чи не працює печінка пацієнта 2. Ідея полягає в тому, що печінка зазвичай використовує ALT, але якщо печінка перестає функціонувати, ALT буде скидатися в кров. Отже, якщо рівень АЛТ у крові крові вище якогось порогу, це означає, що печінка не працює. Якщо ви берете пробу з високою поширеністю печінкової недостатності, ви будете брати пробу з високим рівнем АЛТ в крові. Таким чином, у вас буде більше пацієнтів понад поріг. Не у всіх з високим рівнем АЛТ в крові буде печінкова недостатність - для деяких пацієнтів буде ще якась причина. Але тих, хто має печінкову недостатність, слід спіймати. Це призводить до підвищення чутливості. Крім того, не всі пацієнти з нормальним рівнем АЛТ мають здорові печінки, але вибірка з низькою поширеністю матиме нижчий рівень АЛТ, і більше пацієнтів здадуть тест. Ті, чия печінка не ' t невдало, але у кого нормальний рівень ALT буде пропущено. Це призводить до зниження чутливості, але вищої специфічності.

Більш загально, вся ідея медичного тесту полягає в тому, що те чи інше є співвідношенням хворобового стану, до якого, можливо, ви хотіли б мати прямі заходи, але не можете. Отримання міри кореляту дає зрозуміти стан хвороби. (Потенційний) тест, коли це не відповідає дійсності, не матиме ніякої цінності і не застосовується. Таким чином, на практиці зразки вищої поширеності повинні мати розподіл кореляту з більшою кількістю аномальних значень, що призводить до підвищення чутливості, і навпаки. (Зауважте, що корелат не повинен бути причиною захворювання; у прикладі ALT це є наслідком, в інших прикладах і захворювання, і корелат можуть бути наслідками загальної причини тощо).

1. Це насправді досить поширене в медицині. Вважайте, що холестерин повинен бути <200, систолічний кров'яний тиск повинен бути <140 і т. Д. Це насправді самі по собі не є «тестами», але є безліч тестів, які працюють саме так. Для деяких (можливо віддалених) обговорень щодо порогових значень може допомогти прочитати мої відповіді на те, чи завжди поріги 0-1 завжди еквівалентні порогам осі x? , і чому кількість помилкових позитивних даних не залежить від розміру вибірки, якщо ми використовуємо p-значення для порівняння двох незалежних наборів даних?
2. Будь ласка, майте на увазі, що я не лікар, і цей приклад цілком може бути поганим. Попросіть лікаря, чи хочете ви отримати точну інформацію про роботу печінки, її тести та пов'язані з цим питання.


Дякую! Показуючи, що насправді це змінюється. Але як це враховує відповідь @Tim? Хіба це не суперечить?
Polisetty

1
@Polisetty, Тім заявляє, що "стаціонарні та амбулаторні хвороби можуть відрізнятися в багатьох аспектах, не тільки по поширеності, тому деякі чутливі фактори можуть впливати на чутливість". Якщо тест є функцією якоїсь властивості пацієнтів (скажімо, холестерину), а хвороба сильно співвідноситься і з цією властивістю (що, як правило, вся суть), то "інші фактори" повинні рухатися спільно з / поширеність. Таким чином, коли поширеність змінюється, інший корелює зміну, а тест має більш-менш чутливу з / п дану конкретну групу.
gung - Відновити Моніку

7

Як уже говорили інші, чутливість та специфічність не залежать від поширеності. Чутливість - це частка справжнього позитиву серед усіх позитивних, а специфічність - частка правдивих негативів серед усіх негативів. Отже, якщо чутливість дорівнює 90%, тест буде правильним у 90% випадків, які є позитивними. Очевидно, що 90% чогось меншого і 90% чогось більшого ще 90% ...

Отже, враховуючи табличні дані, які ви згадуєте,

positiveconditionnegativeconditionpositivetestacnegativetestbd

чутливість - (від визначення умовної ймовірності ), а - . Для кожної з показників ви дивитесь лише на один із стовпців у той час, тому поширеність (відносні розміри стовпців) не має значення для цих показників. Поширеність не входить у рівняння. Крім того, було б досить дивно, якби "практична" чутливість була визначена інакше, ніж теоретично і призвела до різних висновків.aa+b+c+d/a+ba+b+c+d=aa+b p(YX)=p(YX)p(X)da+b+c+d/c+da+b+c+d=dc+d

Але цитата, здається, також говорить про щось інше

чутливість тесту, ймовірно, буде вищою у госпіталізованих пацієнтів, а специфічність тесту вища у амбулаторних

тому автори кажуть, що чутливість відрізняється у різних груп. Я здогадуюсь, що стаціонарні та амбулаторні хвороби можуть відрізнятися в багатьох аспектах, а не лише по поширеності, тому деякі чутливі фактори можуть впливати на чутливість. Тож я погоджуюся, що вони можуть змінюватися між різними наборами даних, які відрізняються за поширеністю, але зміна не буде функцією самої поширеності (як показав @gung у своїй відповіді).

З іншого боку, якби мені довелося здогадатися, можливо, автори плутають чутливість із задньою ймовірністю . Чутливість , тоді як задні ймовірність -p(positive testcondition)

p(conditionpositive test)p(positive testcondition)×p(condition)

і в багатьох випадках це ймовірність зацікавлених людей ("наскільки ймовірно, що пацієнт з позитивним результатом тесту насправді має захворювання?"), і це залежить від поширеності. Зауважте, що також ваше посилання обговорює вплив поширеності на позитивну прогнозну цінність, тобто задню ймовірність, а не на чутливість.


Як я вже згадував в одній з попередніх відповідей, я майже впевнений, що автори не плутали його з задньою ймовірністю, оскільки вони прямо вказують на те, що "багато текстів все ще роблять це твердження". І я цитую ще одне джерело, не так надійне, як Harrison's, яке говорить про те, що це "безпечне припущення". Все, що я хочу запитати - це «припущення»?
Polisetty

2
@Polisetty Я не можу сказати для авторів, але з цитати вони, мабуть, називають незалежність щодо поширеності "припущенням", але це скоріше математичний факт, ніж припущення. Якщо б це не було, це означає, що теорія ймовірностей порушена, і це не так.
Тім

Чутливість та специфічність можна вважати фіксованими властивостями діагностичного тесту. [Це незначне спрощення, але воно досить добре для наших цілей]. - ось що там сказано
Polisetty

3

Дивіться мою відповідь тут щодо правдивих / хибних позитивних / негативних показників.

Чутливість - це лише інша назва справжньої позитивної ставки, а специфічність - така ж, як і справжня негативна норма. І чутливість, і специфічність - це умовні ймовірності; вони обумовлюють стан хвороби. Таким чином, поширеність захворювання (тобто апріорна ймовірність того, що у пацієнта є захворювання) не має значення, оскільки ви припускаєте певний хворобовий стан.

Я не можу коментувати, чому автор підручника стверджує, що чутливість та специфічність залежать від клінічного контексту. Це емпіричні спостереження?


Саме так. Звідси питання. Чутливість тесту залежить від популяції, де він використовується. Припущення, що це незалежність, не завжди відповідає дійсності. Я запитую, як і чому. Пізніше книга також цитує цінності
Polisetty

Можуть існувати конкретні популяційні фактори, які впливають на чутливість та специфічність. Але з математичних визначень чутливості та специфіки випливає, що поширеність не може бути одним із цих факторів, принаймні, безпосередньо. (До речі, не соромтеся приймати мою відповідь, якщо ви задоволені моїм поясненням математичних визначень.)
tddevlin

Вибачте, я думаю, це було не ясно. Я хотів математично дізнатися про зв’язок між чутливістю та поширеністю. Я знаю, як вони визначаються. Я здогадуюсь, що відношення виникає через те, як вони розраховуються. Чутливість - tp / (tp + fn), а поширеність - tp + fn / (tp + fn + fp + tn)
Polisetty

Як я вже згадую у своїй відповіді, між чутливістю та поширеністю немає зв’язку. Поширеність тоді як чутливість . Ви не можете нічого сказати про значення одного, виходячи зі значення іншого. P ( + | захворювання )P(Disease)P(+|disease)
tddevlin

Гаррісон не зрозумів би це. Навіть це посилання називає це спрощенням. med.uottawa.ca/sim/data/Sensibility_and_Prevalence_e.htm
Polisetty

1

Я, звичайно, не можу говорити про наміри автора, але ось мої міркування для цього твердження:

Розглянемо клінічний контекст як сам діагностичний тест. Один з дуже слабкою чутливістю та специфічністю, але тест все ж. Якщо ви знаходитесь в лікарні, ви, ймовірно, хворієте. Якщо ви не в лікарні, ви, швидше за все, не хворієте.

З цього погляду фактичний діагностичний тест, який ви виконуєте, - це фактично друга частина двох тестів, виконаних послідовно.


У вашому поясненні апріорі змінюється, що призводить до більшої задньої ймовірності. Це правда. Але як змінюється сама чутливість - питання.
Polisetty

@Polisetty Що робити, якщо ви назвали високу задню позитивною пробою? "Клінічний контекст - це сам тест". Я думаю, що будь-який довільно вирішений тест може бути зроблений таким чином, щоб залежати від поширеності, тому "тест" повинен бути конкретніше визначений. Я думаю, що твердження стосується звичайних різноманітних тестів, заснованих на порозі вимірювання проксі.
Satwik Pasani

1

Це має бути помилкою. Я думаю, можливо, автор намагається припустити, що позитивні та негативні прогнозні значення (PPV та NPV) залежать від поширеності (а також чутливості та специфічності). Вони часто обговорюються діагностичними тестами і, на думку клініциста, можуть бути більш цінними, ніж сира інтерпретація чутливості та специфічності.

Цей графік демонструє взаємозв'язок між PPV та NPV з поширеністю для тесту з 95% чутливістю та 85% специфічністю.

С Мауснер Дж. С., Крамер С.: Епідеміологія Мауснера та Бана: вступний текст.  Філадельфія, WB Saunders, 1985, с.  221.

С Мауснер Дж. С., Крамер С.: Епідеміологія Мауснера та Бана: вступний текст. Філадельфія, WB Saunders, 1985, с. 221.


1

@Satwik, @gung і @Tim вже надали багато деталей, але я спробую додати невеликий приклад того, як випадок основних факторів може викликати такий ефект.

Основний принцип: зміщення

Чутливість / специфічність та ВСІ статистичні тести мають одне застереження: воно застосовується лише до повторення тієї ж процедури вибірки, що і раніше, неупереджено.

Лікарні є функціонуючими організаціями, розробленими для упередженого відбору проб, використовуючи політику прийому для фільтрації загальної сукупності до тих, хто потребує прийому та лікування. Це дуже антитеза наукової процедури. Якщо ви хочете знати, як працює тест для різних груп населення, його потрібно перевірити в різних групах населення.

Латентний ефект: кореляція

У реальному світі рідко (або неможливо, якщо ви хочете бути суворими) діагностика не залежить / ортогональна від усіх інших факторів ризику захворювання, тому існує певна ступінь кореляції.

Якщо екран для вступу в лікарню позитивно співвідноситься з діагностикою, то, що ви знайдете, це те, що люди, які здають тест на вступ, сприятливо схильні до позитивних результатів діагностикою, пропорційною кореляції. Таким чином, справжні позитиви збагачуються, а помилкові негативи зменшуються на величини, пропорційні співвідношенню.

Після цього чутливість стає більшою.

Пояснення явища

Спостереження про те, що чутливість може бути вищою в умовах лікарні, тому не є нереальним. Насправді, якщо політика прийому буде продумана і відповідна меті, можна очікувати, що це відбудеться.

Це не є доказом розбиття припущення про те, що чутливість та специфічність не залежать від поширеності, скоріше це є свідченням необ’єктивного відбору проб на основі політики прийому в лікарню.

Що, враховуючи, що лікарня існує для лікування людей, а не для проведення наукових експериментів, безумовно, це добре.

Але це вдає головним болем вчених.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.