Ось загальний підхід до розуміння Парадокса Сімпсона алгебраїчно для даних підрахунку.
Припустимо, що у нас є дані про виживання для експозиції та ми створюємо таблицю на випадок 2х2. Щоб все було просто, у нас буде однакове підрахунок у кожній комірці. Ми могли б це розслабити, але це зробило б алгебру досить безладним.
ExposedUnexposedDiedXXSurvivedXXDeath Rate0.50.5
У цьому випадку рівень смертності є однаковим як у групах, що піддаються впливу, так і у неекспонованих.
Тепер, якщо ми розділимо дані, скажімо, на одну групу для жінок та іншу групу для чоловіків, ми отримаємо 2 таблиці з наступними підрахунками:
Самці:
ExposedUnexposedDiedXaXcSurvivedXbXdDeath Rateaa+bcc+d
і для жінок:
ExposedUnexposedDiedX(a−1)X(c−1)SurvivedX(b−1)X(d−1)Death Ratea−1a+b−2c−1c+d−2
a,b,c,d∈[0,1]
Парадокс Сімпсона відбудеться тоді, коли рівень смертності підданих чоловіків більший, ніж рівень смертності для чоловіків, що не піддаються впливу, І рівень смертності для підданих жінок більший, ніж рівень смертності для жінок, що не піддаються впливу. Альтернативно, це також буде мати місце, коли рівень смертності підданих чоловіків менше, ніж рівень смертності для чоловіків, що не піддаються впливу, І рівень смертності для підданих жінок менше, ніж рівень смертності для жінок, що не піддаються впливу. Тобто коли
(aa+b<cc+d) and (a−1a+b−2<c−1c+d−2)
Or
(aa+b>cc+d) and (a−1a+b−2>c−1c+d−2)
X=100a=0.5,b=0.8,c=0.9 . Тоді у нас буде парадокс Сімпсона, коли:
(0.50.8+0.9<0.90.9+d) and (0.5−10.5+0.8−2<0.9−10.9+d−2)
( - 9 < д< 1,44 ) та ( 0,96 < д< 1.1 )
( 0,96 , 1 ]
Другий набір нерівностей дає:
( 0,50,8 + 0,9> 0,90,9 + д) і ( 0,5 - 10,5 + 0,8 - 2> 0,9 - 10,9 + д- 2)
( д< - 0,9 або d> 1,44 ) і ( 0,96 < д або d> 1,44 )
яка не має рішення для г∈ [ 0 , 1 ]
Отже, для трьох значень, які ми обрали a , b , і c, щоб викликати парадокс Сімпсона, гмає бути більше 0,96. У випадку, коли значення було0,99 тоді ми отримаємо рівень смертності для чоловіків Росії
0,5 / ( 0,5 + 0,8 ) = 38 % у групі, що піддалася впливу
0,9 / ( 0,9 + 0,99 ) = 48 % у групі, що не зазнала впливу
і для жінок:
( 0,5 - 1 ) / ( 0,5 + 0,8 - 2 ) = 71 % у групі, що піддалася впливу
( 0,9 - 1 ) / ( 0,9 + 0,99 - 2 ) = 91 % у групі, що не зазнала впливу
So, males have a higher death rate in the unexposed group than in the exposed group, and females also have a higher death rate in the unexposed group than the exposed group, yet the death rates in the aggregated data are the same for exposed and unexposed.