Оновлення 2014-01-15
Я усвідомлюю, що не відповів на початкове запитання Даніки про те, чи буде похибка для непрямо скоригованої пропорції вимкнена, буде більшою чи меншою, ніж похибка для тієї ж швидкості в ACS. Відповідь: якщо пропорції категорії компанії не різко відрізняються від державних пропорцій ACS, похибка, наведена нижче, буде меншою, ніж розмір похибки ACS. Причина: непряма ставка розглядає категорію робочих місць організації, яка зараховується (або відносні пропорції) як фіксовану кількість. Фактично, оцінка ACS пропорції непрацездатних вимагає, фактично, оцінки цих пропорцій, і похибка збільшуватиметься для цього.
Для ілюстрації напишіть відключену ставку як:
P^adj=∑ninpi^
де - розрахунковий коефіцієнт непрацездатності в категорії в ACS.p^ii
З іншого боку, розрахунковий показник АСУ фактично:
P^acs=∑(NiN)ˆpi^
де та - відповідно категорія населення та загальна кількість, а - частка населення в категорії .NiNNi/Ni
Таким чином, стандартна похибка для швидкості ACS буде більшою через необхідність оцінки на додаток до .Ni/Npi
Якщо пропорції категорії організації та розрахункові пропорції населення сильно різняться, то, можливо, . У прикладі, який я сконструював, категорії були представлені у пропорціях та . Стандартна помилка для розрахункової пропорції відключеної становила .SE(P^adj)>SE(P^acs)N1/N=0.7345N2/N=0.2655SE(P^acs)=0.0677
Якщо я вважав 0,7345 та 0,2655 фіксованими значеннями та (підхід непрямого регулювання), , набагато меншими. Якщо замість цього, і , , приблизно те саме, що На крайньому і , . Я був би здивований, якщо пропорції організації та категорії населення настільки різко різняться. Якщо вони цього не роблять, я вважаю, що безпечно використовувати похибку ACS як консервативну, можливо, дуже консервативну оцінку справжньої похибки.n1/nn2/nSE(P^adj)=0.0375n1/n=0.15n2/n=0.85SE(P^adj)=0.0678SE(P^acs)n1/n=0.001S Е ( Р д J ) = 0,079n2/n=0.999SE(P^adj)=0.079
Оновлення 2014-01-14
Коротка відповідь
На мою думку, було б безвідповідально представляти таку статистику без CI або помилки (половина довжини CI). Для їх обчислення вам потрібно буде завантажити та проаналізувати зразок мікроданих ACS для загального користування (PUMS) ( http://www.census.gov/acs/www/data_documentation/public_use_microdata_sample/ ).
Довга відповідь
Це насправді не повторне зважування АСУ. Це версія непрямої стандартизації, стандартної процедури в епідеміології (google або переглянути будь-який текст епі). У цьому випадку показники працездатності за категоріями працездатності, що відповідають статусу праці, визначаються залежно від кількості працівників. Це дозволить обчислити очікувану кількість інвалідів в організації E
, яку можна порівняти із спостережуваною кількістю O
. Звичайна метрика для порівняння - це стандартизоване співвідношення R= (O/E)
. (Звичайний термін "SMR" для "стандартизованого коефіцієнта смертності", але тут "результат" - інвалідність.) R
- це також співвідношення спостережуваного рівня втрати працездатності (O/n)
та опосередкованого нормованого показника (E/n)
, де n
кількість працівників організації.
У цьому випадку виявляється, що потрібен лише CI для E
або E/n
знадобиться, тож я розпочну з цього:
Якщо
n_i = the organization employee count in job category i
p_i = disability rate for job category i in the ACS
Тоді
E = sum (n_i p_i)
Варіантність E
:
var(E) = nn' V nn
де nn
стовпець вектора категорій організаційних підрахунків та V
є матрицею оціночної дисперсії-коеваріації коефіцієнта інвалідності категорії ACS.
Також тривіально, se(E) = sqrt(var(E))
і se(E/n) = se(E)/n
.
і 90% ІС для Е є
E ± 1.645 SE(E)
Розділіть на, n
щоб отримати CI для E/n
.
Для оцінки var(E)
вам потрібно буде завантажити та проаналізувати дані зразка мікроданих ACS для загального користування (PUMS) ( http://www.census.gov/acs/www/data_documentation/public_use_microdata_sample/ ).
Я можу говорити лише про процес обчислення var(E)
в Stata. Оскільки я не знаю, чи це доступно для вас, я відкладу деталі. Однак хтось, хто знає про можливості опитування R або (можливо) SAS, також може надати код з рівнянь, наведених вище.
Інтервал довіри для співвідношення R
Інтервали довіри для R
звичайно базуються на припущенні Пуассона O
, але це припущення може бути невірним.
Ми можемо вважати O
і E
бути незалежними, так
log R = log(O) - log(E) ->
var(log R) = var(log O) + var(log(E))
var(log(E))
може бути обчислений як ще один крок Stata після обчислення var(E)
.
За припущенням про незалежність Пуассона:
var(log O) ~ 1/E(O).
Така програма, як Stata, може вмістити, скажімо, негативну біноміальну модель або узагальнену лінійну модель і дати точніший варіант варіації.
Приблизна 90% ДІ для log R
IS
log R ± 1.645 sqrt(var(log R))
і кінцеві точки можна експонувати, щоб отримати CI для R
.