Розглянемо випадковий набір чисел, які зазвичай розподіляються:
x <- rnorm(n=1000, mean=10)
Ми хотіли б знати середню та стандартну помилки середньої величини, тому робимо наступне:
se <- function(x) { sd(x)/sqrt(length(x)) }
mean(x) # something near 10.0 units
se(x) # something near 0.03 units
Чудово!
Однак припустимо, що ми не обов'язково знаємо, що наш вихідний розподіл слід нормальному розподілу. Ми записуємо-перетворюємо дані та виконуємо той же стандартний обчислення помилок.
z <- log(x, base=10)
mean(z) # something near 1 log units
se(z) # something near 0.001 log units
Класно, але тепер нам потрібно перетворити назад, щоб отримати відповідь в одиницях НЕ журналів.
10^mean(z) # something near 10.0 units
10^se(z) # something near 1.00 units
Моє запитання: Чому для звичайного розподілу стандартна помилка відрізняється залежно від того, чи була вона обчислена від самого розподілу чи вона була перетворена, обчислена та зворотно трансформована? Примітка: засоби вийшли однаковими незалежно від трансформації.
РЕДАКТИКА №1: Зрештою, я зацікавлений у розрахунку середнього та довірчого інтервалів для нешироко розповсюджених даних, тому, якщо ви можете дати певні вказівки, як обчислити 95% ІС на перетворених даних, у тому числі про те, як зробити зворотну трансформацію до їх рідних одиниць , Я би оцінив це!
ЗАКРІБНА РЕДАКТА №1
EDIT № 2: Я спробував використати квантильну функцію, щоб отримати 95% довірчі інтервали:
quantile(x, probs = c(0.05, 0.95)) # around [8.3, 11.6]
10^quantile(z, probs = c(0.05, 0.95)) # around [8.3, 11.6]
Отже, той сходився на одній відповіді, що добре. Однак використання цього методу не забезпечує точно такий же інтервал, використовуючи ненормовані дані з "малими" розмірами вибірки:
t <- rlnorm(10)
mean(t) # around 1.46 units
10^mean(log(t, base=10)) # around 0.92 units
quantile(t, probs = c(0.05, 0.95)) # around [0.211, 4.79]
10^(quantile(log(t, base=10), probs = c(0.05, 0.95))) # around [0.209, 4.28]
Який метод вважали б "правильнішим". Я припускаю, що можна вибрати найбільш консервативну оцінку?
Як приклад, ви б повідомили цей результат для ненормованих даних (t) як середнього значення 0,92 одиниці з довірчим інтервалом 95% [0,211, 4,79]?
ЗАКРІБНА РЕДАКТА №2
Дякую за ваш час!