Зворотні результати перетворення регресії під час моделювання журналу (y)


11

Я встановлюю регресію в . Чи справедливо зворотне оцінювання точок перетворення (та інтервалі впевненості / прогнозування) шляхом експоненції? Я не вірю в це, оскільки але хотів думки інших.E [ f ( X ) ] f ( E [ X ] )log(y)E[f(X)]f(E[X])

Мій приклад нижче показує конфлікти із зворотною трансформацією (.239 проти .219).

set.seed(123)

a=-5
b=2

x=runif(100,0,1)
y=exp(a*x+b+rnorm(100,0,.2))
# plot(x,y)

### NLS Fit
f <- function(x,a,b) {exp(a*x+b)} 
fit <- nls(y ~ exp(a*x+b),  start = c(a=-10, b=15)) 
co=coef(fit)
# curve(f(x=x, a=co[1], b=co[2]), add = TRUE,col=2,lwd=1.2) 
predict(fit,newdata=data.frame(x=.7))
[1] 0.2393773

### LM Fit
# plot(x,log(y))
# abline(lm(log(y)~x),col=2)
fit=lm(log(y)~x)
temp=predict(fit,newdata=data.frame(x=.7),interval='prediction')
exp(temp)
        fit       lwr       upr
1 0.2199471 0.1492762 0.3240752

1
Хіба це не одна з проблем, яку вирішують гауссові GLM, пов'язані з журналом?
generic_user

@ARM Так, я так вірю. Дякуємо, що вказали на це. Однак за допомогою GLM важче отримати інтервали прогнозування, але я думаю, що я можу це розробити.
Глен

1
@Glen Виконайте пошук мазання Дуана на цьому сайті.
Мастеров Дмитро Васильович

Відповіді:


13

Це залежить від того, що ви хочете отримати на іншому кінці.

Інтервал довіри для перетвореного параметра перетворюється просто чудово. Якщо воно має номінальне покриття в масштабі журналу, воно буде мати таке ж покриття назад у вихідній шкалі через монотонність перетворення.

Інтервал прогнозування для майбутнього спостереження також перетворюється просто чудово.

Інтервал для середнього значення в масштабі журналу, як правило, не є відповідним інтервалом для середнього значення в початковій шкалі.

Однак іноді ви можете точно або приблизно скласти розумну оцінку середнього значення за початковою шкалою з моделі за шкалою журналу.

Однак потрібна обережність, інакше ви можете створити оцінки, які мають дещо дивовижні властивості (можна скласти оцінки, наприклад, що самі по собі не мають середньої сукупності; це не кожна ідея про хорошу річ).

Так, наприклад, у випадку логіки, коли ви експонуєте назад, у вас є хороша оцінка , і ви можете зауважити, що середнє значення сукупності - , тож ви можете подумати покращити , змінивши його за деякою оцінкою .exp(μi)exp(μi+12σ2)exp(μi^)exp(12σ2)

Потрібно, принаймні, мати можливість отримувати послідовну оцінку та справді деяку асимптотику розподілу за допомогою теореми Слуцького (зокрема, форми товару), доки можна послідовно оцінити коригування. Теорема безперервного картографування говорить про те, що ви можете, якщо ви можете оцінити послідовно ... в тому випадку.σ2

Отже, поки є послідовним оцінювачем , тоді переходить у розподілі до розподілу (який при огляді потім буде асимптотично розподілений ненормально ). Оскільки буде узгоджено для , то безперервна теорема відображення, буде відповідна для , і тому у нас є послідовний оцінювач означають у вихідній шкалі.σ^2σ2exp(μi^)exp(12σ^2) ^ μ i μiexp( ^ μ i )exp(μi)exp(μi^)exp(12σ2)μi^μiexp(μi^)exp(μi)

Дивіться тут .

Деякі пов’язані публікації:

Заднє перетворення моделі MLR

Задня трансформація

Інтервали довіри, трансформовані назад


1
Дякую, я переглянув попередні пости і, хоча просвічуючи, все ще був дещо розгублений, звідси і моє запитання.
Глен

+1 Відмінна відповідь! Лише швидке уточнення: звідки взявся за масштабування для ? Я бачив це у визначенні лонормального у Вікіпедії, але це також не пояснено, чи це просто інтеграція середнього з PDF? ^ σ 212σ2^
usεr11852

1
Ви можете отримати його просто шляхом інтеграції: де - щільність для логістики, але це, мабуть, простіше зробити, обчисливши для нормального (де ), але тоді, можливо, краще знайти MGF для - що не складніше - і з яких моментів для дуже легко отримати (замінивши на в свою чергу), фактично отримуючи вищі моменти безкоштовно. fE(Y)=0yf(y)dyfХ = увійти Y X Y T 1 , 2 , . . .E(eX)X=logYXYt1,2,...
Glen_b -Встановити Моніку

1
@ usεr11852 У будь-якому з останніх випадків ви берете або у термін у щільності, потім заповніть квадрат у та введіть додаткові константи (тобто всі, крім нормалізуюча константа для нормального) на передній частині інтеграла (в якому є ), залишаючи pdf Гаусса інтегрованим у реальній прямій (зі зміщеним середнім значенням від вихідної), яка інтегрується в 1, залишаючи лише приведені вами константи спереду. Це передбачає не що інше, як дуже прості алгебраїчні маніпуляції, ... e t x e . . . х 1exetxe...x12
ctd

1
ctd ... і звідки -й необроблений момент лонормального є . e μ t + 1teμt+12σ2t2
Glen_b -Встановіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.