"Краще" - це функція вашої моделі.
Частина причини вашої плутанини - ви написали лише половину своєї моделі.
Коли ви кажете , це насправді не так. Ваші спостережувані значення не дорівнюють ; вони мають компонент помилок. y a x by=axbyaxb
Наприклад, дві згадані вами моделі (не єдині можливі моделі будь-якими способами) роблять абсолютно різні припущення про помилку.
Ви , ймовірно , означає що - то ближче до .E(Y|X=x)=axb
Але що тоді ми будемо говорити про відхилення від цього очікування в заданому ? Це важливо!хYx
Коли ви підходите до нелінійної моделі найменших квадратів, ви говорите, що помилки є адитивними, а стандартне відхилення помилок є постійним у всіх даних:
yi∼N(axbi,σ2)
або рівнозначно
yi=axbi+ei , зvar(ei)=σ2
навпаки, коли ви берете журнали та встановлюєте лінійну модель, ви говорите, що помилка є додатковою за шкалою журналу та (за шкалою журналу) постійною для даних. Це означає, що в масштабі спостережень термін помилки є мультипликативним , і тому помилок більше, коли очікувані значення більше:
yi∼logN(loga+blogxi,σ2)
або рівнозначно
yi=axbi⋅ηi , зηi∼logN(0,σ2)
(Зауважте, що не є 1. Якщо невелике, потрібно дозволити цей ефект)E(η)σ2
(Ви можете робити найменші квадрати, не припускаючи нормальності / лонормальних розподілів, але центральне питання, що обговорюється, все ще застосовується ... і якщо ви ніде не є нормальними, ви, мабуть, повинні розглянути іншу модель помилок у будь-якому випадку)
Тож найкраще залежить від того, яка модель помилки описує ваші обставини.
[Якщо ви робите дослідницький аналіз із деякими даними, які раніше не бачились, ви б розглядали питання типу "Як виглядають ваші дані? (Тобто побудовані проти ? Як виглядають залишки проти ?" З іншого боку, якщо такі змінні не є рідкістю, ви вже повинні мати інформацію про їх загальну поведінку.]yxx