Я відвідую клас аналізу даних, і деякі мої добре вкорінені ідеї хитаються. А саме думка про те, що помилка (epsilon), як і будь-яка інша різновид дисперсії, стосується лише (так я думав) для групи (вибірки або цілої сукупності). Тепер нас вчать, що одне з припущень регресії - це те, що дисперсія "однакова для всіх людей". Це мене якось шокує. Я завжди думав, що різниця в Y за всіма значеннями X вважалася постійною.
Я спілкувався з професором, який сказав мені, що коли ми регресуємо, ми вважаємо, що наша модель є правдивою. І я думаю, що це складна частина. Для мене термін помилки (epsilon) завжди означав щось на кшталт "будь-яких елементів, які ми не знаємо, і це може вплинути на нашу змінну результату, плюс деяку помилку вимірювання". У тому, як викладають клас, немає такого поняття, як "інші речі"; наша модель вважається справжньою та повною. Це означає, що всі залишкові зміни повинні розглядатися як добуток помилки вимірювання (таким чином, очікується, що вимірювання особини в 20 разів призведе до такої ж дисперсії, як одноразове вимірювання 20 особин).
Я відчуваю, що десь щось не так, я хотів би мати якусь експертну думку з цього приводу ... Чи є місце для тлумачення того, що таке термін помилки, концептуально кажучи?