У мене є труднощі зрозуміти форму довірчого інтервалу поліноміальної регресії.
Ось штучний приклад, . На лівій фігурі зображено UPV (немасштабна дисперсія прогнозу), а правий графік показує довірчий інтервал та (штучні) вимірювані точки при X = 1,5, X = 2 та X = 3.
Деталі основних даних:
набір даних складається з трьох точок даних (1.5; 1), (2; 2.5) та (3; 2.5).
кожна точка була "виміряна" 10 разів, і кожне вимірюване значення належить . На 30 результуючих точках було проведено MLR з пойномальною моделлю.
інтервал довіри обчислювали формулами і (обидві формули взяті від Майєрса, Монтгомері, Андерсона-Кука, "Методика поверхні відповіді", четверте видання, сторінки 407 та 34)у(х0)-тα/2,де(етрпрог)√
leцу| х0≤у(х0)+Tα/2,де(етрпрог)√
і .
Мене не особливо цікавлять абсолютні значення інтервалу довіри, а скоріше форма UPV, яка залежить лише від .
дуже висока прогнозована дисперсія поза проектним простором є нормальною, оскільки ми екстраполюємо
але чому дисперсія менша між X = 1,5 і X = 2, ніж у виміряних точках?
і чому дисперсія стає ширшою для значень понад X = 2, але потім зменшується після X = 2,3, щоб знову стати меншою, ніж у виміряній точці при X = 3?
Чи не було б логічним, щоб дисперсія була невеликою в виміряних точках і великою між ними?
Редагувати: та сама процедура, але з точками даних [(1.5; 1), (2.25; 2.5), (3; 2.5)] та [(1.5; 1), (2; 2.5), (2.5; 2.2), (3; 2.5)].
Цікаво зауважити, що на малюнках 1 і 2 UPV у точках рівно дорівнює 1. Це означає, що довірчий інтервал буде точно рівний . Зі збільшенням кількості балів (рисунок 3) ми можемо отримати UPV-значення на виміряних точках, менших за 1.