Пояснення того, що Нейт Сілвер сказав про лес


23

У запитанні, яке я нещодавно задав , мені відповіли, що екстраполяція з льосом було великим «ні-ні». Але в останній статті Нейт Сілвер на FiveThirtyEight.com він обговорював використання льосу для здійснення передвиборчих прогнозів.

Він обговорював специфіку агресивних проти консервативних прогнозів з льосом, але мені цікаво обгрунтованість того, щоб робити майбутні прогнози з льосом?

Мене також цікавить ця дискусія та які ще існують альтернативи, які можуть мати подібні переваги до льосів.


Якщо ваша x-змінна - час, було б небезпечно використовувати loess для передбачення майбутнього (що було б поза діапазоном даних). Але це не означає, що ви не можете використовувати лос для загальних прогнозів.
Glen_b -Встановіть Моніку

@Glen_b з цікавості, що б я щось передбачив?
a.powell

7
Уявіть нелінійний взаємозв'язок між часткою людей, схильних голосувати за партію А, і рівнем безробіття (разом з іншими прогнозами - наслідки для окремих штатів, наприклад). Далі уявіть, що нові дані про безробіття просто стають доступними; в межах діапазону значень, що виникають у навчальному наборі, але не обов'язково - це значення, представлене в цьому наборі (наприклад, минуле безробіття становить від 5 до 12%, і зараз ми маємо цифру 8,3%, прогноз буде стабільним). Тоді ми могли б використовувати льос для прогнозування пропорції голосування А, не виходячи за межі 5-12% безробіття.
Glen_b -Встановіть Моніку

1
@Glen_b Дякую Це чудова ілюстрація того, як це можна використовувати для прогнозів.
a.powell

Відповіді:


28

Проблема з низькою або лессою полягає в тому, що вона використовує поліноміальну інтерполяцію. При прогнозуванні добре відомо, що поліноми мають нестабільну поведінку у хвостах. Під час інтерполяції фрагменти поліномів 3-го ступеня забезпечують відмінну та гнучку моделювання тенденцій, тоді як екстраполюючи поза межі спостережуваних даних, вони вибухають. Якби ви спостерігали пізніші дані у часовому ряду, вам, безумовно, знадобилося б включити ще одну точку розриву в сплайни, щоб отримати гарну форму.

Моделі прогнозування, однак, добре вивчені в інших місцях літератури. Процес фільтрації, як фільтр Кальмана та фільтр частинок, дає чудові прогнози. В основному, хорошою моделлю прогнозування буде все, що базується на ланцюгах Маркова, де час не трактується як параметр у моделі, але попередні стани моделі використовуються для інформування прогнозів.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.