Як надати більше ваги останнім спостереженням в R?
Я вважаю це запитанням чи бажанням, але мені важко зрозуміти, як саме це здійснити. Я намагався багато шукати для цього, але не можу знайти хорошого практичного прикладу.
У моєму прикладі я мав би великий набір даних із часом. Хочу сказати, застосувати якесь експоненціальне зважування рядків даних, які є останніми. Тому я мав би якусь експоненціальну функцію, яка говорить про те, що спостереження у 2015 році ___ важливіші для підготовки моделі, ніж спостереження у 2012 році.
Мої змінні набору даних містять суміш категоричних та числових значень, і моя ціль - це числове значення - якщо це має значення.
Я хотів би перевірити / спробувати це, використовуючи такі моделі, як GBM / Random Forest, в ідеалі в пакеті CARET.
оновлення-питання
Я ціную відповідь, подану нижче про те, як експоненціально розкласти вагу на відстань дати між двома точками.
Однак, коли мова заходить про тренування цієї моделі з каретою, як саме враховують ваги? Значення ваги в кожному з навчальних рядів - це відстань між деякою точкою в майбутньому та коли ця точка сталася історично.
Чи вступають у вагу лише під час прогнозування? Тому що, якби вони почали грати під час тренувань, чи не це спричинило б всілякі проблеми, оскільки різні перехресні склади мали б різну вагу, намагаючись передбачити щось, що може бути насправді за певний час до цього?