Насамперед: З того, що я зрозумів, залишкові завантажувальні роботи залишаються таким чином:
- Підходить модель до даних
- Обчисліть залишки
- Перекомпонуйте залишки та додайте їх до 1.
- Підібрати модель до нового набору даних з 3.
- Повторіть
n
рази, але завжди додайте залишки, що перекомпоновані, у відповідність з 1.
Чи правильно це поки що?
Що я хочу зробити, це щось трохи інше:
Я хочу оцінити невизначеність параметрів та прогнозування для алгоритму, який оцінює деяку змінну середовища.
У мене є часовий ряд без помилок (від моделювання) цієї змінної x_true
, до якої я додаю шум, x_noise
щоб створити синтетичний набір даних x
. Потім я намагаюся знайти оптимальні параметри, встановлюючи мій алгоритм сумою квадратів sum((x_estimate - x_true)^2)
(! Не x_estimate - x
!) Як цільову функцію. Для того, щоб побачити, як працює мій алгоритм, і створити зразки розподілу моїх параметрів, я хочу перевпорядкувати x_noise
, додати його x_true
, знову підходити до своєї моделі, промивати та повторювати. Це правильний підхід до оцінки невизначеності параметрів? Чи можу я інтерпретувати пристосування до завантажених наборів даних як невизначеність прогнозування, чи потрібно дотримуватися процедури, яку я розмістив вище?
/ редагувати: Я думаю, я не дуже зрозумів, що робить моя модель. Подумайте про це, як по суті, як про метод знеструмлення. Це не прогностична модель, це алгоритм, який намагається отримати основний сигнал шумних часових рядів даних про навколишнє середовище.
/ edit ^ 2: Для користувачів MATLAB там я записав короткий та брудний приклад лінійної регресії того, що я маю на увазі.
Це те, що я вважаю "звичайним" завантаженням залишків (будь ласка, виправте мене, якщо я помиляюся): http://pastebin.com/C0CJp3d1
Це те, що я хочу зробити: http://pastebin.com/mbapsz4c