Я намагаюся розібратися, як контролювати параметри згладжування в гем-моделі mgcv: gam.
У мене є біноміальна змінна, яку я намагаюся моделювати як головну функцію координат x і y на нерухомій сітці, а також деякі інші змінні з меншими впливами. Раніше я будував досить хорошу модель локальної регресії, використовуючи параметри locfit та лише значення (x, y).
Однак я хочу спробувати включити в модель інші змінні, і, схоже, узагальнені моделі добавок (GAM) були гарною можливістю. Переглянувши пакунки gam та mgcv, обидва з яких мають функцію GAM, я вибрав останнє, оскільки ряд коментарів у потоках списку розсилки, як видається, рекомендує це. Одним із недоліків є те, що він, схоже, не підтримує локальну регресію, більш гладку, як льос або локафіт.
Для початку я просто хотів спробувати повторити приблизно модель локафітів, використовуючи просто (x, y) координати. Я намагався як із звичайними, так і з тензорними гладкими виробами:
my.gam.te <- gam(z ~ te(x, y), family=binomial(logit), data=my.data, scale = -1)
my.gam.s <- gam(z ~ s(x, y), family=binomial(logit), data=my.data, scale = -1)
Однак, будуючи передбачення з моделі, вони набагато більш згладжені порівняно з моделлю локафіт. Тому я намагався налаштувати модель, щоб не загладжувати стільки. Я намагався коригувати параметри sp і k, але мені незрозуміло, як вони впливають на згладжування. У локафіті параметр nn контролює проміжок використовуваного мікрорайону, з меншими значеннями, що дозволяють зменшити згладжування та більше "хитання", що допомагає захопити деякі ділянки в сітці, де ймовірність результатів біноміальних швидко змінюється. Як би я почав налаштовувати ігрову модель, щоб вона могла поводитися аналогічно?