Чи використовувати компенсацію в регресії Пуассона при прогнозуванні загальних кар'єрних цілей, забитих хокеїстами


10

У мене виникло питання щодо того, чи можна використовувати компенсацію. Припустимо дуже просту модель, де ви хочете описати (загальну) кількість голів у хокеї. Отже, у вас є цілі, кількість зіграних ігор та фіктивна змінна "нападник", яка дорівнює 1, якщо гравець є нападником, а 0 - в іншому випадку. Отже, яка з наведених моделей правильно вказана?

  1. цілі = ігри + нападник, або

  2. голи = залік (ігри) + нападник

Знову ж таки, цілі - це загальні цілі, а кількість ігор - це загальні ігри для одного гравця. Наприклад, може бути гравець, який має 50 голів у 100 іграх, та ще один гравець, який має 50 голів у 50 іграх тощо.

Що я повинен робити, коли хотів би оцінити кількість голів? Чи справді потрібно тут використовувати офсет?

Список літератури:


Яка ваша залежна змінна? Чи загальна кількість голів у кар'єрі на сьогоднішній день для конкретного гравця? Крім того, чи є причина, чому ви не хочете прогнозувати середні цілі на гру?
Джеромі Англім

Так, це загальна кількість голів! Ні, я не маю даних для кожної гри. Я просто маю загальні дані.
MarkDollar

Залежною змінною є (кількість) цілей. (Дивіться рівняння вище)
MarkDollar

Я трохи переробив заголовок, щоб він не був дублікатом попереднього питання. Не соромтеся змінювати, якщо я неправильно трактував.
Джеромі Англім

Відповіді:


16

Офсетна модель - це моделювання цілей на гру, як видно тут:

log(goals/games) = a+bx

еквівалентно

log(goals) -log(games) = a+bx

еквівалентно

log(goals)= a+bx +log(games)   <-this is an offset model, assumes coef on the last term =1

Дивіться слайд 35 тут: http://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/4glm3-ha-online.pdf

Якщо ви думаєте, що значення + bx пов'язане із коефіцієнтом журналу цілей до ігор (швидкістю), використовуйте зміщення. Якщо ви думаєте, що є більш складний ігровий ефект, можливо, від накопичення досвіду, не варто. Для більш детальної дискусії дивіться це: http://ezinearticles.com/?The-Exposure-and-Offset-Variables-in-Poisson-Regression-Models&id=2155811


1

Кілька простих моментів, які безпосередньо не стосуються вашого питання щодо компенсації:

  • Я хотів би подивитись, чи відповідає кількість ігор середнім забитим голам. У багатьох елітних гольових видах спорту, які я можу придумати (наприклад, футбол, австралійський правила футболу тощо), я б передбачив, що довголіття кар'єри пов'язане з успіхом кар'єри. І принаймні для гравців, які забивають ролі, успіх пов'язаний із кількістю забитих голів. Якщо це правда, то кількість ігор охоплює два ефекти. Можна сказати, що більше ігор означає більше можливостей забити голи; а інший залучає ефекти, пов'язані з навичками. Ви можете вивчити залежність між кількістю ігор та середніми забитими голами (наприклад, цілями / кількістю ігор), щоб вивчити це. Я думаю, що це має суттєве значення для будь-якого моделювання, яке ви робите.
  • Мої інстинкти - перетворити залежну змінну в середні цілі за гру. Я усвідомлюю, що ви мали би більш точне вимірювання вміння гравця для тих, хто грав більше ігор, тому, можливо, це буде проблемою. Залежно від точності вашої моделі, яку ви бажаєте, і результату розподілу гравців означає, що ви можете покластися на стандартні лінійні методи моделювання. Але, можливо, це трохи надто застосовано для ваших цілей, і, можливо, у вас є причини, щоб хотіти моделювати загальну кількість забитих голів.

Привіт Джеромі! Те, що ви визначаєте, абсолютно правильне. Але немає можливості створити модель, яка вимірює цілі / ігри. Тож я змушений до вищезгаданої моделі (цілі як залежні та ігри як незалежна змінна). Я знаю, що ігри співвідносяться з такими речами, як майстерність, і що я повинен вивчити цю проблему (опущені проблеми змінних та ендогенність). Але на даний момент мені цікаво, яку з двох вищезгаданих моделей слід використовувати!
MarkDollar
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.