Кожен, хто слідкує за бейсболом, ймовірно, чув про нестандартне виконання MVP типу Жозе Баутіста в Торонто. За чотири роки тому він забивав приблизно 15 домашніх пробіжок за сезон. Минулого року він потрапив до 54, кількість перевершила лише 12 гравців в історії бейсболу.
У 2010 році йому виплатили 2,4 мільйона, і він просить у команди 10,5 мільйонів за 2011 рік. Вони пропонують 7,6 мільйона. Якщо він зможе повторити це в 2011 році, він буде легко вартий будь-якої суми. Але які шанси на нього повторюються? Наскільки важко ми можемо очікувати, що він до кінця регресує? Скільки його виступу, як ми можемо очікувати, було обумовлено випадковістю? Що ми можемо очікувати, що його загальний регрес до середнього рівня за 2010 рік? Як мені це зробити?
Я бавився з базою баз бейсболу Lahman і видавив запит, який повертає додому загальні суми для всіх гравців за попередні п’ять сезонів, у яких було щонайменше 50 атлетиків за сезон.
Таблиця виглядає приблизно так (зауважте Хосе Баутіста у рядку 10)
first last hr_2006 hr_2007 hr_2008 hr_2009 hr_2010
1 Bobby Abreu 15 16 20 15 20
2 Garret Anderson 17 16 15 13 2
3 Bronson Arroyo 2 1 1 0 1
4 Garrett Atkins 29 25 21 9 1
5 Brad Ausmus 2 3 3 1 0
6 Jeff Baker 5 4 12 4 4
7 Rod Barajas 11 4 11 19 17
8 Josh Bard 9 5 1 6 3
9 Jason Bartlett 2 5 1 14 4
10 Jose Bautista 16 15 15 13 54
і повний результат (232 рядки) доступний тут .
Я справді не знаю, з чого почати. Чи може хтось вказати мене в правильному напрямку? Деякі відповідні теорії та команди R були б особливо корисними.
Спасибі ласкаво
Томмі
Примітка. Приклад трохи надуманий. Домашні вибори безумовно не найкращий показник вартості гравця, а підсумки домашнього бігу не враховують різну кількість шансів за сезон, що тісто має шанс потрапити на домашні пробіги (виступи в складі). Це також не відображає, що деякі гравці грають на більш сприятливих стадіонах, і середній час вдома в лізі змінюється рік за роком. І т.д.