Всупереч іншим відповідям, я стверджую, що ви можете сказати щось про здібності Болтів за наявних даних. Перш за все, давайте звузимо ваше запитання. Ви запитуєте про найшвидших людей, але оскільки є різниця в розподілі швидкостей бігу для чоловіків і жінок, де найкраща жінка, яка біжить у бігунах, здається трохи повільнішою, ніж найкраща бігунка, ми повинні зосередитися на чоловіках-бігунах. Щоб отримати деякі дані, ми можемо переглянути найкращі річні виступи на 100 серіях за останні 45 років . Про ці дані слід помітити кілька речей:
- Це найкращі часи роботи, тому вони розповідають не про здібності всіх людей, а про мінімально досягнуті швидкості.
- Ми припускаємо, що ці дані відображають вибірку найкращих бігунів світу. Хоча могло статися, що були ще кращі бігуни, які не брали участі у чемпіонатах, це припущення видається досить обґрунтованим.
Спочатку обговоримо, як не проаналізувати ці дані. Ви могли помітити, що якщо ми будуватимемо час виконання часу, ми спостерігатимемо сильну лінійну залежність.
Це може призвести до використання лінійної регресії для прогнозування того, наскільки краще бігунів ми могли б спостерігати в наступні роки. Це, однак, буде дуже поганою ідеєю, яка неминуче приведе вас до висновку, що приблизно через дві тисячі років люди зможуть пробігти 100 метрів за нульові секунди, і після цього вони почнуть домагатися негативного часу роботи! Це, очевидно, абсурдно, оскільки ми можемо собі уявити, що існує якась біологічна та фізична межа наших можливостей, що нам невідомо.
Як ви могли проаналізувати ці дані? По-перше, зауважте, що ми маємо справу з даними про мінімальні значення, тому для таких даних слід використовувати відповідну модель. Це призводить нас до розгляду моделей теорії екстремальних значень (див., Наприклад, Вступ до статистичного моделювання екстремальних значень книги Стюарта Коула). Ви можете припустити для цих даних узагальнений розподіл надзвичайних значень (GEV). Якщо де є незалежними і однаково розподіленими випадковими змінними, то слідує за розподілом GEV. Якщо ви зацікавлені в моделюванні мінімумів, то якщо є зразками мінімумів, тоX 1 , X 2 , … , X n Y i Z 1 , Z 2 , … , Z k - Z iY=max(X1,X2,…,Xn)X1,X2,…,XnYiZ1,Z2,…,Zk−Ziслідкуйте за розподілом GEV для мінімумів. Таким чином, ми можемо пристосувати розподіл GEV до даних про швидкість бігу, що призводить до досить приємного пристосування (див. Нижче).
Якщо ви подивитесь на кумулятивний розподіл, запропонований моделлю, ви помітите, що найкращий час роботи Юсейна Болта - це найнижчий1%хвіст розподілу. Отже, якщо ми будемо дотримуватися цих даних і цього аналізу на прикладі іграшок, ми б зробили висновок, що набагато менші тривалість роботи малоймовірні (але, очевидно, можливі). Очевидна проблема цього аналізу полягає в тому, що ігнорується той факт, що ми спостерігали щорічні покращення найкращих періодів роботи. Це повертає нас до проблеми, описаної в першій частині відповіді, тобто, якщо припустити регресійну модель тут ризиковано. Ще одна річ, яку можна вдосконалити - це те, що ми могли б використовувати байєсівський підхід та припускати інформативність до того, яка б враховувала певні знання про фізіологічно можливі часи роботи, які, можливо, ще не спостерігалися (але, наскільки я знаю, це наразі невідомо). Нарешті, подібні теорії екстремальної вартості вже використовувались у спортивних дослідженнях, наприклад, Ейнмахл та Магнус (2008) уЗаписи з легкої атлетики за допомогою теорії надзвичайних цінностей .
Ви можете протестувати, що ви не питали про ймовірність швидшого часу бігу, а про ймовірність спостереження за швидшим бігуном. На жаль, тут ми не можемо багато зробити, оскільки не знаємо, яка ймовірність того, що бігун стане професійним спортсменом, і записані час бігу будуть доступні для нього. Це не відбувається випадковим чином, і багато факторів сприяють тому, що деякі бігуни стають професійними спортсменами, а деякі ні (або навіть, що хтось любить бігати і бігати взагалі). Для цього нам слід було б мати докладні дані про повну популяцію про бігунів, до того ж, оскільки ви запитуєте про крайності розподілу, дані повинні були бути дуже великими. Тож щодо цього я згоден з іншими відповідями.