Чи можуть алгоритми машинного навчання прогнозувати спортивні бали чи ігри?


40

У мене є безліч наборів даних NFL, які, на мою думку, можуть стати гарним побічним проектом, але я з ними ще нічого не робив.

Заходжу на цей сайт, змусив мене подумати про алгоритми машинного навчання, і мені цікаво, наскільки вони хороші при прогнозуванні результатів футбольних ігор або навіть наступної гри.

Мені здається, були б певні тенденції, які можна було б визначити - 3-го зниження та 1-го, команда з сильним відбігом теоретично повинна мати тенденцію керувати м'ячем у цій ситуації.

Зарахування балів може бути складніше передбачити, але команда-переможець може бути.

Моє запитання - чи це хороші запитання щодо алгоритму машинного навчання. Можливо, тисяча людей спробували це раніше, але характер спорту робить це ненадійною темою.

Відповіді:


18

Є багато хороших запитань про футбол (і спорт взагалі), які було б приголомшливо закинути до алгоритму і подивитися, що виходить. Хитра частина полягає в тому, щоб знати, що кинути алгоритму.

Команда з гарною RB могла просто перейти на третю і коротку лише тому, що, наприклад, опоненти очікують бігу. Отже, щоб насправді отримати гідні результати, я би розбив проблему на більш дрібні шматки та проаналізував їх статистично, кидаючи їх до машин.

Є кілька (хороших) веб-сайтів, які намагаються зробити те саме, ви повинні перевірити їх і використовувати все, що вони знайшли, щоб допомогти вам:

І якщо ви справді хочете вивчити аналіз даних про спорт, обов'язково перегляньте відеоролики Слоанської спортивної конференції . Їх багато розповсюджується на Youtube.


13

Так. Чому ні?! Оскільки стільки даних записується в кожному виді спорту в кожній грі, розумне використання даних може призвести до того, щоб ми отримали важливі уявлення про продуктивність гравців.

Деякі приклади:

Так, так, статистичний аналіз записів гравців може дати нам уявлення про те, які гравці частіше виступатимуть, але які не гравці . Отже, машинне навчання, близький родич статистичного аналізу, виявиться змінником гри.


9

Однозначно вони можуть. Я можу націлити вас на хороший папір . Одного разу я використав це для впровадження алгоритму прогнозування результатів футбольної ліги, головним чином націлений на те, щоб мати певне значення проти букмекерів.

З реферату статті:

динамічна узагальнена модель Баєса для оцінки часових навичок всіх команд ліги та прогнозування футбольних матчів наступних вихідних.

Ключові слова:

Динамічні моделі, узагальнені лінійні моделі, графічні моделі, методи Монте-Карло ланцюга Маркова, передбачення футбольних матчів

Цитування:

Рю, Гавард та Ойвінд Сальвесен. "Прогнозування та ретроспективний аналіз футбольних матчів у лізі". Журнал Королівського статистичного товариства: Серія D (Статистика) 49.3 (2000): 399-418.


7

Машинне навчання та статистичні методи можуть покращити прогноз, але реальний результат ніхто не може передбачити.

Кілька місяців тому відбулося змагання з кубків з приводу прогнозування турніру NCAA 2014 . Ви можете прочитати Конкурсний форум, щоб краще зрозуміти, що люди робили та яких результатів вони досягли.


7

До цього було показано, що методи машинного навчання можуть застосовуватися для прогнозування спортивних результатів. Простий пошук у Google має отримати безліч результатів.

Однак також було показано (для NFL btw), що дуже складні моделі прогнозування, прості прогнозні моделі, опитування людей або знання натовпу, використовуючи інформацію про ставки, всі вони виконують більш-менш те саме. Джерело: " Все очевидно, як тільки ти дізнаєшся відповідь - як провалюється здоровий глузд ", глава 7, Дункан Уоттс.


Цікаво. Причиною, що я поставив запитання, є те, що я задумався, чи є щось подібне до "помилки азартних гравців" (чи навіть самого gf). Я подумав, що існує ймовірність, що це вже виявилося безрезультатним підприємством. Все-таки - ці інші відповіді інтригуючі.
Стів Каллестад

6

Майкл Маубуссін у своїй книзі «Рівняння успіху» розглядає відмежування удачі від майстерності в різних починаннях, включаючи спорт. Він насправді займає заняття спортом за кількістю удачі, яка сприяє результативності в різних видах спорту (стор. 23), і приблизно 2/3 ефективності у футболі можна віднести до майстерності. Навпаки, я використав методику ММ, щоб проаналізувати продуктивність у гонках Формули-1 і виявив, що 60% можна віднести до майстерності (менше, ніж я очікував.)

Але, мабуть, подібний аналіз передбачає, що достатньо детальний і продуманий набір функцій дозволить алгоритмам ML передбачити ефективність команд НФЛ, можливо, навіть на рівні гри, із застереженням, що значне відхилення все ще буде існувати через вплив удачі в грі.


5

Я читав про це, і мав на увазі наступний блог:

http://fellgernon.tumblr.com/post/46117939292/predicting-who-will-win-a-nfl-match-at-half-time#.UtehM7TWtQg

У цьому блозі йдеться про прогнозування матчу НФЛ після того, як тайм вже закінчився. Прогноз є на 80% точним для простої моделі GLM.

Я не знаю, чи підходить це для футболу.


5

Я провів деякі дослідження в цій галузі. Я виявив, що ланцюги Маркова в першому порядку працюють добре для прогнозування динаміки забиття ігор у різних видах спорту.

Детальніше ви можете прочитати тут: http://www.epjdatascience.com/content/3/1/4


5

Вони не можуть передбачити, але можуть сказати вам найбільш ймовірний результат. Існує дослідження про такий підхід від Етьєна - передбачення того, хто виграє Кубок світу з мовою Вольфрама . Це дуже детальне дослідження, тому ви можете перевірити всю методологію, що використовується для отримання прогнозів.

Досить цікаво, 11 з 15 матчів були правильними!

Як можна було очікувати, фаворитом є Бразилія, імовірність виграти 42,5%. Цей вражаючий результат пов'язаний з тим, що Бразилія має як найвищий рейтинг Ело, так і грає вдома.

(Ходімо в Бразилію!)


3

Дуже багато людей наголошували на тому, які речі можна передбачити у своїх відповідях. Тепер, захопившись глибоким навчанням, можна, наприклад, використовувати RNN (скажімо, LSTM) для прогнозування результатів для спортивних проблем, які базуються на часі. Це - найсучасніші та збиті традиційні моделі руками вниз.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.