Что такое футбол? Кто-то скажет, что это просто игра, вид спорта. Но… Для одних футбол – это больше чем игра и спорт, а для других – это жизнь, страсть, “наркотик”. Футбол – самое популярное зрелище на планете, и каждый относится к нему по-разному. Но всех интересует один вопрос – кто же победит в матче. Будь вы ярым болельщиком или букмекером, который пытается заработать на ставке, оба будете думать об одном – каким будет результат матча. Можно ли предугадать или, еще лучше, просчитать исход этого события? Знать наперед – победит твоя команда или потерпит поражение, или же будет ничья.
Именно этим вопросом мы задались, проводя анализ факторов, влияющих на результат матча. Для этого воспользовались методами эконометрического анализа и выбрали парную и множественную регрессию для анализа статистических данных по футбольным командам. В качестве объясняющих переменных были выбраны следующие показатели: количество забитых голов, количество пропущенных голов, количество штрафных карточек (желтых + красных), процент владения команды мячом. Соответственно объясняемой переменной является результат матча, принимающей значения: 1 – победа команды; 0 – поражение команды; 0,5 – ничья. В качестве значений для объясняющих переменных были приняты результаты 30 последних матчей по каждой из рассматриваемых команд. Было выявлено, что объясняющие переменные (экзогенные) на 39-47% объясняют эндогенную переменную. Проведя регрессионный анализ, нами были получены следующие результаты.
Во-первых, с помощью построенных моделей с выбранными тремя футбольными командами и полученными оценками результаты 88 матчей совпали с оценочными значениями. Почему не 90 из 90? На этот вопрос ответ будет дан позже. Был составлен прогноз на ближайшие 2 матча для каждой из выбранных команд. В итоге, в 4-х из 6 случаев – прогноз исходов матчей совпал с реальными результатами. Достаточно высокий показатель успеха. В то же время – это результат анализа одной конкретной команды, а в игре принимают участие две. Было принято решение проанализировать целый чемпионат в целом и рассматривать уже не отдельные команды, а их совокупности и затем сравнить полученные результаты исследований. Соответственно, если у обеих команд прогнозируется победа, то скорее всего победит та, чье оценочное значение будет выше, и наоборот. На примере Чемпионата Испании, было рассмотрено 380 матчей между 20 командами. Процент совпадений оценочных значений с итогами матчей составил 78%. Весьма положительный результат.
Обсудим вариант, когда имеются несовпадения результатов матчей. Изначально нами было решено, что это какая-то погрешность. Однако, изучив отзывы и оценки экспертов за матчи, выяснились следующие позиции. Почти все эксперты считают, что результаты матчей, чьи данные не совпали, были заранее обговорены (договорные матчи), что само по себе является незаконным.
Проведя полное исследование составленных регрессионных уравнений, выявлено, каким образом и почему именно так влияют на объясняемую переменную факторы, выбранные в качестве объясняющих переменных. Во-первых, проанализировано влияние количества забитых и пропущенных голов: чем больше голов, тем выше и вероятность выигрыша, и такая же зависимость между количеством пропущенных голов и вероятностью проигрыша. В процессе анализа нами было выявлено, что в промежутке между 1-3 забитыми/пропущенными голами вероятность победы/поражения команды растет более медленно, нежели при последующих очках. Другими словами, все в игре можно изменить, учитывая и другие аспекты игры. Нельзя опираться только на табло. Во-вторых, нами учитывается фактор – “количество штрафных карточек”. Была выявлена прямая зависимость между ростом числа штрафных карточек и вероятностью проигрыша. Определено, что каждое последующее увеличение данного показателя на одну единицу увеличивает шансы команды на поражение. В ходе анализа последнего фактора – “процент владения команды мячом”, были получены данные, которые не давали прямого ответа о влиянии фактора на объясняемую переменную. Не в каждом случае наличие высокого значения этого показателя означало высокую вероятность победы команды. У каждой из команд показатели разнились, ровно, как и зависимость между его значением и вероятным исходом. Таким образом, мы пришли к выводу, что выбранных нами показателей недостаточно, и следовало бы учесть другие возможные факторы игры, не включенные нами в число рассматриваемых.
Возможно, если выбрать больше объясняющих переменных с более высоким влиянием на объясняемую переменную, то процент успеха прогноза будет близок к 100%. Но на данный момент мы не можем с точностью спрогнозировать результат матчей.
Результатами проведенного исследования можно воспользоваться в качестве одного из инструментов при принятии решений – делать ставки или нет. Для этого могут быть использованы определенные расчеты для возможности сделать разные ставки на одни и те же матчи. В этом случае, возможно найти прибыльный вариант.
В процессе исследования показался весьма интересным тот факт, что возможен вариант появления ситуации “договорного” матча. Хотя конечно, 100-процентной вероятности в этом нет. Тут следует полагаться только на мнение экспертов или проводить дополнительные исследования. На наш взгляд, эта информация может заинтересовать различные футбольные комитеты и ассоциации.
В итоге, несмотря на определенные погрешности и неточности, был найден один из возможных способов прогнозирования исходов футбольных матчей. Если провести более углубленный анализ названных проблем, то можно обнаружить и другие аспекты, полезные для исследования.