Просмотров: 13854

PageRank позволяет анализировать стратегию футбольных команд


Уже давно считается, что возможности статистического анализа в футболе ограничены по сравнению с такими играми, как американский футбол, бейсбол или крикет. Помимо прочего, в футболе нет сравнительно долгих пауз, в течение которых можно было бы собирать и анализировать данные. Но ситуация меняется прямо на наших глазах. Воспользовавшись теорией сетей и проанализировав с ее помощью результативность футбольных команд и отдельных игроков, можно сделать удивительные выводы о том, какую стратегию должна применять при игре идеальная сборная мира по футболу.

Несомненно, в минувшее воскресенье многие мои читатели-программисты смотрели финал чемпионата Европы по футболу, игру, в ходе которой сборная Испании разгромила измотанную сборную Италии со счетом 4:0. Таким образом, сборная Испании выигрывает уже третье крупное футбольное первенство подряд, подтверждая свой статус лучшей футбольной команды современности и одной из лучших команд в истории футбола.

Итак, благодаря чему именно Испания достигла таких высот? Фанаты, эксперты и спортивные журналисты в один голос объясняют этот успех прославленной испанской стратегией, основанной на филигранной распасовке. Такой стиль получил название «тики-така». Его ни с чем не спутаешь, за ним очень интересно наблюдать, что лишний раз подтвердила эта яркая воскресная игра. Но этот стиль гораздо сложнее описать и классифицировать.

И вот, похоже, ситуация меняется. Хавьер Лопес Пенья из Университетского Колледжа и Гуго Тушетт из Университета имени Королевы Мэри, также расположенного в Лондоне, обнаружили совершенно новый способ анализа и описания результативности футбольных команд и отдельных игроков. В ходе исследования ученые опирались на математическую теорию сетей.

Алгоритмический футбол

По утверждению исследователей, их подход позволяет сформулировать количественное представление игрового стиля команды, идентифицировать основных действующих лиц и обнаруживать потенциальные слабые места.

Ключевая идея состоит в том, что каждого игрока можно представить как узел в сети, а каждый пас — как отрезок, соединяющий узлы. Потом узлы распределяются таким образом, чтобы представить игровую позицию каждого спортсмена на поле.

На показанной ниже картинке представлены такие сети, полученные в результате анализа игр сборной Нидерландов (слева) и сборной Испании (справа), проведенных на стадии плей-офф в ходе последнего чемпионата мира по футболу в ЮАР, состоявшегося в 2010 году. Именно эти команды участвовали в финальном матче, победа в котором досталась Испании.

Футбол анализ матча финал теорией сетей тики-така PageRank анализ SEO google исследование пас мяч игроки игра сборная Испании

Если внимательно рассмотреть эти сети, сразу же бросаются в глаза некоторые интересные особенности того финального матча. Толщина стрелок отражает количество пасов между узлами. Соответственно, мы видим, что сборная Испании пасовала чаще. На этой картинке зафиксировано 417 пасов сборной Испании и всего 266 пасов сборной Нидерландов.

Ведущие игроки также выделяются благодаря количеству переданных и полученных пасов. Так, Серхио Бускетс обладает показателем 16, а Хави — 8.

Правда, данное представление позволяет провести и гораздо более тонкий анализ, при котором используется всего лишь стандартный инструментарий теории сетей

Например, показатель «центральность по близости» (closeness centrality) демонстрирует, насколько легко достичь определенного узла в сети. Если говорить о футболе, то этот показатель позволяет судить, как этот игрок взаимодействует с командой.

Наивысшими показателями в испанской команде обладают Бускетс и Хави. Узлы, которыми они обозначены, имеют более качественные связи, чем у лучшего игрока сборной Голландии, вратаря Мартена Стекеленбурга (№ 1). Сам факт, что в команде Нидерландов больше всего связей ведет от полевых игроков к голкиперу, более красноречив, чем целые тома аналитики.

Другой важный показатель для анализа — центральность по посредничеству (betweenness centrality) — характеризует, насколько важную роль данный узел играет на пути между другими узлами. При анализе футбольного матча центральность по посредничеству позволяет судить, насколько работа с мячом между двумя игроками зависит от третьего игрока. Игроки с высоким уровнем центральности по посредничеству играют ключевые роли в поддержании темпа игры.

Эти игроки важны потому, что их удаление радикально повлияет на структуру сети. То есть, если в команде найдется один игрок, чья центральность по посредничеству будет зашкаливать, то такая команда окажется уязвимой, поскольку ее игра рассыплется, если этот игрок получит травму или «красную карточку».

Игрок № 11 сборной Испании, Жоан Капдевила, значительно превосходит по этому показателю всех остальных игроков на поле. Очевидно, что на него направлены пасы от многих игроков, которые Капдевила передает в основном игроку № 14 (Хаби Алонсо).

А тепер мы применим знаменитый алгоритм ранжирования PageRank. В нашем случае мы оценим популярность игрока по тому, сколько пасов он получает от других популярных игроков. В результате мы можем с достаточной точностью спрогнозировать, у кого окажется мяч после достаточно большого количества пасов. В данной игре по этому показателю лидирует испанец Хави.

Семь игроков, которые вышли на поле в стартовом составе команды, взявшей кубок мира 2010 года, оказались и в стартовом составе финального матча «Евро-2012». Было бы интересно проанализировать по методу Пеньи и Тушетта последнее европейское первенство и определить, насколько этот турнир отличается от предыдущего.

Будущее развитие метода

Правда, данный подход имеет и очевидные недостатки. Все эти данные — средние значения за несколько игр. Поэтому такой анализ не отражает динамику отдельно взятой конкретной игры. Положения узлов также представляют собой широкие обобщения и рассчитываются только с учетом стандартных позиций, в которых начинает матч тот или иной игрок.

Пенья и Тушетт и сами считают, что предложенный ими подход можно улучшить, и для этого есть несколько способов. Они предлагают добавить еще один узел, обозначающий ворота соперника, и подсчитать количество ударов по воротам. Кроме того, по мнению исследователей, можно применить похожий метод для измерения точности пасов. Для этого потребуется включить в анализ вероятность того, что пас от одного игрока к другому окажется успешным.

«Модель также следует дополнить показателем обороноспособности команды, который определяется путем отслеживания перехватов и возврата к владению мячом», — считают Пенья и Тушетт.

Пожалуй, еще интереснее был бы метод, который позволил бы собирать и анализировать данные в реальном времени. Таким образом, «сетевой» анализ игры можно было бы составлять, еще пока она разворачивается на поле.

dev.by, 2012

twitter.com facebook.com vkontakte.ru odnoklassniki.ru mail.ru ya.ru pikabu.ru blogger.com liveinternet.ru livejournal.ru google.com bobrdobr.ru yandex.ru del.icio.us

Подписка на обновления блога → через RSS, на e-mail, через Twitter
Теги: , , , , ,
Эта запись опубликована: Суббота, 7 июля 2012 в рубрике Мнения.

Оставьте комментарий!

Не регистрировать/аноним

Используйте нормальные имена. Ваш комментарий будет опубликован после проверки.

Зарегистрировать/комментатор

Для регистрации укажите свой действующий email и пароль. Связка email-пароль позволяет вам комментировать и редактировать данные в вашем персональном аккаунте, такие как адрес сайта, ник и т.п. (Письмо с активацией придет в ящик, указанный при регистрации)

(обязательно)


⇑ Наверх
⇓ Вниз