Использование трекинг данных для анализа тактических схем команд

Недавно на конференции «FC Barcelona Sports Analytics Summit» было представлено исследование на тему использования трекинг данных при формировании и анализе оптимальной схемы команды. Я подумал, что было бы неплохо опубликовать в моем блоге более сокращенную версию. Работа, признанная на конференции «Лучшей исследовательской работой», была выполнена в сотрудничестве с Марком Гликманом из Гарвардской лаборатории спортивной аналитики.

Использование трекинг данных для анализа тактических схем команд

Вступление

Важным аспектом работы футбольного менеджера является выбор построения команд - пространственной конфигурации игроков на поле. Выбор расстановки определяет роли игроков, их взаимодействие и влияет на стиль игры обеих команд во время матча. Несмотря на их основную роль в общекомандной стратегии, описание формаций в значительной степени зависит от классификации, основанной на количестве защитников, полузащитников и нападающих: задачи поставленные игрокам будут отличаться в зависимости от формаций, подвижности игроков на поле и стадий игры. Как пример, задачи поставленные игроку при схеме 4-4-2 будут отличаться от формаций с 3 центральными. Современные менеджеры часто ссылаются на необходимость использования разных формаций на разных этапах игры и на необходимость адаптации к конкретным обстоятельствам.

Всесторонний количественный анализ формирования команд в профессиональном футболе затруднен из-за сложности получения доступа к большим выборкам трекинг данных игроков. Предыдущие исследования обычно предполагали, что расстановки команд остаются статичными и неизменными на протяжении всего матча. Не беря во внимание тактические изменения по ходу матча, теряется много ценной информации и не учитывается, как данные изменения повлияли на результат.

В нашей статье мы представили новую методику измерения и классификации командных формаций в зависимости от игрового состояния, анализа атакующих и защитных действий каждой команды отдельно и динамического обнаружения основных тактических изменений в ходе матча. Мы применили нашу методологию к большой выборке трекинг данных игроков, используя методы неконтролируемого машинного обучения, чтобы определить уникальный набор шаблонов, используемых командами в наборе данных. Мы использовали результаты, чтобы изучить переходы между защитой и атакой, а также проанализировать изменения в построении во время матчей.

Методология

В нашей методике изучения формаций есть три основных этапа:

  • Мы разработали простой алгоритм для измерения построения команд в зависимости от времени во время матча путем усреднения векторов между соседними игроками в локальных зонах владения мячом;
  • Затем мы определили уникальные формации при атакующих и защитных действиях, используемые командами в большом тренировочном наборе трекинг данных с помощью агломеративной иерархической кластеризации;  
  • Наконец, мы включили набор идентифицированных кластеров формации в алгоритм выбора байесовской модели, чтобы динамически классифицировать наблюдения формации для систематического обнаружения изменений формации во время матчей.

Измерение командных формаций

Хорошо известно, что полевые игроки в команде будут стремиться охватить только небольшую часть поля в любой данный момент, при этом игроки двигаются согласованно и взаимосвязано для сохранения своей пространственной конфигурации. Таким образом, командная схема определяется взаимным расположением игроков.

На рисунке 1 показаны позиции команды при оборонительных действиях (то есть команды, не владеющей мячом) в четыре временных момента первой половины матча. Несмотря на то, что команда в каждый момент занимает разные зоны на поле, игроки в основном сохраняют свое относительное расположение, сохраняя схему 4-3-3 (четыре защитника, три центральных полузащитника и три нападающих).

Рисунок 1: Позиции полевых игроков защищающейся команды в четыре момента времени во время матча. Заштрихованные области указывают на выпуклый корпус; синяя стрелка указывает центр масс команды относительно центра поля.

 

Командные расстановки измеряются путем вычисления векторов между каждым игроком и остальной частью его товарищей по команде в последовательные моменты во время матча. Усредняя векторы между каждой парой игроков за указанный интервал времени, мы получаем четкую оценку их обозначенных относительных позиций. Наблюдения за оборонительной и атакующей формациями измеряются отдельно путем суммирования последовательных владений мячом каждой командой в двухминутные несмежные периоды времени. Мы исключаем владения, которые длятся менее пяти секунд из этого процесса, исходя из предположения, что они слишком короткие для любой команды, чтобы занять наступательную или оборонительную позицию. Кроме того, если происходит замена, которая потенциально может сопровождаться сменой игровой схемы - мы закрываем окно, сохраняя его в нашем анализе, если оно содержит данные по ходу игры хотя бы за одну минуту. В каждом окне мы измеряем расстановку как команды, владеющей мячом, так и их соперника. В среднем мы получаем десять наблюдений при оборонительном построении и десять наблюдений при действиях в атаке для каждой команды во время матча. На рисунке 2 представлены четыре примера наблюдений.

Рисунок 2: Четыре примера наблюдений, каждое из которых измеряется в 2-минутном окне совокупного владения. На двух верхних панелях показаны наблюдения построения команды при оборонительных действиях; на двух нижних панелях показаны наблюдения при действиях в атаке.

 

На рисунке 3 показан полный набор наблюдений, как видоизменялась схема одной из команд по ходу всего матча. Понятно, что при отсутствии владения мячом (верхний график) команда играла по схеме 4-1-4-1, с одним опорником и одним нападающим. Когда команда владеет мячом (нижний график), вингеры продвигаются, образуя переднюю тройку, а крайние защитники перемещаются на уровень опорного полузащитника. Правый центральный полузащитник играл немного глубже, чем левый центральный полузащитник, что вносило небольшую асимметрию в командных действиях при атаке. В то время как относительные позиции обороняющихся игроков в команде хорошо ограничены, позиции нападающих - особенно центрального нападающего - распределены гораздо шире, как при владении, так и вне его. В более общем смысле, площадь, охватываемая полевыми игроками (выпуклый корпус) при атаке, была вдвое больше, чем при защите. Согласованность наблюдений указывает на то, что тренер не внес существенных изменений в схему во время матча.

Рисунок 3: Полный набор наблюдений за построением одной команды на протяжении всего матча. Верхний график показывает наблюдения при оборонительных действиях, нижний график - при атакующих действиях. Согласованность наблюдений свидетельствует о том, что в течение матча в команде не произошло значительных изменений в построении.

 

Выявление уникальных построений

Мы применили описанную выше методологию для трекинг данных собранных на основе 100 матчей, получив 3976 наблюдений атакующих и оборонительных действий команд. В этом разделе мы описываем применение агломеративной иерархической кластеризации для группировки похожих наблюдений с целью определения набора уникальных типов формаций, используемых командами во время этих матчей.

Ключевым элементом этого процесса было определение метрики для количественной оценки сходства двух наблюдений за формациями. Технические детали того, как это делается, описаны в Приложении 1, но по сути мы рассчитываем «стоимость» перехода от одной формации к другой: чем более разные формации, тем выше стоимость. Наш метод учитывает, что два образования могут быть идентичными по своей форме (например, 4-4-2), но одно может быть расширенной или уплотненной версией другого. Поскольку мы хотим разделить формации на основе их формы, а не их площади, мы масштабируем одну из формаций во время сравнения, чтобы «компактность» больше не была дискриминатором.

Мы применяем агломеративную иерархическую кластеризацию к наблюдениям, измеренным на основе нашей обучающей выборки совпадений. Это выявило 20 уникальных шаблонов формирования или кластеров, используемых командами в нашей обучающей выборке. Результаты показаны на рисунке 4.

Рисунок 4: 20 уникальных кластеров формаций, идентифицированных с помощью иерархической кластеризации на основе тренировочной выборки формаций, измеренной в 100 профессиональных матчах. Команды ориентированы так, чтобы действия производились справа налево, а построения перемещаются так, чтобы их центр масс находился в центре поля. Эллипсы указывают одну область сигма (68% доверительный интервал) для позиций каждого игрока, измеренных по отдельным наблюдениям в каждом кластере. Текст в нижнем левом углу каждой панели указывает соотношение наблюдений за формациями при атакующих действиях, а также оборонительных в кластере (также обозначено зелеными и красными полосами).

 

Кластеры четко упорядочены, что подчеркивает разницу между оборонительными и атакующими формами - различие, утраченное в предыдущих анализах схем в футболе. Верхний ряд на Рисунке 4 содержит группы построения с пятью защитниками и вариациями количества полузащитников и нападающих; эти кластеры преимущественно состоят из наблюдений за формациями при оборонительных действиях. В следующих двух строках показаны варианты четверки защитников: кластер 6 явно представляет собой ромб полузащиты, кластеры 9 и 10 - варианты схемы 4-3-3, кластер 11 - это 4-1-4-1, а кластер 12 - это 4-4-2. Кластеры в этих строках содержат сочетание наблюдений за атакующим и защитным построением. Например, кластер 9 преимущественно состоит из наблюдений за оборонительным строем, а кластер 10 - из наблюдений за атакой.

Четвертая и пятая строки содержат кластеры, которые почти полностью состоят из наблюдений за формациями при атакующих действиях. Четвертый ряд содержит варианты формаций 3-4-3 и 3-5-2, хотя стандартная методика анализа представляет собой грубое описание этих формаций. В пятой строке показаны группы, в которых по сути всего два защитника - во всех четырех случаях позиции крайних защитников значительно выше защитной оси.

В целом очевидно, что иерархическая кластеризация эффективно разделила наблюдения за формациями при атакующих и оборонительных действиях, даже несмотря на то, что она не могла использовать различия в их размере или охватываемой площади в качестве дискриминатора (из-за нашего применения коэффициента масштабирования k, как описано в Приложении 1).

Классификация формаций

Последним шагом нашей методологии является алгоритм выбора байесовской модели для оценки вероятности того, что вновь наблюдаемая формация принадлежит каждому из 20 кластеров формаций, показанных на Рисунке 4; математические детали приведены в Приложении 2. Определение кластера максимальной вероятности для каждого наблюдения за формацией позволяет нам классифицировать наблюдения за формацией на протяжении матча для динамического обнаружения тактических изменений.

Результаты и анализ

Сначала мы исследовали переходы между обороной и нападением, определив кластеры оборонительных и наступательных формирований, которые чаще всего объединяются командами в нашем наборе данных. На рис. 5 мы строим пример этих пар, используя диаграмму Сэнки. Левая сторона диаграммы соответствует кластерам действий в обороне, в то время как правая сторона соответствует кластерам действий в атаке. Связи между ними указывают на формирования, которые обычно использовались вместе по мере того, как команды приобретали и теряли владение.

Рисунок 5: Два примера типичных пар между схемами в атаки и обороне. Синие образования указывают на то, что команды, играющие с оборонительной формацией, взятой из кластера 2 (см. Рисунок 4), при атаке переходят к формации, взятой из кластера 16. Красный пример указывает на то, что команды, которые играют с оборонительным строем 9, при атаке переходят либо к формации 10, либо к формации 18. Направление действия всех команд справа налево.

 

Пример, выделенный синим цветом, указывает на то, что команды в нашей выборке, которые защищались с использованием кластера 2 (как определено на рисунке 4), перешли в кластер 16, когда владели мячом. Связь между этими двумя формированиями очевидна: крайние защитники продвигаются вперед, когда команда овладевает мячом, а два вингера смещаются в зону полуфланга, располагаясь под нападающими.

Второй пример, выделенный красным, демонстрирует, что команды, использующие кластер 9 (4-3-3) при защите, переходят либо в кластер 10, либо в кластер 18 при атаке – два совершенно разных формирования. В кластере 10 вингеры располагаются шире, а крайние защитники подключатся к атаке высоко, в то время как в кластере 18 атакующая тройка располагается узко, а крайние защитники работают по всей бровке, создавая ширину.

Из этих примеров можно сделать два основных вывода. Во-первых,формации при атаке и обороне согласованы между собой: ясно, как связаны роли каждого игрока при оборонительных действиях и действиях в атаке. +Это обеспечивает важную валидацию нашей методологии. Во-вторых, это демонстрирует, что некоторые защитные конфигурации обеспечивают большую гибкость с точки зрения различных вариантов атаки, чем другие.

Стратегические резюме и изменения в формациях

Динамическое измерение и классификация формаций позволяют нам составлять стратегические сводки матчей, которые отражают оборонительные и атакующие конфигурации каждой команды и определяют, когда произошли серьезные тактические изменения.

На рисунке 6 показаны формации при обороне и атаке во время матча между двумя командами, обозначенными как Красная команда и Синяя команда, на протяжении всего матча. Кружки указывают на атакующие формации каждой команды, классифицированные в соответствии с кластерами, показанными на рисунке 4; ромбы указывают на оборонительные формации. Цели обозначены вертикальной пунктирной линией в верхней части графика; замены обозначены вертикальной пунктирной линией в нижней части графика.

В этом матче красная команда проигрывала со счетом 1: 0 в перерыве. Диаграмма показывает, что менеджер произвел замену и значительное изменение в формировании, переключившись с формации 3-4-3 (кластеры 3 и 15 в обороне и атаке соответственно) на 4-3-3 (кластеры 9 и 10). Они забили вскоре после перерыва, но в итоге проиграли матч со счетом 2:1.

Рисунок 6: Стратегическое резюме матча между красно - синими командами. Ромбы обозначают оборонительные порядки; круги обозначают атакующие порядки. Метки по оси Y соответствуют номерам кластеров на рисунке 4.

 

Автоматическое обнаружение изменений в схеме в сочетании с данными о событиях позволяет нам исследовать, почему были внесены определенные тактические изменения, и оценить их влияние на исход матча. На рисунке 7 показан простой пример (другой матч, изображенный на рисунке 6: красная команда та же, но они играют с другой синей командой). Правые панели графика указывают на наблюдения за схемой при обороне красной команды в первом и втором таймах. На левых панелях показаны карты передачи команды противника (действия слева направо).; стрелки указывают на направление передачи, а точки- нанесенные удары.

В первом тайме красная команда играла 4-3-3 в обороне. Карта передач синей команды указывает на то, что в первом тайме они имели тенденцию атаковать по флангам, создавая качественные моменты с кроссов, особенно с правого фланга. В перерыве красная команда переключилась на защиту из 5 человек, латерали играли по вингерам соперника. Как показывает карта передач во втором тайме, изменение в составе, привели к положительному эффекту в нейтрализации моментов с правого фланга. Теперь фокус передач синей команды сместился больше в сторону центра и противоположного фланга.

Рисунок 7: Графики справа: наблюдения за схемами при обороне о красной команды (играющей справа налево) до и после перерыва в матче против синей команды. Графики слева: передачи (стрелки) и удары (круги) синей команды (играющей слева направо) в первой и второй половине матча. Размеры кругов указывают на качество возможности забить гол. Обратите внимание, что изображенное совпадение отличается от совпадения, показанного на рисунке 6.

 

Практическое применение

Наш анализ является шагом на пути к использованию трекинг данных для определения и оценки командной тактики в футболе. Методология, изложенная выше, позволяет командам изучать, как менеджер соперника обычно реагирует на конкретные ситуации, происходящие в матче. Например, менеджер Красной команды на рисунке 6 внес аналогичные структурные изменения более чем в четверти своих матчей в нашем наборе данных, переключаясь между небольшим подмножеством формаций исходя из качества противостояния и ситуации в матче. Наша методология может быть использована для прогнозирования и использования тактических изменений против соперника.

Во-вторых, это позволяет нам подробно изучить факторы, которые приводят к нарушению структуры команды при оборонительных действиях, и исследовать, как это связано с созданием моментов у ворот. Объединение классификации формаций с зонами подач  [11,12,13] позволяет нам выявлять потенциальные слабые места в обороне конкретных формаций и определять, как команды могут их использовать.

Наконец, наша методология может быть расширена для рассмотрения формаций на более конкретных этапах владения, таких как переход, установление владения, прогрессия и создание шансов, а также для включения информации о скорости игрока для идентификации и понимания систем маркировки и работы высокого прессинга.

Приложение 1: Сходство формации

В нашем методе наблюдение за формациями фактически представляет собой набор из 10 двумерных нормальных распределений – по одному для каждого полевого игрока – в котором среднее значение каждого распределения является положением игрока в схеме, а матрица ковариации представляет собой оценку того, насколько игрок отклонился от своей позиции в течение двухминутного интервала владения, в котором была измерена тактическая схема.

Мы используем расстояние Вассерштейна для количественной оценки сходства двух наблюдений за тактическими схемами. В простом случае двух двумерных нормальных распределений μ1=N(m1, C1) и μ2=N(m2,C2), где m-среднее значение , а C-матрица ковариации, квадрат расстояния Вассерштейна задается [6]:

W(μ12)2=||m1−m2||2+trace(C1+C2−2(C21/2C1C21/2)1/2)

В случае точечных частиц расстояние Вассерштейна - это просто квадратный корень из нормы L2 разницы между средними значениями. В более общем плане метрика Вассерштейна является решением оптимальной транспортной задачи, т.е. оценкой стоимости перехода от одного распределения к другому.

Второй шаг нашего алгоритма состоит в том, чтобы найти пару игроков в двух наблюдениях, которая минимизирует квадрат суммы расстояний Вассерштейна, т. е.

W2total=miijDijXij ,

где Dij-стоимость (квадрат расстояния Вассерштейна) сопоставления игрока i в формации 1 с игроком j в формации 2, а Xij-матрица распределения игроков между игроками, в которой каждый элемент равен 1, если игрок i соответствует игроку j, и равен нулю в противном случае. Поэтому каждая строка и столбец в Xij должны однозначно состоять из девяти нулей и одного 1. Мы используем алгоритм Куна-Манкреса, чтобы найти Xij, который минимизирует общую стоимость.

Мы делаем еще одно дополнение к нашей метрике сходства команд. Два наблюдения могут быть идентичными с точки зрения их формы (например, традиционный 4-4-2), но одно может быть более компактным или широким вариантом другого. Поскольку мы стремимся идентифицировать различные формы схем, мы вводим переменный коэффициент масштабирования k, который расширяет или сжимает формацию вокруг ее центра масс (соответственно масштабируя ковариации игроков). При сравнении двух наблюдений мы ищем значение k, которое минимизирует расстояние Вассерштейна между ними.

Приложение 2: Алгоритм Классификации Формаций

Алгоритм выбора байесовской модели для оценки вероятности того, что вновь наблюдаемая тактическая схема принадлежит каждому из 20 кластеров формаций, показанных на рисунке 4, рассчитывается следующим образом

где µp,C и Σp,C-матрица положения и ковариации для роли p в кластере C , µp,o и Σp,o-матрица положения и ковариации для игрока p в наблюдении за формированием o , k-коэффициент масштабирования, описанный в Приложении 1, и интеграл выполняется по площади поверхности поля. Чтобы назначить каждого игрока в наблюдении за формированием определенной роли в кластере, мы решаем проблему распределения ролей игроков с помощью алгоритма Куна-Манкреса, также описанного в Приложении 1.


Источник: http://eightyfivepoints.blogspot.com/2019/11/using-data-to-analyse-team-formations.html

Рейтинг: 0 / 5 (0)

Сотрудничество

По вопросам сотрудничества можете заполнить форму обратной связи или связаться с нашим представителем.

Связаться или Перейти в контакты