Czy selekcjoner Jerzy Brzęczek mógł widzieć więcej, sensacyjnie powołując Huberta Matynię do reprezentacji Polski? Dlaczego Romeo Jozak nie ufał analitykom danych? Jak to się stało, że system TRACAB sfinansowano m.in. z pieniędzy klubów, ale nie mają one z niego większego pożytku? Zapraszamy na podróż w fascynujący świat piłkarskiej analizy razem z Michałem Jaroniem, byłym analitykiem big data w Legii Warszawa.

Wideo Odtwarzacz wideo wymaga uruchomienia obsługi JavaScript w przeglądarce. Michał Jaroń o systemie TRACAB i zbieraniu innych danych w Ekstraklasie. Wideo INTERIA.TV

- Kwestia, jak liczby mają oddać zamysł piłkarza na boisku może być przyczynkiem do dłuższej dyskusji na temat tego, jak długo byliśmy "niewolnikami" dotychczasowych, zbyt prostych statystyk. Przede wszystkim w "klasycznych" statystykach, jak skuteczność podań, czy liczba celnych strzałów napastników brakuje kontekstu. Posiadając jedynie surowe liczby, jak procent udanych podań, czy procent utrzymywania się przy piłce - właściwie nie wiemy nic o meczu. Nic o intencjach zawodnika - mówi Michał Jaroń, były analityk big data w Legii Warszawa.

Reklama

Wojciech Górski, Interia: Jak więc analitycy radzą sobie z tym, by oddać zamysł piłkarza?

Michał Jaroń, programista specjalizujących się w sztucznej inteligencji, analityk danych piłkarskich: - Analityka radzi sobie z tym w ten sposób, że stara się wejść na wyższy poziom szczegółowości i analizować wszystkie zagrania boiskowe w szerszym kontekście. Zamiast patrzeć na skuteczność podań danego zawodnika, powinniśmy patrzeć na to, w jakim kontekście dane podanie było wykonane. Jest taka popularna w środowisku praca, której tytuł w tłumaczeniu na język polski to "Nie wszystkie podania są warte tyle samo". W tej pracy wartość każdego podania jest szacowana na podstawie sytuacji boiskowej. Jeżeli jakiś zawodnik będzie miał 100 proc. skutecznych podań, to coś nam już "śmierdzi". Analityka pozwala nam odróżnić wartościowe podania, od tzw. podań na alibi.

- Używając fachowej analizy, możemy zauważyć, że dany zawodnik zawsze wybiera najprostszą opcję - czyli podania do najbliższego lub też wykonuje podania przy zerowym pressingu przeciwnika. Używając tego bardziej szczegółowego podejścia - patrzymy na to, ilu zawodników było dookoła, ilu zawodników było na linii podania, jak długie było podanie, czy adresat podania znajdował się na wolnym polu, czy też był otoczony zawodnikami przeciwnej drużyny. Dzięki wszystkim tym zmiennym, a są przeróżne modele, które szacują prawdopodobieństwo danego podania, możemy uzyskać bardziej wartościowe dane na temat konkretnego atrybutu zawodnika - w tym wypadku umiejętności podawania i rozgrywania piłki. Analityka radzi sobie więc z tym tak, że buduje szerszy kontekst, operuje na większym poziomie szczegółowości, dokładając kolejne zmienne stara się lepiej zrozumieć to, co naprawdę się na boisku dzieje.

Ekstraklasa zapewnia kibicom dostęp do skróconych wersji raportów InStata. Jest tam podany szereg statystyk, których nie znajdziemy w telewizji. Jak wiele danych jest potrzebnych, by w ogóle mówić o interpretowaniu ich w odpowiednim kontekście?

- Po pierwsze trzeba zaznaczyć, że statystyki biegowe w Ekstraklasie są oferowane nie przez InStat, a firmę ChyronHego. Jest to właściciel systemu TRACAB, zainstalowanego obecnie na wszystkich stadionach Ekstraklasy. Założenie systemu są bardzo dobre. Wprowadzając go Ekstraklasa równa do zachodu pod względem rozwoju technologicznego, ale gdy zajrzymy głębiej - nie jest tak kolorowo.

- Głównym zadaniem systemu TRACAB jest dostarczanie tzw. danych trackingowych, czyli pozycyjnych. System w swojej najbogatszej wersji jest bardzo dokładny - pozycje zawodników, piłki i sędziów są odświeżane ok. 20 razy na sekundę. Dane produkowane przez system możemy porównać do wyglądu silnika meczowego w Football Managerze. Takie dane są już powszechnie używane do zaawansowanej analizy przez kluby zachodnie. Niestety, w Ekstraklasie ten system oferuje tylko i wyłącznie surowe dane - jak liczba przebiegniętych kilometrów. Kluby mają także dostęp do bardziej szczegółowych danych - liczby sprintów itd., ale i one są niewiele warte. Brakuje w nich właśnie kontekstu. Co z tego, że wiemy, że zawodnik miał 20 sprintów, jeśli nie wiemy, czy wykonał je wychodząc na pozycję, w walce z przeciwnikiem, czy dlatego, że był spóźniony i musiał naprawiać swój błąd. W jednej pracy naukowej pokazano nawet, że słabsze drużyny notują właśnie więcej biegów na wysokiej intensywności.

Nie tylko kibicom zdarza się upraszczać podane bez kontekstu informacje. Nawet telewizyjni eksperci czasami oceniają piłkarzy na zasadzie: ktoś przebiegł dużo kilometrów - super, starał się. Ktoś przebiegł mało - nie chciało mu się.

- Nie jest wielką tajemnicą, że statystyki przebiegniętych kilometrów tak naprawdę niewiele mówią o zaangażowaniu. Tak jak zauważyłeś, w Polsce mówi się często, że jeśli np. liczba przebiegniętych kilometrów jest niska, to musiało zabraknąć zaangażowania. To oczywiście nieprawda, bo wiele zależy od tego jak się mecz układa - nie zawsze drużyna musi przebiec 120 km w trakcie meczu. Jeśli się dobrze ustawiasz - siłą rzeczy biegasz mniej. To zależy też od szeregu różnych czynników, więc takie suche statystyki są głównie ciekawostką dla kibiców. Kluby Ekstraklasy korzystają z nich, ale są świadome, że niewiele mogą wyciągnąć.

- Wydaje mi się, że w Polsce przypisujemy nadmierną wagę właśnie przygotowaniu fizycznemu. Jedna praca pokazuje, że różnice w budowie ciała nie wpływają w dużym stopniu na efektywność zawodników. Powołuję się na pracę naukową, ale przecież nie musimy szukać daleko - spójrzmy np. na Sebastiana Szymańskiego, który jak się okazuję nie musi być wyjątkiem potwierdzającym regułę.

- W jeszcze innej pracy pokazano, korelację między kondycyjnymi możliwościami a miejscem w tabeli Premier League, jednak autorzy pokazują wagę mądrze spożytkowanego przygotowania fizycznego. Przykładowo lepsze przygotowanie pozwala przez dłuższy okres meczu notować więcej celnych podań. Płynie z tego takie wniosek, że przygotowanie fizyczne trzeba umieć wykorzystać - nie wystarczy biegać ćwierć maratonów.