27

Euro wygrają Hiszpanie – tak twierdzą analitycy. Przekonamy się, jaki jest pożytek z Big Data

Od kilku lat powtarza się, że big data to przyszłość, że potencjał, jaki kryje się w zbieraniu danych i ich analizie, nawet trudno przewidzieć. Niektórzy opowiadają o tym niczym o kryształowej kuli, w której da się zobaczyć przyszłość. Przesada? Pewnie tak, ale korzyści i tak prezentują się kusząco. Tylko kiedy zaczniemy poznawać na większą skalę efekty opracowywania Big Data? I czy dzisiaj te analizy brzmią już wiarygodnie? W ramach testu zamierzam obserwować rozgrywki piłkarskie podczas Euro 2016 - sprawdzę, czy analitycy mają rację i wygra Hiszpania.

Euro 2016 startuje już za kilka dni. Kibice pewnie zacierają ręce na myśl o święcie futbolu, humory w Polsce może trochę pogorszyły dwa mecze towarzyskie rozegrane przez naszą reprezentację, ale taki prysznic był potrzebny – nie dało się już słuchać zachwytów i pytań o to, z jakim medalem wrócą Polacy. Jednak to nie na tym wątku chciałbym się skupić w tekście: zainteresował mnie projekt Bisnode Data Analytics Lab, w którym analitycy próbują na podstawie dostępnych danych przewidzieć m.in., jak potoczą się losy Euro – ciekawa zabawa.

Hiszpania obroni tytuł. Polska bez szans na zwycięstwo

Ludzie z Bisnode Data Analytics Lab stworzyli aplikację webową, która ma pomóc przewidzieć wyniki meczów nadchodzącego turnieju.:

Poprzez analizę zdobytych goli, intensywności ataku i obrony oraz danych historycznych, przewidywane są wyniki poszczególnych meczów, wyjścia z grupy, wygląd drabinki turniejowej i wreszcie – zwycięzca mistrzostw.[źródło]

Narzędzie największe szanse daje dzisiaj obrońcom tytułu, Hiszpanom, za nimi znajdziemy Anglików i Belgów. Prawdopodobieństwo tego, że zwycięży ekipa z Półwyspu Iberyjskiego wynosi ponad 21%. W przypadku Polski jest to… 0,4%. Kiepsko, ale nie jest najgorzej – aplikacja wskazuje, iż Czesi nie mają prawie żadnych szans na tytuł. Może sąsiedzi z Południa powinni zapoznać się z tymi wynikami i odpuścić turniej? Oszczędzą sobie nerwów i trudu. Podobnie zresztą mogłoby zrobić kilka innych zespołów, na dobrą sprawę polskie 0,4% wygląda dość marnie – szanse Walijczyków na podniesienie pucharu są dwa razy większe. Sęk w tym, że to nie statystyki zagrają w piłkę podczas francuskiego Euro.

Euro, czyli statystyki sobie, a wyniki sobie

Czy zastosowanie Big Data w tym przypadku jest jakąś wielką innowacją? Raczej nie – z takim Big Data zderzył się każdy, kto choć trochę zagłębił się w bukmacherkę. Dwie dekady temu też analizowano wyniki z przeszłości, składy drużyn, miejsce gry, stan zdrowia poszczególnych zawodników itp. Pomysł nie jest nowy. Ale możemy korzystać z coraz lepszych rozwiązań – danych przybywa, algorytmy są dopracowywane, rośnie szansa na to, że przedstawi się właściwą prognozę. Dlatego z uwagą będę śledził wyniki poszczególnych spotkań i zestawiał je z tym, co wyliczyli spece z Bisnode. Jeżeli ktoś też chce to sprawdzić, odsyłam pod ten adres. To może być równie ciekawe, co czekanie na decyzje podejmowane przed meczem przez ośmiornicę…

Zakładam, że w tym wszystkim i tak pozostanie spore pole dla niespodzianek. Owszem, narzędzia będą coraz lepsze, a prognozy mogą się sprawdzać częściej, lecz wszystkiego nie da się przewidzieć. Sędzia może mieć gorszy dzień, jeden piłkarz znokautuje drugiego głową albo ugryzie, co może poważnie wpłynąć na dalsze zmagania, ktoś się pomyli, ktoś nie trafi, ktoś pogrąży swoją drużynę samobójem. Można wyliczyć prawdopodobieństwo zajścia takich sytuacji, lecz nie da się ich przewidzieć. I nie będzie się dało – nawet, gdy stworzymy narzędzia prawie idealne. Bo prawie zawsze zrobi tu sporą różnicę. Na szczęście.

PS Nasz atak został oceniony przez narzędzie na 9 (w skali 10-stopniowej). Gorzej z obroną – to zaledwie jedynka…