11

Polacy zrobili na złość algorytmom – pokazali, że prognozy nie muszą być realizowane

Zakończyły się Zimowe Igrzyska Olimpijskie w Pjongczangu. Za dwa lata czeka nas letnia impreza w położonym blisko Korei Tokio, a po kolejnych dwóch latach znowu będziemy oglądać sportowców w Azji: olimpiada w roku 2022 odbędzie się w Pekinie. Podejrzewam, że niektórzy przygotowania do tych zawodów już rozpoczęli. Sporo do przemyślenia i przepracowania mają Polacy, którzy nie zawojowali koreańskich obiektów sportowych. Tymczasem z prognoz tworzonych ze wsparciem big data wynikało, że będzie dobrze. Nawet bardzo dobrze. Nasi rodacy postanowili zrobić psikusa takim narzędziom.

Polacy na igrzyskach to teraz trudny temat. Nie zamierzam nikogo rozliczać, wiem, że najbardziej boli to samych sportowców, bo kilka lat ciężkiej pracy czasem przynosiło bardzo mizerne efekty. Ktoś liczył na miejsce w pierwszej dziesiątce, po cichu może nawet na medal, a tu lokata w dziesiątce, ale ostatniej. Wracam jednak do tematu, bo z ciekawości porównałem klasyfikację medalową z prognozami, które przygotowała kilka tygodni temu firma Cloud Technologies. Jak je stworzono? Analizowano Big Data, ale wzbogacono ten proces o wskaźnik w postaci zainteresowania sportami zimowymi wśród internautów.

Przy budowie modelu Cloud Technologies, użyto danych OnAudience.com dotyczących zainteresowań internautów z prawie każdego kraju na świecie. Tego typu dane na co dzień wykorzystujemy m.in. w precyzyjnie targetowanych internetowych kampaniach reklamowych. Analizując odsetek osób czytających o sporcie ogółem i o sportach zimowych, stworzyliśmy wskaźnik zainteresowania Olimpiadą Zimową. Analiza pokazała, że jest on istotnie skorelowany z osiągnięciami medalowymi i znacznie poprawia jakość modeli predykcyjnych.

Czy to się sprawdziło? Muszę przyznać, że w niektórych przypadkach nawet bardzo. Wedle prognoz, klasyfikację medalową miała wygrać Norwegia. I tak się stało. Na drugim miejscu powinni się uplasować Niemcy, którzy… faktycznie zostali wiceliderem listy. Po nich ma podium miały być jeszcze Stany Zjednoczone, na czwartym miejscu Kanada. To się już nie sprawdziło, w rzeczywistości państwa te zamieniły się kolejnością. Ale pasuje np. piąte miejsce Holandii. A najciekawsze jest to, że algorytmy trafiły z liczbą medali tego kraju: prognozowano 20 i tyle krążków Holendrzy przywieźli do domu.

Nie mogę napisać, że prognozy były idealne czy nawet bardzo dobre. Bo wspomniana Norwegia zgarnęła znacznie więcej medali, niż zakładano. Z kolei USA rozczarowały, liczba krążków w prognozach i rzeczywistości poważnie się różni. Kolejny raz trzeba po prostu napisać, że to sport, a ten bywa nieprzewidywalny. Nawet zebranie i uporządkowanie wielkiej ilości danych nie pozwoli przewidzieć przyszłości. Pewnie nawet najwięksi znawcy tematu nie zakładali, że Norwegia aż tak dobrze poradzi sobie na imprezie. Ale mogli już zakładać, że Polska jednak nie będzie w dziesiątce najlepszych reprezentacji, na co wskazywały prognozy…

Polacy na igrzyskach w Pjongczangu wywalczyli dwa medale: złoty i brązowy. Dało to dwudzieste miejsce w rankingu. Prognozy mówiły nawet o siedmiu krążkach. To chyba największe pudło w przywołanych prognozach. Podkreślałem, że trzeba do tego podchodzić z dystansem, bo prócz skoczków za bardzo nie ma komu zdobywać tych medali: część sportowców pojechała bez formy, inni mają po prostu swoje lata i nie są już w stanie rywalizować na najwyższym poziomie. A teraz dowiadujemy się jeszcze o innych problemach, np. niesnaskach zawodników startujących w drużynach. Prognozy były tworzone przy uwzględnieniu zainteresowania sportami zimowymi wśród internautów. I ono faktycznie jest duże. Nijak ma się to jednak do potencjału naszej kadry. Polacy na igrzyskach namieszali w pracy algorytmów…