24

Nie tak łatwo wyjść z muzycznej bańki Spotify

Serwisy streamingowe gromadzą coraz więcej danych na temat naszego gustu i preferencji. Wszystko po to, aby jak najlepiej dopasować sugerowane utwory i albumy. Sęk w tym, że nasze gusta stale się zmieniają i ewoluują.

Uwielbiam Spotify i jestem oczarowany algorytmami, które dwa razy w tygodniu (w poniedziałki „Discover Weekly” i w piątki „Release Radar”) konstruują dla mnie playlisty z polecanymi utworami, które mogą mi się spodobać. Oczywiście nie działają idealnie, ale w większości przypadków jestem w stanie wyciągnąć stąd przynajmniej kilka utworów, które potem lądują na moich własnych playlistach. Zauważyłem jednak pewne niepokojące zjawisko – algorytmy nie ewoluują w taki sposób, w jaki bym sobie tego życzył.

Większość z Was słyszała zapewne pojęcie „bańki informacyjnej”. Odnosi się ono do zjawiska, w którym użytkownik czyta wyłącznie określone serwisy i  otrzymuje z nich dobrze znane i pod wieloma względami podobne treści. Rozszerzając to o algorytmy, otrzymujemy sytuację, w której algorytmy, znając zainteresowania i oczekiwania użytkownika, dostarczają mu wyłącznie artykuły na konkretne tematy pochodzące z kilku-kilkunastu źródeł. Analogicznie to wygląda w przypadku Spotify czy Netfliksa, gdzie możemy mówić o, odpowiednio, bańce muzycznej i serialowej. Oczywiście nie oznacza to, że ktoś sztucznie blokuje nam dostęp do treści spoza bańki. Niemniej większość z nas po nie nie sięga, bo tak jest wygodniej.

Otrzymujemy zatem tydzień w tydzień sugestie powiązane z naszymi preferencjami. Nauczyłem Spotify, że lubię rocka – lżejszego, z wyraźnie zarysowanym rytmem, rzadziej cięższego. Zatem właśnie tego są pełne moje playlisty układane przez algorytmy. Sęk w tym, że od jakiegoś czasu mocno wsiąkłem w muzykę elektroniczną. Co robi Spotify? Wydaje się nie reagować na te zmiany i dalej z uporem maniaka podsuwa mi gitarowe brzmienia. Nie dziwię się, bo po kilku latach słuchania określonych gatunków trudno sprawić, aby system z dnia na dzień działał inaczej. Czekam zatem od kilku miesięcy na muzykę elektroniczną w Discover Weekly. I nic.

Gdzieś rzuciła mi się w oczy wizja, że komputerów przyszłości nie będziemy programować, a tresować. Powstaną bowiem uniwersalne platformy „do wszystkiego”, które będą nieustannie gromadziły informacje. Porównano je do zwierząt – np. psów. Rolą użytkownika będzie wytresowanie komputera, aby służył mu w określony sposób. Nie będzie instalowania aplikacji, rozwijania software’u itd. Ten będzie sam się „kodował” w oparciu o potrzeby o oczekiwania użytkownika. Potrzebuję książki kucharskiej? System napisze agregator przepisów, które następnie zacznie zaciągać z sieci i przekształcać na przystępną formę. Chcę listę zadań? System stworzy ją dla mnie razem z całą otoczką dodatkowych funkcji. Otwartym pytaniem będzie, w jaki sposób przyjdzie mi ją obsługiwać – czy poprzez interfejs głosowy czy też ciągle graficzny (obstawiam to pierwsze).

Jak to się ma do kwestii muzycznej bańki? Zmierzam do tego, że współczesnym algorytmom ciągle bardzo daleko do sprostania potrzebom użytkowników. Reagują zbyt wolno na dynamicznie zmieniający się świat wokół. Ja wiem, że w końcu w Discover Weekly pojawi się nowy gatunek muzyki, ale muszę czekać na to, aż „wytresuję” mój algorytm. W końcu pies też nie przynosi rzuconego patyka za pierwszym razem, prawda?

Pozostaje jeszcze kwestia żywotności big data i powstających w ten sposób śmieci. Zastanówmy się, jak długo zgromadzone przez aplikację dane na nasz temat są aktualne? Co w sytuacji, gdy nasz gust i preferencje ewoluują? Czy aplikacja regularnie ma czyścić bazę z rekordów dodanych wcześniej niż 12 miesięcy? Teoretycznie to by mogło zadziałać, ale jaką mamy pewność, że wówczas nie zostaną usunięte przydatne i ciągle aktualne wpisy? Za jakiś czas zaczniemy (właściwie nie my – deweloperzy, usługodawcy, twórcy aplikacji) borykać się ze śmieciami big data – nieaktualnymi informacjami, które ciągle zalegają w serwerowniach i utrudniają osiągnięcie algorytmowi doskonałości. Zakładając oczywiście, że wcześniej nie powstaną inteligentne systemy, które są w stanie samodzielnie ocenić przydatność archiwalnych danych i dokonać stosownych porządków w bazie.