sas-main
0

Generujemy więcej danych niż jesteśmy w stanie przerobić. Te dane mogą programować!

Miałem okazję odwiedzić SAS Forum Milan 2017. Jest to międzynarodowa konferencja organizowana przez firmę SAS, podczas której poruszane są tematy związane z zaawansowaną analityką, jej zastosowaniami w biznesie i nie tylko. Ponad 2 tys. ekspertów przybywa na to wydarzenie, aby posłuchać o aktualnych trendach związanych z pozyskiwaniem wartości z dużych wolumenów danych. Świat zmierza w jasno określonym kierunku: mamy tendencję do mierzenia wszystkiego co możliwe, a jeśli nie można czegoś zmierzyć, to prędzej czy później znajdziemy sposób żeby to zmienić.

Wartość danych

Każdego dnia zapisujemy dane na temat otaczającego nas świata i stajemy się w tym coraz lepsi. Ok, to już dość jasne, więc nie ma sensu się nad tym dalej rozwodzić. Mamy ogromne ilości danych, którymi firmy są wręcz zalewane. Co dalej? Czy jest w tym jakaś wartość? Co można z tego mieć? Same fakty i liczby nabierają wartości dopiero w momencie, gdy ktoś lub coś je uporządkuje i doszuka się w nich wzorów, trendów, powiązań. Wtedy dane przerodzą się w wartościowe informacje, które umożliwią nam osiąganie naszych celów. Są od tego odpowiednie narzędzia analityczne, których modele są tworzone w taki sposób, aby pasowały do potrzeb danego przedsiębiorstwa jak garnitur uszyty na miarę. SAS zajmuje się tym od ponad 40 lat i jest światowym liderem w zakresie analityki biznesowej.

Big Data

Im więcej danych, tym lepiej. Należy je wszystkie równocześnie przetwarzać i wydobywać z nich wartość. Ta wartość posłuży do budowania przewagi na rynku, przyspieszania rozwoju firmy, zapewniania klientom nowej jakości usług i produktów, dbania o najwyższe standardy bezpieczeństwa, lepszego zarządzania ryzykiem… W zasadzie ta lista może nie mieć końca, ponieważ będzie tyle zastosowań ile potrzeb. Wystarczy zebrać odpowiednie dane i odpowiednio je przetworzyć.

Big Data nie jest określeniem, które należy do tych ciekawostek technologicznych, o których ciągle słyszymy, ale tak naprawdę nigdzie ich nie ma. Big Data się już dzieje. Każde przedsiębiorstwo jest zalewane różnego rodzaju faktami i liczbami, które często się po prostu marnują. Dlaczego się marnują? Jak mówił Oliver Schabenberger, Executive Vice President & Chief Technology Officer w SAS, podczas swojego wystąpienia w trakcie SAS Forum Milan 2017:

Generujemy zdecydowanie więcej danych niż jesteśmy w stanie przerobić.

Co możemy z tym zrobić? Może stworzyć specjalny zespół ludzi, który zajmie się analizowaniem danych i wyszukiwaniem w nich schematów i wzorów? Niestety w dużej skali ludzie sobie z tym nie poradzą i aktualnie jest to zadanie dla komputerów. Na szczęście od tej pory będzie już tylko lepiej, bo dochodzimy do bardzo ciekawego momentu, w którym „ciężar” informacji przestaje być czymś uciążliwym, a zamiast tego zamienia się w rozwiązanie problemu. Jak to powiedział Oliver Schabenberger (widoczny na zdjęciu powyżej):

Dane mogą programować.

Uczenie maszynowe i idące o krok dalej uczenie pogłębione, sprawiają że dane same przyczyniają się do powstawania rozwiązań problemów, które były spowodowane… nadmiarem danych. Jest tak, ponieważ system się doskonali bazując na danych, które do niego włożymy (im więcej tym lepiej). Oliver Schabenberger tłumaczył to za pomocą porównania do „magicznej czarnej skrzyneczki” – wkładamy coś do niej, nie widzimy i nie rozumiemy w pełni jaka magia dzieje się w środku, ale możemy ją ocenić po wynikach. Mamy wejście i wyjście. Wiemy co włożyliśmy na wejściu i wiemy jakich rezultatów oczekujemy na wyjściu, dzięki czemu jesteśmy w stanie ocenić przydatność tego, co uzyskujemy za pomocą naszego „magicznego pudełeczka”, czyli np. uczenia pogłębionego.

Internet Rzeczy

Odpowiednie oprogramowanie oparte na algorytmach sztucznej inteligencji, w połączeniu z niezawodnym źródłem regularnie spływających danych, może się przyczynić do ogromnych oszczędności, skoków w wydajności itd. Tutaj niezwykle przydatne jest istotne zjawisko Internetu Rzeczy (Internet of Things, IoT), które również jest ważnym, współczesnym trendem. Wszystko się ładnie zazębia, bo Big Data jest oparte na możliwie największych zasobach danych, które swoją drogą często powinny być „świeże”, a Internet Rzeczy idealnie się nadaje do… gromadzenia danych. Urządzenia, które w inteligentny sposób się ze sobą komunikują i wymieniają się faktami pozyskanymi z otoczenia za pomocą licznych czujników, świetnie się komponują z zaawansowanymi narzędziami do przetwarzania danych.

Trendy w postaci Big Data oraz IoT będą tylko przybierać na sile

Kiedy o tym wszystkim trochę posłuchałem, zrozumiałem że te trendy będą tylko przybierać na sile i jest to nieuniknione. Wspomagają to zarówno rozwiązania oparte na chmurze, jak i edge computing, czyli przetwarzanie danych „na miejscu”, a nie podczas komunikowania się z jakimś odleglejszym bytem, pełniącym rolę centrum, do którego trafiają informacje z terenu. Świetnym przykładem jest kolonizacja Księżyca oraz Marsa.

W sytuacji gdy zabieramy się za kolonizację Księżyca, całkiem dobrym rozwiązaniem może być kontaktowanie się z centrum dowodzenia na Ziemi, skąd uzyskamy informację, które posłużą nam do podejmowania właściwych decyzji na Księżycu.

Jednak w sytuacji gdy zabierzemy się za kolonizację Marsa, znacznie lepszym rozwiązaniem będzie posiadanie naszego centrum dowodzenia na pokładzie statku kosmicznego, ponieważ odległości są większe i informacja może lecieć np. 20 minut w jedną stronę. Decyzje muszą być podejmowane na miejscu, bez zewnętrznej wymiany danych.

W przypadku firmy SAS możliwe są rozwiązania idące zarówno w kierunku chmury, jak i edge computingu.

Czy będzie jakaś granica?

Więcej. Musimy gromadzić więcej danych. Musimy przetwarzać więcej danych, a w dodatku robić to w czasie rzeczywistym. Wszystko to wymaga przestrzeni, na której można to zapisywać oraz mocy obliczeniowej, która może to przetwarzać. Nie mówiąc już o kolejnych sposobach na gromadzenie wspomnianych na samym początku danych.

Jest taka ciekawostka, którą często się powtarza przy tematach związanych z Big Data, mianowicie przez ostatnie lata wygenerowaliśmy więcej danych, niż przez całe poprzednie dzieje ludzkości. Czy od tej pory tempo tego wszystkiego będzie już tylko wzrastać, czy jednak jest tam po drodze jakiś limit, do którego kiedyś dobijemy? Jestem ciekaw.

SAS Polska