Ostatnie lata, w tym przede wszystkim rok 2020, w którym wybuchła pandemia, pokazały, jak ważna jest w przedsiębiorstwach automatyzacja niektórych procesów, związanych z przetwarzaniem danych. Nie bez znaczenia był też tu ogromny wzrost ilości danych, na których operują obecnie firmy.
Ekspert Snowflake przedstawia trendy, które będą kształtować usługi chmurowe w 2022 roku
Czynniki te bez wątpienia wpłyną powszechnie na potrzeby wdrożenia nowych rozwiązań w chmurze, które usprawnią pracę przedsiębiorstw oraz jednocześnie pozwolą na lepsze i wydajniejsze wykorzystywanie przetwarzanych danych w czasie rzeczywistym.
Aby przybliżyć Wam od środka, jak taka automatyzacja wygląda lub może wyglądać w firmach czy w różnych organizacjach, porozmawialiśmy na ten temat z Grzegorzem Kapustą, dyrektorem ds. inżynierii i szefem warszawskiego biura Snowflake, czyli firmy, która dostarcza firmom gotowe i szyte na miarę narzędzia Big Data w chmurze.
Grzegorz Ułan, Antyweb: Na początek tradycyjnie, proszę o przybliżenie naszym Czytelnikom, czym dokładnie Snowflake się zajmuje, jakich rozwiązań dostarcza, no i jakie problemy rozwiązuje lub może rozwiązać w firmach w Polsce?
Grzegorz Kapusta, Snowflake: Naszą podstawową usługą jest Chmura Danych Snowflake, która wspiera organizacje każdego rozmiaru w zmaksymalizowaniu korzyści czerpanych z danych, które generują, przechowują czy przetwarzają. Różnorodne zadania analityczne, bezpieczne udostępnianie informacji czy łączenie danych z różnych miejsc – o to wszystko firmy nie tylko w Polsce mogą lepiej zadbać z wykorzystaniem naszej usługi.
Aby zrozumieć, dlaczego to tak ważne, trzeba mieć świadomość, jak aktualnie wygląda praca z danymi w przeciętnym biznesie. Każdego dnia na całym świecie generuje się ok. 2,5 tryliona bajtów danych – to ogromna wartość. Aż 80 proc. informacji, które gromadzą firmy, to tzw. dark data – dane, które w ogóle nie są wykorzystywane czy analizowane. A dane to przecież złoto cyfrowego świata – obecnie stanowią jedno z kluczowych aktywów każdej firmy, niezbędne m.in. do układania strategii biznesowej, określania grupy docelowej produktu czy diagnozy zalet oraz wad usługi.
Podczas pracy nad takimi dokumentami wiele przedsiębiorstw błądzi po omacku, mimo że mają na wyciągnięcie ręki informacje, które ułatwiłyby im codzienne funkcjonowanie. Tutaj pojawia się rola Snowflake. Oferując Chmurę Danych Snowflake, pomagamy klientom w przetwarzaniu informacji z wielu chmur i wielu lokalizacji. Czy to skuteczne? Wystarczy wskazać, że obsługujemy tysiące klientów z różnych branż, w tym już ponad 200 z listy Fortune 500.
Grzegorz Ułan: W ostatnim czasie w branży coraz częściej słyszymy o takich pojęciach jak AutoML (automatyzacja uczenia maszynowego) czy AI (sztuczna inteligencja), które wykorzystywane są do automatyzacji przetwarzanych danych. Mógłby Pan w przystępnym języku wyjaśnić nam – w jaki dokładnie sposób?
Grzegorz Kapusta: Przetwarzanie danych wymaga nierzadko specjalistycznej wiedzy. Przede wszystkim wymaga jednak odpowiedniej technologii, która pozwoli przeprocesować dostępne zbiory, wyciągnąć z nich wnioski i zaprezentować je w formie przystępnej dla odbiorcy. A ponieważ w ostatnich latach coraz więcej firm zauważa korzyści związane z analizą generowanych i przechowywanych danych, rośnie zapotrzebowanie na naukowców, tzw. data scientists.
Łatwo sobie wyobrazić, że nie każdą organizację stać na zatrudnienie takiej osoby i wyposażenie jej w odpowiednie narzędzia – zwłaszcza takie, które wydobywałyby dane w czasie rzeczywistym. Danych w biznesach jednak nie ubywa. W efekcie obserwujemy rozwój trendu demokratyzacji uczenia maszynowego czy sztucznej inteligencji, dzięki czemu firmy każdej wielkości mogą sięgnąć po rozwiązania z zakresu automatyki.
Grzegorz Ułan: Ogromny wzrost ilości przetwarzanych danych to wyzwanie dla wielu firm, które muszą zatrudniać znaczne liczby specjalistów od danych. Czy Wasze rozwiązania pozwalają ograniczyć liczbę potrzebnych do tego pracowników?
Grzegorz Kapusta: Co do zasady, korzystanie z Chmury Danych Snowflake umożliwia automatyzację wielu żmudnych procesów manualnych, co zdecydowanie uwalnia czas i zasoby pracowników, umożliwiając im poświęcenie się znacznie kreatywniejszej pracy. Natomiast, zgodnie z tym, o czym wspomniałem, dzięki automatyzacji i demokratyzacji uczenia maszynowego prędzej czy później znaczna część zespołu w organizacji może zostać w mniejszym lub większym stopniu specjalistami od danych.
Nie oznacza to jednak, że w organizacjach nie będą potrzebni doświadczeni naukowcy. Z perspektywy menedżerskiej obecność specjalisty ds. danych gwarantuje nie tylko bezpieczeństwo, również w kontekście ochrony danych osobowych, ale też etyczne przetwarzanie. W ostatnich latach obserwowaliśmy zmianę, za której sprawą administratorzy bazy danych, wraz z postępem technologicznym, musieli stawać się specjalistami ds. chmury czy architektami infrastruktury chmurowej.
Wymagało to pozyskania nowych umiejętności oraz zgłębienia wiedzy niezbędnej do utrzymania konkurencyjności na rynku. Podobnie sprawa ma się z osobami zajmującymi się analityką danych – ich rola będzie ulegać ewolucji, w trakcie której potrzebne będzie nabywanie nowych kompetencji, wymaganych do pracy z nowymi technologiami i narzędziami.
Grzegorz Ułan: Jak pandemia COVID-19 wpłynęła na ten rynek? Zaobserwowaliście w tym czasie zwiększone zapotrzebowanie na Wasze usługi?
Grzegorz Kapusta: Przyspieszenie transformacji cyfrowej związane z pandemią oraz konieczność pracy zdalnej zebrały swoje owoce również nad Wisłą. Jeszcze w 2020 roku szybka ewolucja w stronę chmury nie była aż tak oczywista – według szacunków Eurostatu, wówczas z technologii cloud computing korzystało zaledwie co czwarte przedsiębiorstwo w Polsce (24%). Jednak, co ważne, to wciąż było o dwa razy więcej niż w 2018 roku. Obecnie coraz częściej biznesy zdają sobie sprawę z tego, że przechowywanie danych w wielu niepowiązanych ze sobą miejscach jest nie tylko niewygodne czy niebezpieczne, ale w obecnych warunkach staje się często po prostu niemożliwe.
Co za tym idzie, w ciągu najbliższych 12-18 miesięcy aż 26% firm w kraju planuje wdrożyć w swoich organizacjach rozwiązania chmurowe. A te, które już przeprowadziły migrację do chmury publicznej, zwracają uwagę na szereg benefitów, ze skalowalnością i elastycznością infrastruktury na czele. Śmiało można więc stwierdzić, że firmy w Polsce coraz częściej i chętniej sięgają po rozwiązania chmurowe – ale samo podjęcie takiej decyzji nie jest wystarczające, aby rzeczywiście czerpać maksymalne korzyści z przechowywanych w ten sposób danych. Przedsiębiorstwa potrzebują wsparcia technicznego, m.in. przy wybieraniu odpowiednich parametrów chmury, migracji danych czy też późniejszym zarządzaniu całością infrastruktury.
To nie zawsze okazuje się proste, szczególnie w środowisku wielochmurowym – na całym świecie aż 30-35 proc. wydatków na usługi chmurowe jest „przepalanych”, np. na zasoby, których firmy nie potrzebują lub które nieprawidłowo skalują. W Snowflake pomagamy uniknąć takich sytuacji, dostosowując rozwiązania do organizacji każdego rozmiaru i umożliwiając gromadzenie, przetwarzanie i udostępnianie danych w niemal nieograniczonej skali, w pełni bezpieczny sposób.
Grzegorz Ułan: Czy automatyzacja to jedyny słuszny kierunek obecnie dla przedsiębiorstw? Co stanie się z firmami, które nie wsiądą do tego statku?
Grzegorz Kapusta: Po prostu może się okazać, że przepadną, bo nie dotrzymają kroku swoim konkurentom. Ponad 80 proc. liderów w Polsce uważa, że automatyzacja to istotny element strategii firmy. Nie bez powodu. Brak automatyzacji wymaga większej ilości pracy nad żmudnymi zadaniami, co sprzyja wydłużeniu procesów, pomyłkom przy wprowadzaniu danych czy nawet zwiększonej rotacji pracowników – nie wspominając o zmniejszonej efektywności kosztowej. Wszystko to przekłada się na zdecydowanie mniejszą elastyczność biznesu.
Warto mieć świadomość, że każdego roku organizacje tracą od 20 do 30 proc. przychodu z uwagi na nieefektywne procesy. Marzec 2020 r. pokazał, że trzeba być gotowym na tę technologiczną zmianę. W sytuacji, gdy z doby na dobę całkowicie zmieniały się różne założenia w otoczeniu biznesowym, kluczowa okazywała się automatyzacja, która umożliwiała sprawną ocenę otoczenia rynkowego czy bieżących zapotrzebowań, umożliwiając weryfikację celów biznesowych.
Grzegorz Ułan: Proszę teraz powiedzieć nam, co dalej? Jakie trendy związane z przetwarzaniem danych widzi Pan w przyszłym 2022 roku?
Grzegorz Kapusta: Co oczywiste – danych do przetworzenia nie będzie ubywać. Wręcz przeciwnie, każdego roku generujemy ich coraz więcej, co przekłada się na rosnącą adopcję rozwiązań z zakresu automatyzacji, m.in. automatycznego uczenia maszynowego. W nadchodzącym roku coraz większą rolę będzie odgrywać również analiza danych w czasie rzeczywistym, która będzie wymagać coraz lepszej automatyzacji procesów.
W nieustannie rozwijającym się otoczeniu biznesowym nie można pozwolić sobie na przetwarzanie informacji przez wiele tygodni – czas często jest kluczowy do utrzymania konkurencyjności biznesu niezależnie od branży. To szczególnie istotne w dobie rosnącej świadomości tego, jakie korzyści płyną z odpowiedniej pracy z danymi. Już teraz zauważamy, że obok firm, które od wielu lat inwestowały konsekwentnie w cyfryzację, są również takie, które narodziły się i rozwinęły w chmurze. To właśnie one najchętniej sięgają po narzędzia takie jak sztuczna inteligencja czy uczenie maszynowe.
Z drugiej strony, demokratyzacja tych technologii, a zwłaszcza AutoML, pozwoli czerpać z odpowiednich zasobów danych szerszemu gronu pracowników, czyniąc sztuczną inteligencją bardziej mainstreamową. Rozwój umiejętności analitycznych sprawi, że szersze grono osób będzie mogło wesprzeć organizację w usprawnieniach opartych na analizie danych.
Grzegorz Ułan: Automatyzacja to nie tylko szansa na konkurencyjność na rynku, innowacje czy rozwój, ale i wyzwania czy nawet zagrożenia. Co z etyką przetwarzania danych i ograniczaniem dostępu do danych tylko dla niezbędnej do tego liczby osób?
Grzegorz Kapusta: Dlatego właśnie, mimo demokratyzacji dostępu do uczenia maszynowego, wciąż ważną rolę będą odgrywać specjaliści ds. danych, którzy będą mogli m.in. wspierać firmy w zakresie etyki ich przetwarzania. Ważne jest, aby wszyscy pracownicy mieli świadomość tego, jakiego rodzaju dane się przetwarza (co zresztą mniej lub bardziej jest wymuszane przez przepisy RODO) i w jakim celu. Równie ważne jest zadbanie o to, aby zarówno zbiory danych, jak i algorytm, który je przetworzy, charakteryzowały się obiektywnością.
Kluczowy jest zatem reprezentatywny dobór danych, ale również otwartość na to, co nam zakomunikują. Oprócz łatwego pozyskiwania wszystkich rodzajów danych z firmy, organizacje mogą wykorzystywać dodatkowe dane pochodzące od stron trzecich z tzw. data matkerplaces, co umożliwia im tworzenie bardziej zaawansowanych modeli automatycznych. Opracowanie udanych modeli z wykorzystaniem AutoML umożliwi również organizacjom dzielenie się tymi modelami i zarabianie na nich, stanowiąc część ekosystemu dzielenia się danymi opartego na większej współpracy.
Ponadto organizacje powinny rozważyć ustanowienie specjalnych działów ds. etyki. Mowa o grupie osób, które mogłyby sprawdzać dane wyjściowe, czuwać nad procesem ich analizy i zapewniać równowagę danych oraz wartości. Zespół taki może zainwestować w rozwiązania z zakresu sztucznej inteligencji i wprowadzać ramy oceny, aby zapewnić, że algorytmy, dane, wnioski i wyniki są tworzone w sposób sprawiedliwy. Dzięki podjęciu takich działań AutoML może się rozwijać w sposób etyczny, tworząc zautomatyzowane wglądy w dane, które są uczciwe, dokładne i wiarygodne.
Pozostaje jeszcze kwestia tego, kto i w jakim zakresie może mieć dostęp do danych. Chmura Danych Snowflake umożliwia pełną kontrolę nad tym procesem. Bezpieczeństwo jest wbudowane w naszą platformę – to coś, na czym skupialiśmy się od samego początku. Jednym z największych benefitów naszego rozwiązania, jeśli chodzi o kwestię bezpieczeństwa, jest także to, że eliminujemy silosy danych, w ramach których istnieje duże ryzyko wycieków i problemów z zarządzaniem. Dzielenie się danymi za pomocą platformy Snowflake odbywa się pod pełną kontrolą – jest bezpieczne i możliwe w czasie niemal rzeczywistym.
Grzegorz Ułan: Na koniec proszę się podzielić z nami swoimi przewidywaniami, w jakich obszarach rozwiązania autoML i AI w automatyzacji przetwarzania danych zyskają na popularności w najbliższym czasie? Może medycyna? Co my na tym możemy zyskać?
Grzegorz Kapusta: Niezależnie od branży, każda firma będzie się powoli przekonywać, że ich konkurenci już przetwarzają dane, aby osiągnąć najlepsze możliwe rezultaty. W efekcie obecność specjalistów ds. danych w organizacjach nie będzie już nas dziwić.
Natomiast istotnie, medycyna – szczególnie w dobie pandemii – jest jedną z branż, która może skorzystać na automatyzacji przetwarzania danych. Dla przykładu technologia OCR w połączeniu z możliwościami sztucznej inteligencji umożliwi sprawne zeskanowanie i zapisanie informacji papierowej w formie cyfrowej, a uczenie maszynowe może pomóc w diagnozie i prewencji, przewidując różnego rodzaju schorzenia na bazie dostarczonych danych – a to tylko wybrane korzyści, które mogą pozytywnie wpłynąć na jakość diagnostyki oraz leczenia. Doskonałym przykładem jest możliwość oceny skutków pandemii, za sprawą danych osadzonych w chmurze. Stało się to możliwe na tak wielką skalę po raz pierwszy w historii.
W Chmurze Danych Snowflake działa projekt firmy Starschema, w ramach którego analizowane są dane dotyczące skutków pandemii COVID-19, jak i podejmowanych środków ochrony. Dzięki możliwości uzyskania kompleksowego obrazu sytuacji, szereg organizacji od medycznych i administracyjnych, po prywatne firmy może lepiej reagować na potencjalne kryzysy i podejmować lepsze, oparte na wiedzy decyzje. Wszystko to dzięki wiarygodnym, szczegółowym i automatycznie przetwarzanym danym osadzonym w chmurze.
Grzegorz Ułan: Dziękuję za rozmowę.
–
Snowflake jest obecny na polskim rynku już od prawie roku i stale zatrudnia nowe osoby. Dołączenie do nas to możliwość zobaczenia od środka szybko rosnącej firmy technologicznej, udział w ciekawych i globalnych projektach oraz bycie częścią zmiany w obszarze Cloud. Nasze zespoły tworzą produkty, z których korzystają firmy, często te największe, na całym świecie. Dodatkowo, Snowflake jest atrakcyjnym pracodawcą – oferując konkurencyjne wynagrodzenie, pakiety RSU, bonusy kwartalne i zestaw benefitów.
Niektóre z naszych pozycji w Warszawie:
- Senior Quality Engineer
- Senior Observability Engineer
- Senior Cloud Services Engineer
- Technical Lead Engineering Productivity
- Senior Backend Engineer
Pozostałe oferty można znaleźć na naszej zakładce kariery lub na justjoinIT.
–
Artykuł powstał we współpracy z firmą Snowflake
Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu