Świat

Publiczne dane w końcu upublicznione! Kiedy to się stanie w Polsce?

Krzysztof Wąsowski
Publiczne dane w końcu upublicznione! Kiedy to się stanie w Polsce?

Internet to jedna wielka baza danych, w której obok śmieciowych informacji znajduje się także mnóstwo wartościowej zawartości, którą można wykorzystać...

Internet to jedna wielka baza danych, w której obok śmieciowych informacji znajduje się także mnóstwo wartościowej zawartości, którą można wykorzystać w różnych celach. Problem jednak jest taki, że do niektórych zasobów informacji ciężko jest dotrzeć nawet przez Google. De facto Google serwuje nam jedynie dane, które według niej są najbardziej dla nas wartościowe, a nie odwrotnie. Enigma to startup, który ma pomóc w znalezieniu wartościowych danych użytkownikom internetu, jednak produkt, który został stworzony przez zespół Enigma nie jest kolejną wyszukiwarką pokroju Google czy Yahoo. Enigma to także startup, który wygrał TechCrunch Distrupt NY 2013 i zgarnął nagrodę główną czyli 50 tysięcy USD.

Jak już wspomniałem w internecie znajduje się mnóstwo wartościowych informacji i danych, które są publikowane przez różne publiczne podmioty. Jednak niewielu użytkowników wie jak się do nich dostać, a jeżeli nawet uda się im znaleźć do nich wejście to znajdują jedynie przysłowiowy wierzchołek góry lodowej. Bo użytkownika, który znalazł ciekawe dane czeka jeszcze kilka dobrych godzin przy wyszukiwarce by znaleźć dane uzupełniające, czyli takie, dzięki którym będzie miał cały obraz danego tematu. Zazwyczaj jakiekolwiek informacje bądź dane są ze sobą połączone w sposób logiczny i tylko znalezienie grupy danych, które łączą się w jedną całość dają użytkownikowi pełny obraz tego czego szuka i pozwala wyciągnąć właściwe logiczne wnioski.


Dodatkowym problemem z danymi publicznymi jest brak koherentności ich nośników. Pamiętajmy, że wszelakie dane istnieją także poza internetem na różnych nośnikach. W różnego rodzaju książkach, na płytach DVD, dyskach przenośnych, serwisach WWW chałupniczej roboty czy nośnikach, które wyszły już z obiegu jak np. kasety streamerowe etc. I pomimo tego, że są danymi publicznymi, ciężko jest się do nich dostać zwykłemu szaremu Kowalskiemu.

Rozwiązaniem tej dziwnej sytuacji, w której znajdują się publiczne dane, do których nikt się nie może dostać ma być właśnie startup Enigma. Startup ten został stworzony po to by ułatwić dostęp użytkownikom do danych, które tylko teoretycznie są publiczne, a tak naprawdę wymagają czasu i pieniędzy by do nich dotrzeć. Enigma w tym momencie ma dostęp do ponad 100 tysięcy różnych źródeł publicznych danych na terenie USA, na które składają się dane z poszczególnych stanów oraz dane federalne. Dzięki Enigmie użytkownik może w łatwy sposób znaleźć, odkryć i połączyć setki danych w jedną całość i zobaczyć pełny obraz tematu, który eksploruje.

Brzmi to dosyć zawile prawda? Jednak takie nie jest. Jeżeli w pole wyszukiwania Enigmy wrzucilibyśmy np. słowo Boeing i kazalibyśmy jej poszukać tej frazy w danych publicznych naszym oczom ukazałyby się setki tabelek, w których znajdziemy między innymi informacje o Licencjach FCC, dane na temat finansów poszczególnych przewoźników lotniczych (którzy dysponują samolotami Boeing), listę wydatków rządu USA na samoloty Boeing, informacje na temat spółek, których właścicielem lub udziałowcem jest Boeing itd. Tabela z wynikami, którą wypluje Enigma po wpisaniu danej frazy to tylko wierzchołek góry lodowej. Użytkownik poprzez klikanie w poszczególne pola w tabeli może zagłębiać się w interesujące go dane. Na przykład dzięki jednemu kliknięciu może sprawdzić numery boczne samolotów, którymi dysponuje linia lotnicza NWA i sprawdzić przebieg samolotu, kiedy był remontowany, co było wymieniane i dlaczego. Ba, może nawet sprawdzić czy dany samolot ma na swoim koncie jakieś wypadki.


Oczywiście nie wszyscy interesują się samolotami. Jeżeli przykład Boeinga był za trudny to zawsze Enigmie można kazać wyszukać np. Google. Enigma zaserwuje jeszcze więcej informacji na temat tego technologicznego giganta i tak można np. sprawdzić ilu inżynierów spoza USA Google zatrudniło w 2012 roku. Wystarczy frazę Google uzupełnić o nazwę wizy czyli w tym przypadku H-1B oraz o informację o stanowisku jakie było wpisywane we wniosku wizowym. Dzięki Enigmie dowiemy się, że Google zatrudniło w 2012 roku aż 471 osób pracujących na stanowisku inżyniera spoza USA (a przynajmniej tylu zarejestrował departament pracy).

Właściwie te wszystkie dane są dostępne publicznie dla każdego, jednak wyszukiwanie ich poprzez Google może potrwać wieki. Trzeba wiedzieć jakie dokładnie frazy wpisywać i gdzie szukać. Enigma po prostu uzyskała dostęp do większości rządowych serwisów gromadzących i publikujących publiczne dane. Dodatkowo twórcy pomyśleli o kojarzeniu danych, które mają ze sobą coś wspólnego. Czyli użytkownikowi serwowane są nie tylko dane, których konkretnie szuka, ale także dane, które są konotacjami i pomogą w zobrazowaniu całości. Wszystko to ubrane zostało w przyjemny, wygodny, a przy okazji ciekawy dla oka interface.


Jeżeli zastanawiacie się, komu tak naprawdę mogą się przydać takie dane, to odpowiedź jest prosta. Przede wszystkim ludziom, którzy piszą dla gazet i miesięczników. Dla nich proste wyszukiwanie różnego rodzaju trudno dostępnych danych będzie zbawieniem i nie będzie im ta czynność spędzała snu z powiek. Dodatkowo Enigmą powinni być zainteresowani pracownicy naukowi uczelni, a także ludzie z branży finansowej, którzy opierają swoją pracę na liczbach. Warto wspomnieć, że Enigma ma kilku wartościowych partnerów, między innymi zalicza się do nich Harvard Business School, New York Times czy Gerson Lehrman Group. Do tej pory Enigmie udało się zebrać ok. 1,5 miliona w pierwszej i jak na razie jedynej rundzie seed.

Sam model biznesowy Enigmy składa się z dwóch części. Po pierwsze, mocno współpracują z S&P Capital IQ, któremu twórcy udostępniają API swojego produktu. Dzięki danym z rynku i współpracy z S&P Enigma ma możliwość tworzenia jeszcze precyzyjniejszych narzędzi do wyszukiwania danych publicznych. S&P w zamian ma dostęp do praktycznie nieograniczonych zasobów danych na rynku, które agreguje Enigma. Druga część modelu biznesowego tego startupu to klasyczny płatny dostęp do ich portalu i wybranych narzędzi, które on oferuje.


Sam jestem ciekaw jak się rozwinie ten startup i kiedy wkroczy do Polski. Pytanie jak do tematu upubliczniania danych publicznych podejdzie polskie społeczeństwo. Zakładam, że o ile większość ludzi będzie chętna to rząd może nie chcieć wprowadzać tak radykalnych zmian. Z ich perspektywy, pewne dane powinny być pewnie trudno dostępne, pomimo tego, że są danymi publicznymi.

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu