Bitcasa to bardzo ciekawy startup zaprezentowany na TechCrunch Disrupt, o którym niedawno pisał Grzegorz Marczak. Jedną z głównych obietnic jaką składa Bitcasa, to nieograniczona ilość miejsca na przechowywanie danych. Do tej pory nie wiadomo było jak twórcy nowej usługi zamierzają ją zrealizować, jednocześnie zapewniając bezpieczeństwo. Okazuje się, że pomimo szyfrowania danych po stronie klienta będzie możliwa deduplikacja plików. Jest to zapewne bezpieczniejsze rozwiązanie niż w Dropboksie. W tym artykule zaprezentuję porównanie możliwości tych dwóch serwisów.

Na początek warto przypomnieć czym jest Bitcasa. W skrócie – jest to rozwinięcie dotychczasowych rozwiązań dotyczących synchronizacji naszych danych z chmurą. Jednym z najbardziej popularnych przykładów tej kategorii usług jest Dropbox. Co zatem różni Bitcasa od konkurencji? Rozmach. Synchronizowane mają być dosłownie wszystkie dane na naszym komputerze, włącznie z zainstalowanymi aplikacjami, a dostępna przestrzeń ma być nielimitowana, albo przynajmniej bliska nielimitowanej, liczona w dziesiątkach terabajtów. Dzięki temu mielibyśmy łatwy dostęp do naszych danych z każdego komputera (i nie tylko) podłączonego do sieci.

Różni się też podejście. Dropbox po prostu synchronizuje dane pomiędzy urządzeniami, co oznacza, że synchronizując komputer z naszym telefonem, musimy mieć w telefonie wystarczająco dużo miejsca, żeby pomieścić wszystkie nasze synchronizowane dane. (Jak słusznie zauważyli czytelnicy w komentarzach to nie do końca prawda. Dropbox na urządzeniach mobilnych pozwala podejrzeć pliki i pobrać tylko potrzebne jak również synchronizowac wybrane foldery. Problem pozostaje gdy synchronizujemy dwa komputery o rożnych pojemnościach dysków. Poza tym pobieranie całego pliku jest wciąż gorszym rozwiązaniem niż jego strumieniowanie.) W przypadku Bitcasa wszystkie dane synchronizują się tylko i wyłącznie z chmurą a na inne urządzenia są przesyłane strumieniowo, podobnie jak filmy na YouTube. W efekcie możemy mieć dostęp z mobilnego urządzenia do dziesiątków terabajtów danych bez większego problemu. Z punktu widzenia użytkownika wygląda to tak jakby Bitcasa była zewnętrznym dyskiem, który zastępuje pamięć lokalną w sposób niedostrzegalny, transparentny i czyni to całkowicie bezobsługowo.

Z technicznego punktu widzenia tego rodzaju serwis napotyka dwie zasadnicze trudności: bezpieczeństwo i architektura zapewniająca odpowiednio dużo przestrzeni dyskowej dla klientów, zachowując rozsądną cenę usługi. W przypadku Bitcasa ma to wynosić 10 dolarów na miesiąc za nielimitowana ilość miejsca.

Na dodatek oferowanie bardzo dużej ilości miejsca w niskiej cenie stoi w konflikcie z bezpieczeństwem. Żeby przechowywać duże liści plików użytkowników potrzebne są określone optymalizacje, jak na przykład deduplikacja plików. Deduplikacja polega na wyeliminowaniu wszelkich duplikatów plików. Każdy plik przechowywany jest tylko raz, a jeśli występuje w którymś miejscu ponownie, np. u innego użytkownika, zostaje zastąpiony odnośnikiem do oryginału.

Taką metodę stosuje właśnie wspominany Dropbox, jednak z początku nie poinformował on o konsekwencjach takiego podejścia. Polegają one na tym, że Dropbox posiada klucz konieczny do rozszyfrowania danych, w celu porównania ich i właśnie deduplikowania. Jednym słowem, Drpbox może rozszyfrować wszelkie nasze dane bez naszej wiedzy i w razie potrzeby udostępnić je na prośbę rozmaitych służb bezpieczeństwa. Dopiero pod naciskiem dociekliwych użytkowników Dropbox poprawił regulamin zawierający warunki korzystania z usługi (początkowo była tam informacja, że nikt poza użytkownikiem nie ma dostępu do jego plików) i wydał oświadczenie o tym, że są w stanie rozszyfrować pliki użytkowników. Pisał o tym Szymon Barczak, ja również wspomniałem na ten temat w artykule „Dropbox wyjaśnia zmiany, jakie zaszły w warunkach korzystania z jego usługi (ToS)„.

Okazuje się, że Bitcasa chce pogodzić wysokie standardy bezpieczeństwa czyli szyfrowanie po stronie klienta, bez możliwości rozszyfrowania danych po stronie serwera, z deduplikacją w celu optymalizacji dostępnego miejsca i kosztów. Okazuje się, że jest to możliwe.

Takie szyfrowanie nosi nazwę „convergent encryption”. Nie wiem czy istnieje szeroko przyjęta polska nazwa takiego rodzaju szyfrowania, więc przepraszam jeśli popełniam tu faux pas, ale można to przetłumaczyć jako szyfrowanie zbieżne lub konwergentne. Bez zagłębiania się w techniczne szczegóły, technologia ta pozwala stwierdzić, czy zaszyfrowane dane są identyczne, nawet wówczas jeśli zostały zaszyfrowane rożnymi kluczami. Jest to jeden z patentów, który (jak mniemam) posiada Bitcasa US Patent 7437555.

Czy zatem takie podejście ma jakieś słabe strony w stosunku do szyfrowania po stronie klienta, bez możliwości deduplikacji? Oczywiście, musi mieć.

  • Po pierwsze, jeśli można deduplikować, czyli stwierdzić, że dwa pliki są identyczne, można metodą prób i błędów, lub mając określone podejrzenia, sprawdzić poprzez porównanie czy dana osoba posiada identyczny plik. Oczywiście wymaga to dostępu do naszych plików, chociaż wciąż w formie zaszyfrowanej. Można w ten sposób sprawdzić czy ktoś posiada np. tą samą empetrójkę, co krąży po sieci. W uproszczeniu wygląda to tak: wgrywamy mp3 na Bitcasa i jeśli plik został poddany deduplikacji, szukamy oryginału oraz odnośników do tego plików u użytkowników. Jak widać wymaga to dostępu do plików na serwerze, współpracy z Bitcasa i jest to żmudna procedura. Wystarczy, że ktoś wytnie z mp3 ostatnie 3 sekundy ciszy, żeby pliki nie zostały zidentyfikowane jako takie same.
  • Po drugie, w określonych sytuacjach, kiedy znamy część treści określonego dokumentu, którego reszta została utajniona a szukamy wersji pełnej, z odtajnioną treścią, może to ułatwić atak i ewentualne złamanie klucza. Wcześniej musimy jednak wiedzieć, że ktoś taki właśnie dokument będzie posiadał (sokoro część informacji jest odtajniona i my chcemy te informacje poznać, to znaczy, że nie mamy identycznego pliku do porównania w celu wykorzystania pierwszej słabości, opisanej powyżej). Poza tym taki atak nie jest prosty do przeprowadzenia i wymaga sporo trudu i odrobiny szczęścia.
Warto zdecydowanie podkreślić, że model szyfrowania przyjęty w projekcie Bitcasa jest bez porównania bezpieczniejszy niż ten obecnie stosowany w projektach, które wykorzystują deduplikacje, czyli miedzy innymi w Dropboksie. Jest tylko nieznacznie bardziej podatny na atak niż szyfrowanie po stronie klienta bez mechanizmów deduplikacji, jednocześnie pozwalając na oferowanie bardzo dużej ilości miejsca w rozsądnej cenie. 10 dolarów miesięcznie za nielimitowaną przestrzeń, to naprawdę korzystna oferta, za tyle samo Dropbox oferuje 50 GB przy jednocześnie znacznie gorszym bezpieczeństwie i konieczności posiada odpowiedniej ilości wolnego miejsca na każdym synchronizowanym urządzeniu.
Jak można podsumować powyższe informacje? Jeśli Bitcasa spełni swoje obietnice i utrzyma konkurencyjną cenę, zachowując prostotę Dropboksa, zaoferuje znacznie lepsze bezpieczeństwo i ogromna ilość miejsca. Tym sposobem prawdopodobnie wygryzie niemal wszystkie istniejące usługi synchronizacji z chmurą. Pozostaje pytanie, czy dotrzymają swoich obietnic? Mam nadzieję, że tak, bo sam chętnie skorzystałbym z możliwości tego świetnie zapowiadającego się startaupu.

 

Jesli ktoś chciałby posłuchać w oryginale jak twórcy Bitcasa tłumaczą na czym polega szyfrowanie po stronie klienta, umożliwiające jednocześnie deduplikację, zapraszam do artykułu na Tech Crunch.
Spodobał Ci się tekst? Poleć znajomym:

iStore

iStore

  • Marcin

    Na Quora był wątek na temat tego jak można szyfrować po stronie klienta przy jednoczesnej deduplikacji danych.

    http://www.quora.com/Bitcasa/How-can-Bitcasa-possibly-achieve-both-client-side-encryption-and-de-duplication-across-multiple-accounts

    • Jan Rybczyński

      Dzięki za ciekawego linka.

  • Geppetto

    „Dropbox po prostu synchronizuje dane pomiędzy urządzeniami, co oznacza, że synchronizując komputer z naszym telefonem, musimy mieć w telefonie wystarczająco dużo miejsca, żeby pomieścić wszystkie nasze synchronizowane dane.”
    To nie jest prawdą. Aplikacja Dropboxa na Androida nie synchronizuje całego katalogu od razu, toteż nie ma potrzeby posiadanie wolnej dużej ilości miejsca w telefonia.

    • Jan Rybczyński

      Słuszna uwaga, zaraz to poprawię w tekście. Po prostu nigdy nie miałem okazji anie potrzeby korzystać z Dropboxa na telefonie. Tym nie mniej jeśli chcemy synchronizować Desktopa, który ma 4 TB dysków z laptopem, który ma 500 GB, maksymalnie 1,5 TB to pojawia się problem o którym pisałem, dodatkowo sama konieczność pobierania plików na każdym urządzeniu jest kłopotliwa.

  • Mariusz Droździel

    Nigdy nie rozumiałem o co chodzi w Dropboxie z tą deduplikacją. Przy ograniczonej przestrzeni ludzie będą tam składować jedynie ważne i prywatne dane – więc bardzo słabo się to będzie deduplikować. W przypadku pełnego systemu deduplikacja ma spory sens. Przy odpowiedniej skali okaże się, że 50% ludzi ma tego samego Windowsa, Offica. Nawet seriale, filmy czy mp3 w masowych ilościach nie będą stanowić problemu.

    • Jan Rybczyński

      Dropbox zarabia, a więc sprzedaje swoje plany na 50 i 100 gigabajtów (nie może funkcjonować tylko na darmowych planach po kilka GB przecież). To nie tak mało, żeby trzymać tylko ściśle prywatne dane. Duplikacja bez wątpienia występuje. Przy bardzo dużej ilości użytkowników są to zapewne dziesiątki czy setki terabajtów oszczędzonego miejsca.

  • http://www.grezlikowski.pl Łukasz Gręźlikowski

    W przypadku Dropboksa i urządzeń mobilnych pojawiła się pewna nieścisłość. W telefonie komórkowym mamy wgląd we wszystkie pliki zapisane na koncie Dropboksa, ale pobierane są tylko te pliki, których w danym momencie chcemy użyć.

    • Jan Rybczyński

      Faktycznie, masz rację, zacytuję odpowiedź na wcześniejszy komentarz:
      „Słuszna uwaga, zaraz to poprawię w tekście. Po prostu nigdy nie miałem okazji anie potrzeby korzystać z Dropboxa na telefonie. Tym nie mniej jeśli chcemy synchronizować Desktopa, który ma 4 TB dysków z laptopem, który ma 500 GB, maksymalnie 1,5 TB to pojawia się problem o którym pisałem, dodatkowo sama konieczność pobierania plików na każdym urządzeniu jest kłopotliwa.”

      Dziękuję za informację. Już to poprawiam.

  • http://ekostrefa.pl Łukasz Ostrowski

    Ciekawe czy się nie przewrócą za jakiś czas.

  • KZS

    Bitcasa w teorii brzmi bardzo fajnie, ale chciałbym zobaczyć jak to działa, bo mam wątpliwości natury technicznej. Głównie odnośnie „duplikacji” do chmury całych systemów oraz tego jak sobie Bitcasa poradzi z przypisaniem kompletnie różnych komputerów do tego samego konta (bo chyba o to chodzi, żeby móc korzystać na wszystkich urządzeniach z jednego „dysku sieciowego”).

    • Błażej

      Można sobie wyobrazić, że będzie się miało kilka „woluminów” czy „partycji” i na przykłąd dla różnych naszych kompóterów wspólny będzie tylko dysk z dokumentami (w sensie: dokumenty, muzyka, foto etc…), zaś pozostałe będą odrębne. To naprawdę dość łatwe do zrobienia.

      Zresztą, przy deduplikacji, każdy komputer może mieć własny dysk a powtarzające się pliki i tak będą raz zapisane w chmurze.

    • Jan Rybczyński

      Też jestem ciekaw jak im to wyjdzie w praktyce. Ale zapowiada się dużo lepiej niż cokolwiek, co dotąd widzieliśmy. Chyba wiedzą co robią? ;-)

  • http://s21n.pl Mateusz Sienkan

    „Jak słusznie zauważyli czytelnicy w komentarzach to nie do końca prawda. Dropbox na urządzeniach mobilnych pozwala podejrzeć pliki i pobrać tylko potrzebne. Problem pozostaje gdy synchronizujemy dwa komputery o rożnych pojemnościach dysków. Poza tym pobieranie całego pliku jest wciąż gorszym rozwiązaniem niż jego strumieniowanie.”
    To rowniez nie jest prawda. Dropbox pozwala wybrac ktore foldery synchronizowac a ktorych nie. Pozwala to oszczedzac transfer i przestrzen dyskowa na wybranych urzadzeniach

    • Jan Rybczyński

      To już raczej był skrót myślowy, niż błąd, ale dodałem wyjaśnienie na wszelki wypadek.

    • Tomek Sułkowski

      Taki skrót myślowy wprowadza w błąd ;)

      A, i nie widzę tego wyjaśnienia…

  • http://s21n.pl Mateusz Sienkan

    Co do strumieniowania… Dropbox i to potrafi.

    • Jan Rybczyński

      To znaczy, że można przeglądać np.PDF-a wielkości kilkuset MB bez pobierania go w całości na dysk twardy? To samo z innymi plikami? Bez względu na typ pliku? I można to stosować domyślnie dla każdego pliku? Nie wydaje mi się, inaczej to całe synchronizowanie nie miałoby sensu.

  • Maciek Wójcikowski

    Opis wad deduplikacji jest opisem działania deduplikacji na Dropboxie. Jeśli dane są zaszyfrowane to nie wgrywanie samego pliku nam nie powie czy plik jest w chmurze – musi on być zaszyfrowany tym samym kluczem.

    • Jan Rybczyński

      Odsyłam do linku w pierwszym komentarzu, na Quorze ktoś ładnie to wszystko wyjaśnił.

      Ale na logikę, jeśli można stwierdzić, że taki plik istnieje i nie ma potrzeby wgrywać go na serwer, to znaczy, że można porównać dowolne dwa pliki. Jeśli porównamy piracki film i znajdziemy odpowiednik w serwisie, znaczy się, że bez rozszyfrowywania wiemy co przechowuje.

  • gizmo

    Szkoda ze nie bedzie darmowej wersji ale coz.. Osobiscie widze brak mozliwosci udostepniania plikow, sporo korzystam z folderu public w dropboxie i widze ze raczej sie to nie zmieni

    • Jaromir Bartman

      Gdyby się pojawiła opcja udostępniania plików to wszystkie serwisy typu rapidshare z miejsca by zbankrutowały. Z torrentów też już by nikt nie korzystał.

    • Jan Rybczyński

      Funkcja udostępniania plików jak najbardziej istnieje. Jako jeden z przykładów wykorzystania Bitcasa jeden z twórców podaje możliwość udostępnienia pliku o wielkości 5 TB.

      Co do darmowej wersji, nie może takowej być, bo jakiekolwiek ograniczenie pojemności mija się z celem w tym przepadku. Założeniem serwisu jest trzymanie wszystkiego w sieci. W przypadku ograniczeń nie spełnia swojego podstawowego założenia. Dać za darmo nielimitowanej przestrzeni też nie można.

      Być może powstanie np. 30 dniowa wersja testowa, ale na darmowe GB jak w Dropboksie raczej nie ma co liczyć.

      Z drugiej strony 10$ za nielimitowaną przestrzeń to niewiele, tyle co Dropboksowe 50 GB.

  • Jaromir Bartman

    Nie jestem przekonany do trzymania całej zawartości komputera w chmurze ponieważ na pewno będzie to miało wpływ na szybkość otwierania się i działania programów. Tym bardziej, że jeśli padnie net to wtedy kopmp do niczego się nie nadaje.

    Ale jeśli rzeczywiście za 10 dolarów będziemy mieć nieograniczone miejsce to można by stworzyć niemal, że idealną bibliotekę filmową, mptrójek i (np. w moim wypadku) tanie miejsce gdzie można trzymać backup zdjęć.

    No właśnie może znacie jakiś pewny serwis (bo bitcasa to na razie jest tylko w wersji beta, a nie chciałbym się nagle dowiedzieć, że ważne dla mnie pliki zniknęły w tajemniczych okolicznościach) który pozwala tanio przechowywać setki gigabajtów? Nie musi się automatycznie synchronizować i mieć full wypaśnych opcji. Może działać na zasadzie ftpa. W każdym razie ma być tańszą i pewniejszą alternatywą robienia backupów na zapasowych dyskach.

    • AA

      Zainteresuj się Amazon S3 i pochodne od innych firm.

  • PiotrZ

    takie same piki róznych userów szyfrowane są tym samym kluczem (opartym o sumę kontrolną szyfrowanego pliku)…

    Prywatność ciągle nie jest 100%, jeśli serwis będzie w USA, sąd może nakazać ujawnienie wszystkich userów, posiadających ten sam kowergentnie zaszyfrowany plik z nielegalnym filmem.

    Bezpieczeństwo jest owszem wyższe, bo serwis nie ma danych pozwalających na zdekodowanie Twoich plików…

    polecam lekturę:
    https://spideroak.com/blog/20100827150530-why-spideroak-doesnt-de-duplicate-data-across-users-and-why-it-should-worry-you-if-we-did

    bo widzę tu straszną ekscytację nieistniejącym nieskończdonym produktem (Bitcasa) i dłuższy już hate-speech wobec mimo wszystko praktycznego i popularnego Dropboxa…

  • Crone

    Jan Rybczyński: To znaczy, że można przeglądać np.PDF-a wielkości kilkuset MB bez pobierania go w całości na dysk twardy? To samo z innymi plikami? Bez względu na typ pliku? I można to stosować domyślnie dla każdego pliku? Nie wydaje mi się, inaczej to całe synchronizowanie nie miałoby sensu.

    Plik to się najpierw musi dać strumieniować. PDF się da, film też, ale zdjęć czy programów sobie nie „postrumieniujesz” – nie da się. Da się użytkować plik tak, jakby był zapisany na pamięci wymiennej. To robi różnicę. I to dużą. Tak więc nie przesadzaj z tym hurraoptymizmem ;)

  • Aser

    Dropbox swoje, ale jest ciekawsza alternatywa MINUS –

    http://min.us/rVaCbcR

    Zyskujemy na starcie 10 GB po czym przez linki referencyjne rozszerzamy do, UWAGA, aż do 50 GB! (każdy zaproszony użytkownik to dodatkowy 1GB pojemności).

    Fajne nie :)

    Należy dodać iż minus posiada fajne programy dla wszystkich systemów desktop oraz mobilnych do zarządzania, udostępniania i czegokolwiek tylko chcemy w tym serwisie (nie musimy logować się na stronę).

  • Pingback: Przywiązanie do systemu vs uwolnienie się od niego