Mordujemy Pana Gąbkę dalej – czyli kolejny twórca dużego serwisu opowiada o tym jak radzić sobie z wydajnością. Tym razem swoimi doświadczeniami zgodził się podzielić Michał Sadowski Dyrektor Kreatywny z Flexy Interactive (agencja odpowiedzialna za Patrz.pl i jednocześnie współwłaściciel strony)


Czy tak zwana “wydajność” to duży procent w budżecie takiego serwisu jak twój ? Jak dużo wydajesz na utrzymanie infrastruktury (mogą to być przybliżone kwoty lub widełki)

W tej chwili, na serwery wydajemy od kilkunastu do kilkudziesięciu tysięcy złotych miesięcznie.

Jak radzisz sobie z utrzymaniem odpowiedniej wydajności serwisu, czy zatrudniałeś (zatrudniasz) specjalistów w tej dziedzinie?

Na początku działalności (przed sprzedażą części udziałów w Patrz) zajmował się tym jeden z nas (w sensie nas – założycieli). Obecnie przy utrzymaniu sieci kilkudziesięciu serwerów, z których korzysta Patrz.pl pomaga nam zespół administratorów firmy IMPartner (również należącej do IG).

Czy w tych czasach (dostępnych technologi i taniejących serwerów, łączy itp) wydajność może być permanentnym problemem – czy też powinna być rozwiązywana wraz z “kolejną dostawą serwerów”

System składowania i serwowania plików Patrz.pl jest w pełni skalowalny. W ostatnim czasie, musieliśmy jednak zmodyfikować infrastrukturę ze względu na wprowadzenie usługi „wideo na komórkę” – umożliwiającej bezpłatne pobieranie filmów z Patrz.pl na komórkę, ipoda, czy też psp. Wynikało to przede wszystkim z dużo większego niż zwykle zapotrzebowania na moc obliczeniową.

Michał a czy mógłbyś podać trochę więcej szczegółów o tym jak modyfikowaliście infrastrukturę ze względu wprowadzenie usługi „video na komórkę”?

Modyfikacja infrastruktury serwerów związana była przede wszystkim z wymianą procesorów w maszynach odpowiadających za konwersję uploadowanych plików wideo. Dotychczas, proces przetwarzania dodawanych plików obejmował jedną konwersję oryginalnego pliku – do formatu flashvideo w którym filmy serwowane są na stronie. Uruchomienie usługi „wideo na komórkę” wymogło dodanie do opisywanego procesu dwóch dodatkowych konwersji – do formatu 3gp i mp4. Jak łatwo się domyślić, zabieg ten trzykrotnie zwiększył złożoność obliczeniową całego procesu przetwarzania plików wideo. Stąd potrzeba modyfikacji infrastruktury. Warto dodać, że z usług Patrz.pl korzysta obecnie około 2 mln unikalnych użytkowników miesięcznie, z czego 60% ruchu generują pliki wideo.

Twitter to już chyba symbol problemów z dostępnością serwisu internetowego w tych czasach – co według Ciebie może być główną przyczyną tych problemów i jaka kwota pieniędzy powinna je definitywnie rozwiązać

Trudno powiedzieć na czym polega problem Twittera bez dokładnej znajomości ich infrastruktury. W dużych serwisach „wąskim gardłem” jest zazwyczaj baza danych, a nie jak mogłoby się zdawać serwer www (z PHP, JSP, czy ROR), który można replikować dużo łatwiej niż bazę danych.

Jakieś rady dla tych którzy właśnie zauważyli, że ich popularny startup zaczyna wolno działać?

W pierwszej kolejności warto sprawdzić, czy wina leży po stronie łącza, czy serwera. W przypadku niewydajnego łącza, trzeba naturalnie wykupić szersze pasmo lub zmienić firmę hostingową. W wypadku problemów z serwerem, pierwszym krokiem jest przeniesienie bazy danych na odrębną maszynę (inną niż ta obsługująca serwer www). Kolejne kroki to „wyższa szkoła jazdy” i trudno byłoby to w skrócie opisać.

Spodobał Ci się tekst? Poleć znajomym:

iStore

iStore

  • http://ciukes.com ciukes

    Bardzo ciekawa seria. Niecierpliwie czekam na nastepne odcinki.

  • http://lymorn.com Lymorn

    dlaczego odpowiedzi na drugie i czwarte pytanie:
    są identyczne?!

  • http://www.pytamy.pl hazan

    Ups – trochę namieszałem przy kopiowaniu, już jest ok – dzięki za uwagę.

  • http://talen.jogger.pl talen

    Czy aż tak trudno powiedzieć, że tworzy się klastry?

  • http://www.digerati.pl Michał Sadowski

    @talen: nie każdy ‘startupowiec’ zna się na tworzeniu klastrów. Zdziwiłbyś się, ile z nowo-powstałych serwisów tworzonych jest na zasadzie: jooma + najtańszy serwer na homie ;)

  • Molton

    Zgadzam się z ciukesem. Świetny wywiad, czekamy na więcej.

  • Mike

    Ciekawy temat, jednak mam wrażenie ze ta odpowiedź jest strasznie mało konkretna, i napisana tylko aby odpisać i mieć spokój. W sumie nie dziwię się – nie każdy lubi zdradzać swoje tajemnice, jednakże brakuje mi konkretów – jak radziły sobie serwisy przy takich wzrostach oglądalności jaki towarzyszył NK czy patrz.pl.

  • dc1

    ekhm, lubie wywiady, ale ten mnie jakos nie powalil. Michal Sadowski powiedzial cos oczywistego: na poczatku maly serwer (firma hostingowa), pozniej, przy duzym obciazeniu – zmiana na dedykowane serwery/serwerownie. I tyle. „Oczywista oczywistosc”. A o „wyzszej szkole jazdy” nie pisnal ani slowa, a chetnie bym posluchal, jest wiele metod na zwiekszenie wydajnosci serwisu, zawsze mozna czegos sie dowiedziec/nauczyc. Mam nadzieje ze nastepny odcinek bedzie bardziej „zaawansowany”.

  • http://www.pytamy.pl hazan

    Napisałem jeszcze prośbę o wywiad do fotosika, NK – czekam na obiecany materiał od fotki i wykopu – także jeśli wszystko dobrze pójdzie będzie jeszcze co poczytać.

  • chester

    @Michał Sadowski: hmm kilkanascie-kilkadziesiat tys zl/miech. A czy mozesz powiedziec ile mniej wiecej GB spala serwis miesiecznie?

  • http://www.digerati.pl Michał Sadowski

    @mike – na początku wystarczał nam najtańszy shared hosting. Jednak ten system po pewnym czasie zaczął kuleć (mniej więcej, kiedy ruch przekroczył 500 tys. uu / mies). Wtedy stało się oczywiste, że „studenckimi” sposobami i z serwerami współdzielonymi, daleko nie zajedziemy przy tym ruchu. Ponieważ, Patrz.pl nie przynosiło jeszcze wtedy za dużo kasy (o ile pamiętam byliśmy wtedy w trakcie podpisywana umowy z adnetem, a o google adsense jeszcze wtedy nie słyszeliśmy ; ] ), byliśmy zmuszeni do wzięcia pożyczki, dzięki której przeskoczyliśmy (może bardziej powinienem użyć słowa ‘przewlekliśmy się’, bo kosztowało nas to wiele bezsennych nocy) na serwery dedykowane. Rozumiem, że to trochę ogólniki, ale bardziej szczegółowo nie mogę, tudzież nie wolno mi tego procesu opisywać.

    @chester: niestety tego typu informacje stanowią know-how, którego nikt z branży Ci nie poda (chyba że po paru piwach ;] )

  • http://talen.jogger.pl talen

    to ja w takim razie zrobię kryptoreklamę i zapraszam na swojego bloga do kategorii ‘duże portale’.

  • amator

    sa ludzie ktorzy znaja sie na rzeczy i sa ludzie ktorzy udaja ze sie znaja (i tez udaja, ze ich „biznesy” sa w dobrej formie).

    wnioski wyciagnijcie sami.

  • Lukasz Radziwonowicz

    Gratuluje wywiadu. Temat bardzo ciekawy. Szkoda, że bez żadnych bliższych szczegółów technicznych, chętnie byśmy sie wszyscy podszkolili. Ale rozumiem, że nikt nie chce specjalnie zdradzać swoich przepisów na sukces.

  • chester

    @Michał Sadowski: a ciekawi mnie tez kwestia podejscia do praw autorskich niektorych plikow. Czy mieliscie jakies przejscia np z wytworniami muzycznymi? Ogolnie jaka jest taktyka serwisu odnoscie praw?

  • http://www.pytamy.pl hazan

    @Lukasz – będzie jeszcze ciekawiej ponieważ NK obiecało przesłać swoje 3 grosze.

  • http://www.digerati.pl Michał Sadowski

    @chester: w przeciwieństwie do yt, na patrz.pl moderowane są wszystkie pliki. Po dodaniu plik trafia do poczekalni i może z niej wyjść tylko po obejrzeniu go przez jednego z kilkunastu moderatorów. Do tego dochodzi system zgłaszania nadużyć. Oczywiście nie jest to doskonały system, bo naturalnie większość plików nie ma podpisów w stylu „copywrights 2008 cośtam”, a moderatorzy nie są w stanie stwierdzić pochodzenia niektórych plików. Dlatego większość nadużyć kończy się usunięciem spornego pliku.

    @amator: zgadzam się w 100% ; )

  • Pingback: Blog Divante.pl » Co jest kluczem?