• Techmeme ma moderatora bo semantyka nadal nie działa

    • Data: 04.12.2008 11:58
    • 2,572 odsłon
    • Grzegorz Marczak
    • Komentarzy: 6 »

    Techmeme do niedawna był maszyną automatycznie agregującą treści z internetu i tworzącą listę najciekawszych informacji wraz z informacjami powiązanymi jakie na dany temat ukazały się w internecie. To co chyba na początku wszystkich urzekło w tym serwisie to trafność mechanizmu decydującego o tym czy informacja jest ciekawe i umiejętność znajdywania przez specjalny algorytm nowych ciekawych źródeł treści.

    Era automatycznego techmeme się jednak skończyła, autorzy serwisu na swoim blogu poinformowali, że ich zdaniem automat nie do końca działał poprawnie dlatego też zatrudniają osobę którą będzie się zajmowała przeglądaniem treści oraz kontrolą czy powiązane informacje na pewno tworzą w raz z newsem do którego są przypięte logiczną całość.

    Techmeme będzie więc od teraz miksem automatycznego agregatora i treści kontrolowanej przez moderatorów (na razie jest to tylko jedna osoba ale w miarę upływu czasu może ich być więcej)
    Kłopoty serwisów które mają łączyć informacje z internetu w spójną całość wynikają między innym z sprawdzania czy też algorytmu sprawdzające czy dwie informacje z dwóch różnych źródeł mają ze sobą coś wspólnego. Okazuje się, że bazowanie na powtarzających się słowach kluczowych nie wystarcza i czasami prowadzi do nielogicznego układu informacji.

    Czego więc tak naprawdę brakuje techmeme? Moim zdaniem jest to semantyka czyli umiejętność rozumienia treści. Prawdopodobnie gdyby dało się efektywnie zastosować analizę treści to techmeme by to zrobiło (na tym przecież polega cały pomysł na serwis i biznes). Moim zdaniem i z tego co widzę po różnych rankingach serwisów semantycznych (Zemanta?, Dapper?) na razie semantic web przejawia się tym, że serwisy głośno mówią o hasłach związanych z semantyką (OWL, RDF, XML Scheme itp.) a potem dopiero starają się je wykorzystać.

    Ze starań moim zdaniem na razie niewiele wychodzi – testując hakię czy powerset możemy zobaczyć, że wyniki są daleki od doskonałości nie mówić już o rozumieniu zapytań zadawanych pełnym zdaniem (wychodzą wtedy wyniki gorsze niż w google).

    Możliwe, że całą semantykę pojmuję za bardzo jednostronnie i skupiam się na jednej z jej fragmentów – natomiast kluczem do rozwoju technologi (jakiejkolwiek) są moim zdaniem efekty które dadzą realne korzyści (pośrednio lub bezpośrednio) klientom/użytkownikom/internautom.

    Cały czas mam nadzieję (choć nie dużą), że idea sieci semantycznych kiedyś zostanie wdrożona – na razie jednak hasło to stało się sloganem marketingowym który ma pokazać zrozumienie i zaawansowanie w używaniu nowych technologi.

    KOMENTARZE

    1. Vogel

      o boze. ale przeciez serwis jako AGREGAT danych czerpie informacje z roznych zrodel, w tym – z przewazajacej zapewne czesci – ze źródeł, które takowej semantyki nie wdrożyły i nie wdrożą. Gdyby Ty czytasz polski tekst, ale pozbawiony powiązań między elementami języka (np. nieuporządkowane notatki), to też będziesz miał problemy ze zrozumieniem treści. tak więc twierdzę, że mocno spłycasz ten temat. Semantyka i ontologia w informacji w sieci to naprawdę ciekawe zagadnienie i kompletnie nie sprowadza się do formatu zapisu danych (i HTML może być semantczny) tylko sposobu w jaki się to robi.

    2. chlitto

      “Ze starań moim zdaniem na razie niewiele wychodzi – testując hakię czy powerset możemy zobaczyć, że wyniki są daleki od doskonałości nie mówić już o rozumieniu zapytań zadawanych pełnym zdaniem (wychodzą wtedy wyniki gorsze niż w google).”

      na moje pytania do sematycznych wyszukiwarek ZAWSZE najlepiej odpowiada trueknowledge, a wszyscy sie jakos dizwie wlasnie tymi dwoma interesuja:)

      “Moim zdaniem jest to semantyka czyli umiejętność rozumienia treści.” – czy sematyka nie polegala na tagowaniu etc swoich tresci czyli zeby wyszukiwarka dzialala poprawnie to strony ktore agreguje musialyby byc odpowiednio przygotowane przez autorow? (np redaktorow techcrunch) – tu z gory mowie ze sie nie orientuje ale zawsze mi sie tak wydawalo

      btw jezeli nie mieli nigdy moderacji to podziwiam ich idealy ale bylo to glupia decyzja – moderacja chociazby polegajaca na podaniu do mechanizmu tagu ‘top story of the day’ na ktorym ma sie skoncentrowac i podanie najlepszego artykulu ktory ma ten news reprezentowac byc powinna…

    3. Grzegorz Marczak

      @chlitto – z tego co ja rozumiem (ale też mogę się mylić) to właśnie odpowiednie opisanie różnymi znacznikami treści ma później ułatwić jej “rozumienie”

    4. pankracy

      Trzy kwestie mi się nasuwają :
      1) Twórca informacji tak ją znacznikuje aby na niej zarobić tzn. aby google uznał ją za marketingowo wartościową.
      2) Po co twórca informacji ma ją sporym nakładem “semantycznie” znacznikować aby później działające na pograniczu piractwa serwisy agregujące mogły ją sobie przywłaszczyć, przy okazji wtórnie znacznikując patrz 1)
      3) Aby znacznikowanie miało większy sens potrzebne są realne standardy opisujące nie syntaktykę znacznikowania (która jest pomocna jedynie w implementacji algorytmów przeszukujących znaczniki) ale wartości tych znaczników słowem olbrzmi wielojęzyczny słownik. W tej materii ludzie głowią się od wieków a era internetu w kórej generowane jest morze bezwartościowej i wtórnej informacji tylko ten problem zaostrza.

    5. mfab

      http://www.zapytanko.pl/ tez ma moderatora, bo inaczej by nie dzialalo :)

    6. antyweb.pl: AntyWeb | » Techmeme ma moderatora bo semantyka nadal nie | flaker.pl

      [...] antyweb.pl 00:44 03/02/2009 AntyWeb | » Techmeme ma moderatora bo semantyka nadal nie działa antyweb.pl/…oderatora-bo-semantyka-na… Pokaż reakcje /* */ inne strony z tej witryny + obserwuj co [...]

    Odpowiedz

    Connect with Facebook