Felietony

Techmeme ma moderatora bo semantyka nadal nie działa

Grzegorz Marczak
Techmeme ma moderatora bo semantyka nadal nie działa
6

Techmeme do niedawna był maszyną automatycznie agregującą treści z internetu i tworzącą listę najciekawszych informacji wraz z informacjami powiązanymi jakie na dany temat ukazały się w internecie. To co chyba na początku wszystkich urzekło w tym serwisie to trafność mechanizmu decydującego o tym cz...

Techmeme do niedawna był maszyną automatycznie agregującą treści z internetu i tworzącą listę najciekawszych informacji wraz z informacjami powiązanymi jakie na dany temat ukazały się w internecie. To co chyba na początku wszystkich urzekło w tym serwisie to trafność mechanizmu decydującego o tym czy informacja jest ciekawe i umiejętność znajdywania przez specjalny algorytm nowych ciekawych źródeł treści.

Era automatycznego techmeme się jednak skończyła, autorzy serwisu na swoim blogu poinformowali, że ich zdaniem automat nie do końca działał poprawnie dlatego też zatrudniają osobę którą będzie się zajmowała przeglądaniem treści oraz kontrolą czy powiązane informacje na pewno tworzą w raz z newsem do którego są przypięte logiczną całość.

Techmeme będzie więc od teraz miksem automatycznego agregatora i treści kontrolowanej przez moderatorów (na razie jest to tylko jedna osoba ale w miarę upływu czasu może ich być więcej)
Kłopoty serwisów które mają łączyć informacje z internetu w spójną całość wynikają między innym z sprawdzania czy też algorytmu sprawdzające czy dwie informacje z dwóch różnych źródeł mają ze sobą coś wspólnego. Okazuje się, że bazowanie na powtarzających się słowach kluczowych nie wystarcza i czasami prowadzi do nielogicznego układu informacji.

Czego więc tak naprawdę brakuje techmeme? Moim zdaniem jest to semantyka czyli umiejętność rozumienia treści. Prawdopodobnie gdyby dało się efektywnie zastosować analizę treści to techmeme by to zrobiło (na tym przecież polega cały pomysł na serwis i biznes). Moim zdaniem i z tego co widzę po różnych rankingach serwisów semantycznych (Zemanta?, Dapper?) na razie semantic web przejawia się tym, że serwisy głośno mówią o hasłach związanych z semantyką (OWL, RDF, XML Scheme itp.) a potem dopiero starają się je wykorzystać.

Ze starań moim zdaniem na razie niewiele wychodzi - testując hakię czy powerset możemy zobaczyć, że wyniki są daleki od doskonałości nie mówić już o rozumieniu zapytań zadawanych pełnym zdaniem (wychodzą wtedy wyniki gorsze niż w google).

Możliwe, że całą semantykę pojmuję za bardzo jednostronnie i skupiam się na jednej z jej fragmentów - natomiast kluczem do rozwoju technologi (jakiejkolwiek) są moim zdaniem efekty które dadzą realne korzyści (pośrednio lub bezpośrednio) klientom/użytkownikom/internautom.

Cały czas mam nadzieję (choć nie dużą), że idea sieci semantycznych kiedyś zostanie wdrożona - na razie jednak hasło to stało się sloganem marketingowym który ma pokazać zrozumienie i zaawansowanie w używaniu nowych technologi.

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu