Jednym z moich ulubionych agregatorów newsów IT poza Techmeme.com była Techfuga.com, niestety autorzy z nieznanych powodów zdecydowali się zamknąć serwis obiecują, że powrócą za parę miesięcy. W międzyczasie na którymś z zagranicznych blogów przeczytałem news o nowych agregatorze newsów IT Techinvestornews.com (domena jest fatalna)

Moim zdaniem jest to agregator dla zdesperowanych ilość newsów jakie podaje na stronie głównej jest lekko przytłaczająca. Warto natomiast zwrócić uwagę na kolumnę Top Tech Headlines, która jest jednocześnie osobną podstroną tego serwisu. Jak podają autorzy, w Techinvestornews jest wbudowany jakiś algorytm, który wybiera najciekawsze informacje z dobrych źródeł. Czy tak jest w rzeczywistości trudno mi w tej chwili osądzić.



To czego zazdroszczę angielskojęzycznym serwisom tego typu to możliwość zbudowania jakiegoś algorytmu wybierające „Top News”. Tworząc Techall.pl, na początku również myślałem o jakimś mechanizmie wybierającym pół automatycznie ciekawe informacje. Niestety nie udało mi się wymyślić żadnej skutecznej reguły. Newsy technologiczne w PL są często przepisywane między serwisami (na bazie umów itp), serwisy IT rzadko lub w ogóle nie linkują do siebie, 50% informacji w ciągu dnia potrafi się powtarzać w różnych źródłach, mikro blogi, blogi, blipy i flakery nie dają również podstaw do wnioskowania o popularności danej treści, API które mogło by pomóc nie istnieje (niektórzy nie mają nawet sprawnie działających RSS-ów) – generalnie klapa.

Oczywiście można by wymyślić jakiś bardziej zaawansowany mechanizm wnioskujący – ale szczerze wątpię w jego skuteczność ponieważ moim zdaniem nie ma wystarczającej ilości danych wejściowych. Jeśli ktoś z was miałby jednak pomysł na prostą mechanikę wybierającą dobre informacje to poproszę o maila lub komentarz – chętnie spróbuje wesprzeć Techall jakimiś sugestiami dla osób rekomendujących.

Spodobał Ci się tekst? Poleć znajomym:

iStore

iStore

  • http://jacek50.blox.pl one.jack

    Rzeczywiście, na pierwszej stronie multum newsów, do tego pod każdym panelem „next…”.
    Aha, popraw link do serwisu, bo „,” się przypętał.

  • Zbigniew

    TechAll: Osobiście preferuję wyszukiwanie po tematach. Istniejące tam tagi tematyczne są OK, ale może bardziej je rozbudować, czyli -seria tagów typowych + mocna wyszukiwarka po słowach, frazach itp.
    Zatem tematycznie – w pierwszej kolejności, a źródła można uhonorować ich ikonkami przy każdej wiadomości.

  • mantrid

    można użyć algorytmów znanych z filtrów antyspamowych (http://en.wikipedia.org/wiki/Bayesian_spam_filtering). filtry takie trzymają w bazie częstości występowania pewnych słów w spamie i jeśli badany tekst jest podobny (pod względem rozkładu tych częstości) do szablonu, filtr uznaje tekst za spam i go odrzuca. można zrobić na odwrót – jako szablony wybrać próbkę interesujących tekstów, a następnie punktować najbardziej te teksty, które najbardziej pasują do „wzorca”.

    nie mam pojęcia jak to będzie działać w praktyce. na pewno różne serwisy z tym już eksperymentowały – myślę że ktoś już na to wpadł, i to wiele razy…

  • http://atominium.com Atomek

    A przede wszystkim zawartość ta powtarza się na wykopie ;).
    Moim zdaniem porządna baza tagów powinna pomóc wyszukiwać tego czego dokładnie szukamy

  • qu35t

    a moze by tak po ilosci klikniec w dany news?
    tylko wtedy bedzie raczej popularnosc, a nie „Top News”, a popularnosc ta chyba by wtedy zalezala od tego w jakim czasie sie pojawil news, np. jesli wiekszosc ludzi przeglada newsy rano to tez dodane kolo poludnia moga byc „zakopane” i nie wiele osob je przeczyta, przez co praktycznie traca szanse na Top News

  • piszczyk^3

    Na początek oprzyj się o to:
    http://www.google.com/insights/search/

  • http://antyweb.pl Grzegorz Marczak

    @piszczyk^3


    no ale na co mi się to ma przydać – wyszukiwanie nie jest problemem – tylko wywnioskowanie która treść z polskich serwisów jest ciekawa

  • piszczyk^3
  • piszczyk^3

    Zresztą wskocz na http://www.google.com/trends
    Może da się wyciągnąć z tego jakieś trendy?

  • x

    na którymś z zagranicznych blogów


    Jest taki zagraniczny blog do którego Antyweb w 90% pasuje
    tak w zakresie zagranicznych źródeł jak i konstrukcji samego bloga.