<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Komentarze do wpisu 'Google przetwarza 20 tyś terabajtów dziennie!'</title>
	<atom:link href="http://antyweb.pl/google-przetwarza-20-tys-terabajtow-dziennie/feed/" rel="self" type="application/rss+xml" />
	<link>http://antyweb.pl/google-przetwarza-20-tys-terabajtow-dziennie/</link>
	<description>Antyweb</description>
	<lastBuildDate>Wed, 10 Mar 2010 01:30:43 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.1</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>By: Google - wspaniały i straszny wielki brat &#8226; Taki sobie ja - taki sobie Blog</title>
		<link>http://antyweb.pl/google-przetwarza-20-tys-terabajtow-dziennie/#comment-43048</link>
		<dc:creator>Google - wspaniały i straszny wielki brat &#8226; Taki sobie ja - taki sobie Blog</dc:creator>
		<pubDate>Fri, 20 Jun 2008 18:42:47 +0000</pubDate>
		<guid isPermaLink="false">http://antyweb.pl/google-przetwaza-20-tys-terabajtow-dziennie/#comment-43048</guid>
		<description>[...] Dość powiedzieć, że dziennie ta najbardziej znana na świecie wyszukiwarka przetwarza ponad 20 tysięcy terabajtów danych [...]</description>
		<content:encoded><![CDATA[<p>[...] Dość powiedzieć, że dziennie ta najbardziej znana na świecie wyszukiwarka przetwarza ponad 20 tysięcy terabajtów danych [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: łukasz bień</title>
		<link>http://antyweb.pl/google-przetwarza-20-tys-terabajtow-dziennie/#comment-33553</link>
		<dc:creator>łukasz bień</dc:creator>
		<pubDate>Sun, 13 Jan 2008 19:30:24 +0000</pubDate>
		<guid isPermaLink="false">http://antyweb.pl/google-przetwaza-20-tys-terabajtow-dziennie/#comment-33553</guid>
		<description>Rafale, wszystko zależy od skali projektu i potrzeb, jeśli cytujemy tu schmidt&#039;a w sprawie Gmaila, czy tym podobnej usługi to się zgodzę, można to nawet przenieść na nasz rynek na przykładzie NK, sytuacja jest podobna, niewiele ludzi może sobie pozwolić na startup&#039;a z zapleczem w postaci 60-100 serwerów.

Ale dalej przystaje przy swoim (nie przekonałeś mnie, ani ten artykuł), że to serwery są podstawową barierą, bo z informacji wynikających z tych artykułów bije jeden wniosek – nie masz oprogramowania do wykonywania operacji MapReduce – na nic się nie zda posiadanie całej serwerowni, to proste. Gdyby Yahoo i Google nie stworzyli open source&#039;owego hadoop&#039;a to nie byłoby takich projektów jak Amazon S3 czy Google 101.

W realiach biznesowych, po prostu starają się być o krok przed innymi, ten projekt jest bardzo nowatorski, zapewne dopiero co powstają jakieś otwarte narzędzia do pracy na takich klastrach ale jest to przyszłość, krok, który można porównać do algorytmu PR&#039;a. To o nich będzie się mówiło, że udostępnili klastry dla śmiertelników nie o MS&#039;ie.

Może za niedługo powstanie połączenie dwóch typów projektów jak Seti i Amazon S3, gdzie każdy będzie mógł dołączyć swój sprzęt do klastra i zarobić parę groszy, udostępniając swój sprzęt m.in. dla komercyjnych zadań :).</description>
		<content:encoded><![CDATA[<p>Rafale, wszystko zależy od skali projektu i potrzeb, jeśli cytujemy tu schmidt&#8217;a w sprawie Gmaila, czy tym podobnej usługi to się zgodzę, można to nawet przenieść na nasz rynek na przykładzie NK, sytuacja jest podobna, niewiele ludzi może sobie pozwolić na startup&#8217;a z zapleczem w postaci 60-100 serwerów.</p>
<p>Ale dalej przystaje przy swoim (nie przekonałeś mnie, ani ten artykuł), że to serwery są podstawową barierą, bo z informacji wynikających z tych artykułów bije jeden wniosek – nie masz oprogramowania do wykonywania operacji MapReduce – na nic się nie zda posiadanie całej serwerowni, to proste. Gdyby Yahoo i Google nie stworzyli open source&#8217;owego hadoop&#8217;a to nie byłoby takich projektów jak Amazon S3 czy Google 101.</p>
<p>W realiach biznesowych, po prostu starają się być o krok przed innymi, ten projekt jest bardzo nowatorski, zapewne dopiero co powstają jakieś otwarte narzędzia do pracy na takich klastrach ale jest to przyszłość, krok, który można porównać do algorytmu PR&#8217;a. To o nich będzie się mówiło, że udostępnili klastry dla śmiertelników nie o MS&#8217;ie.</p>
<p>Może za niedługo powstanie połączenie dwóch typów projektów jak Seti i Amazon S3, gdzie każdy będzie mógł dołączyć swój sprzęt do klastra i zarobić parę groszy, udostępniając swój sprzęt m.in. dla komercyjnych zadań :).</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: ms</title>
		<link>http://antyweb.pl/google-przetwarza-20-tys-terabajtow-dziennie/#comment-33543</link>
		<dc:creator>ms</dc:creator>
		<pubDate>Sat, 12 Jan 2008 19:56:32 +0000</pubDate>
		<guid isPermaLink="false">http://antyweb.pl/google-przetwaza-20-tys-terabajtow-dziennie/#comment-33543</guid>
		<description>&quot;kupić sprzęt dla MS’a to żaden problem&quot;

ale to będzie inny sprzęt. G sam sobie buduje komputery z podzespolow, moze nawet i sam robi osprzet sieciowy?</description>
		<content:encoded><![CDATA[<p>&#8220;kupić sprzęt dla MS’a to żaden problem&#8221;</p>
<p>ale to będzie inny sprzęt. G sam sobie buduje komputery z podzespolow, moze nawet i sam robi osprzet sieciowy?</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: ragni</title>
		<link>http://antyweb.pl/google-przetwarza-20-tys-terabajtow-dziennie/#comment-33501</link>
		<dc:creator>ragni</dc:creator>
		<pubDate>Fri, 11 Jan 2008 11:17:53 +0000</pubDate>
		<guid isPermaLink="false">http://antyweb.pl/google-przetwaza-20-tys-terabajtow-dziennie/#comment-33501</guid>
		<description>ilosc serwerow googla i rozwiazania softwarowe to JEST przewaga googla. schmidt traktuje swoje centra danych jako duza bariere wejscia na rynek. oprocz nich tylko 4 firmy na swiecie sa w stanie nawiazac konkurencje: ibm, yahoo, microsoft i amazon. chocby podwyzszenie pojemnosci gmaila do 6gb po czesci jest uwarunkowane podniesieniem poprzeczki dla konkurencji. jesli na swiecie jest tylko 5 osrodkow o takiej skali i takim potencjale to oddalanie sie od pozostalych jest dla googla po prostu budowaniem przewagi konkurencyjnej. to biznesowy elementarz.

polecam ten tekst: http://www.businessweek.com/magazine/content/07_52/b4064048925836.htm oraz wywiad ze schmidtem: http://www.businessweek.com/magazine/content/07_52/b4064052938160.htm</description>
		<content:encoded><![CDATA[<p>ilosc serwerow googla i rozwiazania softwarowe to JEST przewaga googla. schmidt traktuje swoje centra danych jako duza bariere wejscia na rynek. oprocz nich tylko 4 firmy na swiecie sa w stanie nawiazac konkurencje: ibm, yahoo, microsoft i amazon. chocby podwyzszenie pojemnosci gmaila do 6gb po czesci jest uwarunkowane podniesieniem poprzeczki dla konkurencji. jesli na swiecie jest tylko 5 osrodkow o takiej skali i takim potencjale to oddalanie sie od pozostalych jest dla googla po prostu budowaniem przewagi konkurencyjnej. to biznesowy elementarz.</p>
<p>polecam ten tekst: <a href="http://www.businessweek.com/magazine/content/07_52/b4064048925836.htm" rel="nofollow">http://www.businessweek.com/magazine/content/07_52/b4064048925836.htm</a> oraz wywiad ze schmidtem: <a href="http://www.businessweek.com/magazine/content/07_52/b4064052938160.htm" rel="nofollow">http://www.businessweek.com/magazine/content/07_52/b4064052938160.htm</a></p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Google przetwarza 20 tyś terabajtów dziennie! &#171; b.YISK blog</title>
		<link>http://antyweb.pl/google-przetwarza-20-tys-terabajtow-dziennie/#comment-33480</link>
		<dc:creator>Google przetwarza 20 tyś terabajtów dziennie! &#171; b.YISK blog</dc:creator>
		<pubDate>Thu, 10 Jan 2008 20:58:28 +0000</pubDate>
		<guid isPermaLink="false">http://antyweb.pl/google-przetwaza-20-tys-terabajtow-dziennie/#comment-33480</guid>
		<description>[...] Czytaj dalej&#8230; [...]</description>
		<content:encoded><![CDATA[<p>[...] Czytaj dalej&#8230; [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: zacheusz</title>
		<link>http://antyweb.pl/google-przetwarza-20-tys-terabajtow-dziennie/#comment-33476</link>
		<dc:creator>zacheusz</dc:creator>
		<pubDate>Thu, 10 Jan 2008 18:01:05 +0000</pubDate>
		<guid isPermaLink="false">http://antyweb.pl/google-przetwaza-20-tys-terabajtow-dziennie/#comment-33476</guid>
		<description>trochę dziwne wydaje mi się tłumaczenie (a właściwie jego brak) słowa &quot;job&quot;
wydaje mi się, że można to przetłumaczyć jako &#039;zadanie&#039;
BTW nie ma co kalkulować mocy obliczeniowej klastra poprzez ilość komputerów
chyba, że się zaznaczy czy to są PC, jakieś p-series czy też mainframe</description>
		<content:encoded><![CDATA[<p>trochę dziwne wydaje mi się tłumaczenie (a właściwie jego brak) słowa &#8220;job&#8221;<br />
wydaje mi się, że można to przetłumaczyć jako &#8216;zadanie&#8217;<br />
BTW nie ma co kalkulować mocy obliczeniowej klastra poprzez ilość komputerów<br />
chyba, że się zaznaczy czy to są PC, jakieś p-series czy też mainframe</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: dc1</title>
		<link>http://antyweb.pl/google-przetwarza-20-tys-terabajtow-dziennie/#comment-33475</link>
		<dc:creator>dc1</dc:creator>
		<pubDate>Thu, 10 Jan 2008 17:55:58 +0000</pubDate>
		<guid isPermaLink="false">http://antyweb.pl/google-przetwaza-20-tys-terabajtow-dziennie/#comment-33475</guid>
		<description>hmm to niezbyt wiele jak na 2008 rok... ;)</description>
		<content:encoded><![CDATA[<p>hmm to niezbyt wiele jak na 2008 rok&#8230; ;)</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: łukasz bień</title>
		<link>http://antyweb.pl/google-przetwarza-20-tys-terabajtow-dziennie/#comment-33469</link>
		<dc:creator>łukasz bień</dc:creator>
		<pubDate>Thu, 10 Jan 2008 12:17:57 +0000</pubDate>
		<guid isPermaLink="false">http://antyweb.pl/google-przetwaza-20-tys-terabajtow-dziennie/#comment-33469</guid>
		<description>Wystarczy klaster starych komputerów + algorytmy do przetwarzania stron i nie martwiłbym się o pieniądze na budowę wyszukiwarki. Zresztą tak na prawdę wystarczą same sprawdzone algorytmy, dużo firm jest wiele w stanie zapłacić (nawet sama UE pewnie by dofinansowała taki projekt) za możliwość realnego konkurowania z Google.

Widać naocznie, że przejście z comiesięcznych googledance&#039;ów na przetwarzanie na żywo w 2006 roku znacznie powiększyło ilość wykonywanych operacji MapReduce (a co za tym idzie ilość przetwarzanych danych), do tego dochodzi jeszcze domniemany problem z INT (bodajże), który ich ograniczał (do 4mld stron w indexie) i w 2005 roku (o ile mnie pamięć nie myli), sobie z tym poradzono.

Pamiętam to jak dziś, wolna amerykanka wtedy była w indexie, nikt się nie przejmował, przez około pół roku ludzie spamowali ile się dało, aż w desperacji Google wycięło linki, które wyglądały jak te z popularnych systemów blogowych.

Co do Twoich wniosków hazan&#039;ie, nie zgodzę się, że zaplecze techniczne Google to jego przewaga, kupić sprzęt dla MS&#039;a to żaden problem, tu chodzi o realne potrzeby wykorzystania tego sprzętu, a takich nie ma MS ani tym bardziej Yahoo (które działa bardziej lokalnie, coś jak nasz Onet).

Tak na marginesie można dodać, że ilość maszyn jakie utrzymuje Google szacowano w 2007r. na 400+ tys.</description>
		<content:encoded><![CDATA[<p>Wystarczy klaster starych komputerów + algorytmy do przetwarzania stron i nie martwiłbym się o pieniądze na budowę wyszukiwarki. Zresztą tak na prawdę wystarczą same sprawdzone algorytmy, dużo firm jest wiele w stanie zapłacić (nawet sama UE pewnie by dofinansowała taki projekt) za możliwość realnego konkurowania z Google.</p>
<p>Widać naocznie, że przejście z comiesięcznych googledance&#8217;ów na przetwarzanie na żywo w 2006 roku znacznie powiększyło ilość wykonywanych operacji MapReduce (a co za tym idzie ilość przetwarzanych danych), do tego dochodzi jeszcze domniemany problem z INT (bodajże), który ich ograniczał (do 4mld stron w indexie) i w 2005 roku (o ile mnie pamięć nie myli), sobie z tym poradzono.</p>
<p>Pamiętam to jak dziś, wolna amerykanka wtedy była w indexie, nikt się nie przejmował, przez około pół roku ludzie spamowali ile się dało, aż w desperacji Google wycięło linki, które wyglądały jak te z popularnych systemów blogowych.</p>
<p>Co do Twoich wniosków hazan&#8217;ie, nie zgodzę się, że zaplecze techniczne Google to jego przewaga, kupić sprzęt dla MS&#8217;a to żaden problem, tu chodzi o realne potrzeby wykorzystania tego sprzętu, a takich nie ma MS ani tym bardziej Yahoo (które działa bardziej lokalnie, coś jak nasz Onet).</p>
<p>Tak na marginesie można dodać, że ilość maszyn jakie utrzymuje Google szacowano w 2007r. na 400+ tys.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Bartosz KITA</title>
		<link>http://antyweb.pl/google-przetwarza-20-tys-terabajtow-dziennie/#comment-33462</link>
		<dc:creator>Bartosz KITA</dc:creator>
		<pubDate>Thu, 10 Jan 2008 08:46:11 +0000</pubDate>
		<guid isPermaLink="false">http://antyweb.pl/google-przetwaza-20-tys-terabajtow-dziennie/#comment-33462</guid>
		<description>Witam,
Za naszgo żywota raczej nie będzie konkurencji dla Googla.
Myślę, że sytuacja będzie odwrotna, to wielkie G będzie stanowiło konurencję dla dotychczasowych liderów różnego oprogramowania. Przykładem jest google apps, o którym dyskutowaliśmy ostatnio (Gmail w Gazeta.pl). 

Pozdrawiam,
Bartosz KITA.</description>
		<content:encoded><![CDATA[<p>Witam,<br />
Za naszgo żywota raczej nie będzie konkurencji dla Googla.<br />
Myślę, że sytuacja będzie odwrotna, to wielkie G będzie stanowiło konurencję dla dotychczasowych liderów różnego oprogramowania. Przykładem jest google apps, o którym dyskutowaliśmy ostatnio (Gmail w Gazeta.pl). </p>
<p>Pozdrawiam,<br />
Bartosz KITA.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Michał Sadowski</title>
		<link>http://antyweb.pl/google-przetwarza-20-tys-terabajtow-dziennie/#comment-33459</link>
		<dc:creator>Michał Sadowski</dc:creator>
		<pubDate>Thu, 10 Jan 2008 07:08:15 +0000</pubDate>
		<guid isPermaLink="false">http://antyweb.pl/google-przetwaza-20-tys-terabajtow-dziennie/#comment-33459</guid>
		<description>Google jak google, ale podobno to Youtube generuje 75% całego ruchu w sieci ;]</description>
		<content:encoded><![CDATA[<p>Google jak google, ale podobno to Youtube generuje 75% całego ruchu w sieci ;]</p>
]]></content:encoded>
	</item>
</channel>
</rss>
