Mistrovství vyhledávání

18.09.2011 13:13

Podle informací uveřejněných firmou Google při jejím vstupu na burzu v dubnu 2004 se současný obsah serverové farmy odhaduje na:[zdroj?]

  • 719 racků
  • 63 272 počítačů
  • 126 544 procesorů
  • 253 088 GHz výpočetního výkonu
  • 126 544 GB operační paměti
  • 5062 TB kapacity pevných disků

Podle tohoto odhadu by serverová farma Googlu tvořila nejvýkonnější superpočítač na světě.

  • Google funguje ve 112 jazycích, indexuje desítky miliard stránek a denně zpracuje stovky milionů dotazů (tj. tisíce dotazů za vteřinu).
  • Tým kvality vyhledávání provede téměř denně nějakou změnu ovlivňující chování vyhledavače.
  • Nedávno se zlepšila schopnost vyhledavače pochopit, co uživatel hledá krátkými a víceznačnými dotazy. Ví nápříklad, že dotazem “apples” lidé hledají ovoce, kdežto dotazem “Apple” počítače nebo iPody.
  • Asi stokrát denně některý z deseti tisíc zaměstnanců Googlu nahlásí prostřednictvím interního systému Buganizer nějaký problém ve vyhledávání.
  • Některé problémy se řeší okamžitě, např. když nedávno v důsledku presidentských voleb ve francii začal Google vracet nepříliš relevantní výsledky na dotaz “french revolution”.
  • Každý dotaz dostane QDF (query deserves freshness) skóre určující poměr nových (nebo čerstvě aktualizovaných) a již dlouho etablovaných stránek ve výsledcích hledání. QDF skóre vychází z obsahu blogů aj. aktuálních stránek (o čem se právě píše) a z analýzy vyhledávacích trendů (co se právě hledá).
  • Řazení odkazů ve výsledcích vyhledávání ovlivňuje přes 200 kritérií, kterým v Googlu říkají signály (signals). Slavný PageRank je jen jedním z těchto signálů.
  • Některé signály jsou na samotných stránkách (slova, odkazy apod.), některé pocházejí z historie změn stránek v čase a některé se čerpají ze vzorců ukrytých v trilionech hledání, která Google za ty roky zpracoval.
  • Roste podíl signálů spojených s personalizací a historií hledání jednotlivých uživatelů. To se ovšem vztahuje jen na přihlášené uživatele.
  • Jednotlivé dotazy jsou označeny klasifikátory, které pomáhají určit, co uživatel hledá — např. produkt ke koupi, informace o místě nebo osobu. Nedávno Google vyvinul nový klasifikátor identifikující jména lidí, kteří nejsou slavní. Jiný klasifikátor identifikuje známé značky.
  • Signály a klasifikátory slouží pro výpočet klíčových kritérií relevance stránek. Jedním z kritérií je tematičnost (topicality), která měří vztah stránky k obecnější kategorii dotazu. Jedna stránka se může s různou mírou týkat více tematických kategorií.
  • První desítka výsledků vyhledávání je namíchána tak, aby diversita odkazů odpovídala víceznačnosti dotazu. Stránky s nejvyšším skóre relevance ji tedy obsadí jen tehdy, je-li dotaz dostatečně jednoznačný.

 

http://tech.ihned.cz/google/c1-52794620-google-pro-sve-servery-potrebuje-tolik-energie-jako-cela-plzen

Jaderná elektrárna Temelín, 2011, letecký záběr

 
A Google a day
 
 
našeptávač
varianty (při chybném zadání)
 
 

Co umí google

Pokročilé vyhledávání

http://myheaven.cz/pocitace-a-technika/tipy-a-triky-pro-vyhledavani-na-internetu/

http://cs.wikipedia.org/wiki/Google

http://google-cz.blogspot.com/2007/08/objevte-dal-funkce-vyhledvn-googlecz.html

Kalkulačku, měny i převod jednotek umí i seznam.cz

Seznam

9979+27589+13590

1 euro in koruna

60 miles in km

define:smetana

Google česky filetype:pdf

  •     Vyhledávač nedělá rozdíl mezi malými a VELKÝMI písmeny, takže můžete psát text bez ohledu na ně.
  •     Buďte co nejkonkrétnější. Když hledáte zboží, zadejte jeho celý název – ideálně značku i model (př. Nokia 6300), nikoliv jen obecný název (př. mobil nebo nokia).
  •     Uvádějte pouze ty výrazy, které považujete za nejdůležitější. Hledáte třeba byt v Praze na Vinohradech? Pak zadejte např: byt prodej vinohrady.
  •     Nikdy nezadávejte do vyhledávače frázi obsahující pomlčku – a to ani, když je to přesný název výrobku. Vyhledávač totiž pomlčku vnímá jako znaménko mínus, které mu říká, aby následující slovo z hledání vynechal (viz níže).

 

 

Tipy a triky pro vyhledávání na internetu

http://myheaven.cz/pocitace-a-technika/tipy-a-triky-pro-vyhledavani-na-internetu/

Uvozovky

Jako první příklad řekněme, že chci vyhledat text známé písně „Skákal pes“, ale pamatuji si z ní jen frázi „péro na klobouku“. Pokud tedy zadám do vyhledávače dotaz [ péro na klobouku ], na prvních místech se mi zobrazí stránky o hudební kapele Péro za kloboukem, což není zrovna to, co bychom potřebovali. Zkusíme tedy zadat dotaz do uvozovek [ "péro na klobouku" ] – tím vyhledávači sdělíme, že chceme vyhledávat pouze a jen tuto přesnou frázi. V tomto případě nám přidání uvozovek pomůže najít přesně to, co hledáme.

Operátor +

V některých případech si můžeme všimnout, že vyhledávač automaticky skloňuje některá slova, nebo bere v úvahu i jejich synonyma a toto se pak promítne do výsledků vyhledávání. Pokud tomuto chceme předejít, můžeme před určité slovo přidat znak „+“ a vyhledávač bude tento výraz vyhledávat v takovém tvaru, jak jsme jej zadali. Například na dotaz [ historie čr ] nám vyhledávač mimo jiné najde i stránky obsahující nezkrácený výraz „Historie České republiky“. Pokud ale zadáme dotaz následovně [ historie +čr ], pak se nám ve výsledcích objeví jen zkrácená varianta, tak jak jsme ji zadali.

Operátor -

Pokud potřebujeme, aby vyhledávač naopak některá slova ve výsledcích vynechával, pak k tomuto účelu použijeme znak „-“. Například hledám informace o čokoládě, ale nezajímá mě bílá čokoláda. Zadám tedy dotaz [ čokoláda -bílá ] a vyhledávač ve výsledcích vynechá všechny stránky o čokoládě, na kterých se nachází slovo „bílá“.
Doplnění chybějících slov
Mezi další zajímavé funkce patří možnost nechat si automaticky doplnit dotaz o chybějící slova, k čemuž použijeme hvězdičku. Konkrétní dotaz může vypadat třeba následovně [ v roce * nastane konec světa ].

Operátor OR

Další z možných operátorů popíšu v následujícím příkladu. Řekněme, že chceme vyhledat auto roku 2009 a zároveň i 2010. Pokud zadáme dotaz klasicky následujícím způsobem [ auto roku 2009 2010 ], pak nám vyhledávač zobrazí stránky, na kterých se vyskytuje zmínka o obou rocích zároveň. V tomto případě je ale mnohem užitečnější použít [ auto roku 2009 OR 2010 ], kde nám vyhledávač zobrazí různé stránky, které popisují buď auto roku 2009 nebo auto roku 2010. Poznámka na závěr: Operátor OR je nutné zadávat velkými písmeny, jinak nám tato funkce nebude fungovat.

Pokročilé operátory Google

Hledání na určité doméně (site:)
Pokud nechceme prohledávát celý internet, ale jen určitý web, pak se nám bude hodit právě tento operátor. Například dotaz [ film site:myheaven.cz ] nám vyhledá všechny stránky obsahující slovo „film“, nacházející se na webu myheaven.cz.

Vyhledání podobných stránek (related:)
Operátor „related:“ vyhledá podobné nebo související stránky k zadané adrese. Použití je následující [ related:myheaven.cz ] – za myheaven.cz samozřejmě můžete dosadit libovolnou adresu URL.

Vyhledávání v url adrese stránky (inurl: / allinurl:)
Pomocí této funkce můžeme vyhledat jednotlivé URL adresy stránek, které obsahují určitá slova. Příklad: [ inurl:obchod ] – tento dotaz vyhledá všechny stránky, kde se v URL adrese nachází slovo „obchod“. Pokud potřebujeme zadat více slov najednou, pak zadáme dotaz v následující podobě [ allinurl:obchod elektronika pocitace ].

Vyhledávání v titulku stránky (intitle: / allintitle:)
Tento operátor funguje stejně jako „inurl:“ s tím rozdílem, že vyhledává zadané výrazy v titulku stránky. Můžeme tedy použít dotaz [ intitle:obchod ], nebo pro více slov [ allintitle:obchod elektronika počítače ].

Vyhledávání v textových souborech (filetype: / ext:)
Google kromě webových stránek indexuje i různé textové soubory, jako například dokumenty PDF nebo DOC. Pokud potřebujeme najít dokument určitého formátu, který obsahuje zadaná slova, může dotaz vypadat třeba následovně [ notebooky filetype:pdf ] – v tomto případě ve výsledcích najdeme všechny dokumenty ve formátu pdf v databázi Googlu, které pojednávají o noteboocích. Můžeme použít i zkrácenou verzi – operátor „ext:“, který funguje stejně jako „filetype:“.

Odkazy na danou stránku (link:)

 

iGoogle

Tak jako například Seznam.cz a další vyhledávače nabízí možnost předělat si hlavní stranu podle svého, iGoogle nabízí mnohem větší tvůrčí možnosti. Google už nemusí být jen bílá plocha s vyhledávačem uprostřed. Nyní si můžete vytvořit dokonce několik stránek, s vzhledem i funkcemi přesně podle vás. Nahoře poté jen záložkami mezi těmito stránkami přepínáte. Po přihlášení se váš vyhledávač zobrazí kdekoliv na světě a můžete jej hned využívat.

http://www.google.com/ig

 

Insightshistorie vyhledávání

http://www.google.com/insights/search/

Google fight

GoogleFight

http://www.googlefight.com/

Googlism

http://www.googlism.com/

What are your Googlisms?

 

  • Kdo je…
  • Co je…
  • Kde je…
  • Kdy je…

 

Hledání obrázků

vyhledávání výskytu obrázku:

http://www.maxiorel.cz/tineye-netradicni-vyhledavac-obrazku

http://www.tineye.com/

http://mufin.fi.muni.cz/imgsearch/

 

MUFIN
český vyhledavač

 

Multi-feature Indexing Network

Podobné obrázky

http://tech.ihned.cz/google/c1-52311450-internetove-vyhledavace-meni-lidsky-mozek-pamatujeme-si-mene-veci

 

Google body

http://bodybrowser.googlelabs.com/

 

 

Evolution of web broswsers

http://evolutionofweb.appspot.com/

Zpět