Čo je to

DuckDuckGo je pomerne známy open source vyhľadávač. zdrojový kód. Servery sa nachádzajú v USA. Vyhľadávač okrem vlastného robota využíva výsledky iných zdrojov: Yahoo, Bing, Wikipedia.

Lepšie

DuckDuckGo sa stavia ako dokonalé vyhľadávanie súkromia a súkromia. Systém nezhromažďuje žiadne údaje o používateľovi, neukladá protokoly (žiadna história vyhľadávania), používanie cookies maximálne obmedzené.

DuckDuckGo nezhromažďuje ani nezdieľa osobné informácie od používateľov. Toto sú naše zásady ochrany osobných údajov.

Gabriel Weinberg, zakladateľ DuckDuckGo

Prečo to potrebujete?

Všetky veľké vyhľadávače sa snažia personalizovať výsledky vyhľadávania na základe údajov o osobe pred monitorom. Tento jav sa nazýva „filtračná bublina“: používateľ vidí len tie výsledky, ktoré sú v súlade s jeho preferenciami alebo ktoré systém za také považuje.

Vytvára objektívny obraz, ktorý nezávisí od vášho minulého správania na webe, a eliminuje tematické google reklamy a "Yandex", na základe vašich požiadaviek. S pomocou DuckDuckGo je ľahké vyhľadávať informácie v cudzích jazykoch, zatiaľ čo Google a Yandex štandardne preferujú stránky v ruskom jazyku, aj keď je dopyt zadaný v inom jazyku.


Čo je to

not Evil je systém, ktorý prehľadáva anonymnú sieť Tor. Ak ju chcete použiť, musíte prejsť do tejto siete napríklad spustením špecializovaného .

not Evil nie je jediný vyhľadávač svojho druhu. Existuje LOOK (predvolené vyhľadávanie v prehliadači Tor, prístupné z bežného internetu) alebo TORCH (jeden z najstarších vyhľadávačov v sieti Tor) a ďalšie. Rozhodli sme sa, že nie Zlo, kvôli nezameniteľnej narážke na Google (stačí sa pozrieť na úvodnú stránku).

Lepšie

Hľadá, kde má Google, Yandex a ďalšie vyhľadávacie nástroje zásadne zakázaný prístup.

Prečo to potrebujete?

V sieti Tor je veľa zdrojov, ktoré nemožno nájsť na internete, ktorý dodržiava zákony. A ich počet bude rásť, keď sa bude sprísňovať kontrola úradov nad obsahom webu. Tor je druh siete v rámci webu so svojimi sociálnymi sieťami, sledovačmi torrentov, médiami, obchodné platformy, blogy, knižnice a podobne.

3. YaCy

Čo je to

YaCy je decentralizovaný vyhľadávač, ktorý funguje na princípe P2P sietí. Každý počítač, ktorý má primár softvérový modul, prehľadáva internet sám o sebe, to znamená, že je to analóg vyhľadávacieho robota. Získané výsledky sa zhromažďujú v spoločnej databáze, ktorú využívajú všetci účastníci YaCy.

Lepšie

Tu je ťažké povedať, či je to lepšie alebo horšie, pretože YaCy je úplne iný prístup k organizácii vyhľadávania. Neexistencia jediného servera a spoločnosti vlastníka robí výsledky úplne nezávislými od preferencií kohokoľvek. Autonómia každého uzla vylučuje cenzúru. YaCy dokáže prehľadávať hlboký web a neindexované verejné siete.

Prečo to potrebujete?

Ak ste zástancom open source a internet zadarmo, ktorá nie je ovplyvnená vládnymi agentúrami a veľkými korporáciami, potom je YaCy vašou voľbou. Môže sa tiež použiť na organizáciu vyhľadávania v rámci podnikovej alebo inej autonómnej siete. A hoci YaCy nie je veľmi užitočný v každodennom živote, je to dôstojná alternatíva k Google, pokiaľ ide o proces vyhľadávania.

4. Pipl

Čo je to

Pipl je systém určený na vyhľadávanie informácií o konkrétnej osobe.

Lepšie

Autori Pipl tvrdia, že ich špecializované algoritmy vyhľadávajú efektívnejšie ako „bežné“ vyhľadávače. Uprednostňujú sa najmä profily sociálne siete, komentáre, zoznamy účastníkov a rôzne databázy, kde sú zverejňované informácie o ľuďoch, napríklad databázy súdnych rozhodnutí. Vedúce postavenie Piplu v tejto oblasti potvrdzujú Lifehacker.com, TechCrunch a ďalšie publikácie.

Prečo to potrebujete?

Ak potrebujete nájsť informácie o osobe žijúcej v USA, Pipl bude oveľa efektívnejší ako Google. Databázy ruských súdov sú zrejme pre vyhľadávač neprístupné. Preto sa s občanmi Ruska tak dobre nevyrovná.

Čo je to

FindSounds je ďalší špecializovaný vyhľadávací nástroj. Vyhľadáva v otvorených zdrojoch rôzne zvuky: dom, príroda, autá, ľudia atď. Služba nepodporuje požiadavky v ruštine, ale existuje pôsobivý zoznam značiek v ruskom jazyku, ktoré môžete vyhľadať.

Lepšie

Vo vydávaní iba zvukov a nič viac. V nastaveniach si môžete nastaviť požadovaný formát a kvalitu zvuku. Všetky nájdené zvuky sú k dispozícii na stiahnutie. Existuje vyhľadávanie vzorov.

Prečo to potrebujete?

Ak potrebujete rýchlo nájsť zvuk výstrelu z muškety, úder sajúceho ďatľa alebo krik Homera Simpsona, potom je táto služba určená práve vám. A to sme si vybrali len z dostupných dopytov v ruskom jazyku. Na anglický jazyk spektrum je ešte širšie.

Vážne, špecializovaná služba znamená špecializované publikum. Príde však vhod aj vám?

Čo je to

Wolfram|Alpha je výpočtový vyhľadávací nástroj. Namiesto odkazov na články obsahujúce kľúčové slová dáva hotovú odpoveď na otázku používateľa. Ak napríklad do vyhľadávacieho formulára zadáte „porovnať populáciu New Yorku a San Francisca“ v angličtine, Wolfram|Alpha okamžite zobrazí tabuľky a grafy s porovnaním.

Lepšie

Táto služba je lepšia ako ostatné na vyhľadávanie faktov a výpočet údajov. Wolfram|Alpha zhromažďuje a systematizuje znalosti dostupné na webe rôznych oblastiach vrátane vedy, kultúry a zábavy. Ak táto databáza obsahuje pripravenú odpoveď na vyhľadávací dotaz, systém ju zobrazí, ak nie, vypočíta a zobrazí výsledok. V tomto prípade používateľ vidí len a nič viac.

Prečo to potrebujete?

Ak ste napríklad študent, analytik, novinár alebo výskumník, môžete použiť Wolfram|Alpha na vyhľadanie a výpočet údajov súvisiacich s vašimi aktivitami. Služba nerozumie všetkým požiadavkám, no neustále sa vyvíja a stáva sa inteligentnejšou.

Čo je to

Metasearch engine Dogpile zobrazuje kombinovaný zoznam výsledkov z vyhľadávačov. Google SERP, Yahoo a ďalšie populárne systémy.

Lepšie

Po prvé, Dogpile zobrazuje menej reklám. Po druhé, služba používa špeciálny algoritmus na nájdenie a zobrazenie najlepšie skóre z rôznych vyhľadávačov. Podľa vývojárov Dogpile ich systém generuje najúplnejšie vydanie na celom internete.

Prečo to potrebujete?

Ak nemôžete nájsť informácie na Google alebo inom štandardnom vyhľadávači, vyhľadajte ich vo viacerých vyhľadávačoch naraz pomocou Dogpile.

Čo je to

BoardReader je textový vyhľadávací systém pre fóra, služby otázok a odpovedí a ďalšie komunity.

Lepšie

Služba vám umožňuje zúžiť pole vyhľadávania na sociálne stránky. Vďaka špeciálnym filtrom môžete rýchlo nájsť príspevky a komentáre, ktoré zodpovedajú vašim kritériám: jazyk, dátum vydania a názov stránky.

Prečo to potrebujete?

BoardReader môže byť užitočný pre PR špecialistov a iných mediálnych profesionálov, ktorých zaujíma názor masmédií na určité otázky.

Konečne

Život alternatívnych vyhľadávačov je často pominuteľný. Lifehacker sa opýtal bývalého generálneho riaditeľa ukrajinskej pobočky Yandex Sergeja Petrenka na dlhodobé vyhliadky takýchto projektov.


Sergej Petrenko

Bývalý generálny riaditeľ spoločnosti Yandex.Ukraine.

Čo sa týka osudu alternatívnych vyhľadávačov, je to jednoduché: byť veľmi špecializovanými projektmi s malým publikom, teda bez jasných komerčných vyhliadok, alebo naopak s úplnou jasnosťou ich absencie.

Ak sa pozriete na príklady v článku, môžete vidieť, že takéto vyhľadávače sa buď špecializujú na úzky, ale žiadaný výklenok, ktorý sa, možno len doteraz, nerozrástol natoľko, aby bol viditeľný na radaroch Google alebo Yandex, alebo testujú pôvodnú hypotézu v hodnotení, ktorá zatiaľ nie je použiteľná v konvenčnom vyhľadávaní.

Ak sa napríklad náhle ukáže, že vyhľadávanie Tor je žiadané, to znamená, že aspoň percento publika Google bude potrebovať výsledky odtiaľ, potom, samozrejme, bežné vyhľadávače začnú riešiť problém, ako nájsť ich a ukázať ich používateľovi. Ak správanie publika ukazuje, že významná časť používateľov v značnom počte dopytov sa zdajú byť relevantnejšie výsledky, údaje bez zohľadnenia faktorov, ktoré závisia od používateľa, potom Yandex alebo Google začnú poskytovať takéto výsledky.

„Byť lepší“ v kontexte tohto článku neznamená „byť lepší vo všetkom“. Áno, v mnohých aspektoch sú naši hrdinovia ďaleko od Yandexu (dokonca ďaleko od Bingu). Ale každá z týchto služieb dáva používateľovi niečo, čo giganti z vyhľadávacieho priemyslu nemôžu ponúknuť. Určite aj vy poznáte podobné projekty. Podeľte sa s nami - diskutujme.

PROFESIONÁLNE VYHĽADÁVANIE INFORMÁCIÍ NA INTERNETE

Vyhľadávanie na internete je dôležitým prvkom práce na webe. Presný počet webových zdrojov moderného internetu je sotva známy nikomu. V každom prípade ide účet do miliárd. Aby ste mohli použiť informácie, ktoré sú v tomto konkrétnom okamihu potrebné, či už na obchodné alebo zábavné účely, musíte ich najskôr nájsť v tomto neustále dopĺňanom oceáne zdrojov.

Aby bolo vyhľadávanie na internete úspešné, musia byť splnené dve podmienky: otázky musia byť dobre formulované a musia byť kladené na vhodných miestach. Inými slovami, od používateľa sa na jednej strane vyžaduje, aby bol schopný preložiť svoje záujmy vyhľadávania do jazyka Vyhľadávací dopyt, a na druhej strane dobrá znalosť vyhľadávačov, dostupných vyhľadávacích nástrojov, ich výhod a nevýhod, ktoré vám umožnia vybrať si v každom konkrétnom prípade tie najvhodnejšie vyhľadávacie nástroje.

V súčasnosti neexistuje jediný zdroj, ktorý by spĺňal všetky požiadavky na vyhľadávanie na internete. Preto so serióznym prístupom k vyhľadávaniu musíte nevyhnutne použiť rôzne nástroje, pričom každý použijete v najvhodnejšom prípade.

Hlavné nástroje na vyhľadávanie na internetemožno rozdeliť do nasledujúcich hlavných skupín:

vyhľadávače;

Webové adresáre;

referenčné zdroje;

Lokálne programy na vyhľadávanie na internete.

Najpopulárnejším vyhľadávačom jevyhľadávače- takzvané internetové vyhľadávače (Search Engines). Prví traja lídri v celosvetovom meradle sú pomerne stabilní – sú to Google, Yahoo! a Bing. Mnoho krajín pridáva do tohto zoznamu svoje vlastné miestne vyhľadávače optimalizované pre miestny obsah. S ich pomocou môžete teoreticky nájsť akékoľvek konkrétne slovo na stránkach mnohých miliónov stránok. Z pohľadu užívateľa je hlavnou nevýhodou vyhľadávačov nevyhnutná prítomnosťinformačný šumvo výsledkoch. Takto je zvykom nazývať výsledky, ktoré sú z jedného alebo druhého dôvodu zahrnuté v zozname výsledkov, ktoré nezodpovedajú dopytu.

Napriek mnohým rozdielom fungujú všetky internetové vyhľadávače na podobných princípoch a z technického hľadiska pozostávajú z podobných podsystémov. Prvá štrukturálna časť vyhľadávača - špeciálne programy, slúži na automatické vyhľadávanie a následné indexovanie webových stránok. Takéto programy sa zvyčajne nazývajú pavúky alebo roboty. Pozerajú sa do kódu webových stránok, nachádzajú sa na nich odkazy, a tak objavujú nové webové stránky. Existujú tiež alternatívny spôsob zaradenie stránky do indexu. Mnoho vyhľadávacích nástrojov ponúka vlastníkom zdrojov možnosť samostatne pridať stránku do svojej databázy. Nech je to akokoľvek, potom sa webové stránky stiahnu, analyzujú a indexujú. Sú v nich zvýraznené štrukturálne prvky, nájdené kľúčové slová, určené ich prepojenia s inými stránkami a webovými stránkami. Vykonávajú sa aj ďalšie operácie, ktorých výsledkom je vytvorenie indexovej základne vyhľadávača. Tento základ je druhým hlavným prvkom každého vyhľadávača. V súčasnosti neexistuje jedna absolútne úplná databáza indexov, ktorá by obsahovala informácie o celom obsahu internetu. Keďže rôzne vyhľadávacie nástroje používajú rôzne programy na vyhľadávanie webových stránok a vytvárajú svoj index pomocou rôznych algoritmov, bázy indexov vyhľadávacích nástrojov sa môžu výrazne líšiť. Niektoré stránky sú indexované viacerými vyhľadávačmi, no vždy je určité percento zdrojov zaradených v databáze len jedného vyhľadávača. Skutočnosť, že každý vyhľadávací nástroj má tak originálnu a neprekrývajúcu sa časť indexu, vám umožňuje urobiť dôležitý praktický záver: ak používate iba jeden vyhľadávací nástroj, dokonca aj ten najväčší, určite prídete o určité percento užitočných odkazov. .

Ďalšou časťou internetového vyhľadávača je samotný vyhľadávací a triediaci program. Tieto programy riešia dve hlavné úlohy: najprv nájdu v databáze stránky a súbory, ktoré zodpovedajú prichádzajúcej požiadavke, a následne zoradia výsledné dátové pole podľa rôznych kritérií. Úspech pri dosahovaní cieľov hľadania do značnej miery závisí od efektívnosti ich práce.

Posledným prvkom internetového vyhľadávača je používateľské rozhranie. Okrem požiadaviek na estetiku a pohodlie, ktoré sú bežné pre každú stránku, je tu ešte jedna dôležitá požiadavka na rozhrania vyhľadávačov: musia ponúkať rôzne nástroje na zostavovanie a spresňovanie dopytov, ako aj triedenie a filtrovanie výsledkov. Výhodami vyhľadávačov je výborné pokrytie zdrojov, pomerne rýchla aktualizácia obsahu databázy a dobrá voľba pridané vlastnosti.

Hlavným nástrojom pre prácu s vyhľadávačmi je dopyt.

Na vyhľadávanie na internete sa používajú aj špeciálne aplikácie nainštalované na lokálnom počítači. Môžu to byť jednoduché programy aj pomerne zložité komplexy na vyhľadávanie a analýzu údajov. Najbežnejšími zásuvnými modulmi prehliadača sú zásuvné moduly prehliadača, panely prehliadača navrhnuté na prácu s konkrétnou vyhľadávacou službou a balíky metasearch s možnosťou analýzy výsledkov.

Webové adresáre - ide o zdroje, v ktorých sú stránky rozdelené podľa tematických kategórií. Ak používateľ pracuje s vyhľadávačmi iba prostredníctvom dopytov, potom má katalóg možnosť prezerania celých tematických sekcií. Druhým zásadným rozdielom medzi katalógmi a automatickými vyhľadávačmi je, že na ich obsahu sa spravidla priamo podieľajú ľudia, ktorí si prezerajú zdroje a priraďujú stránku k tej či onej kategórii. Webové adresáre sa zvyčajne delia na univerzálne a tematické. Universal sa snaží pokryť čo najviac tém. Môžete v nich nájsť čokoľvek: od stránok o poézii až po počítačové zdroje. Inými slovami, majú maximálnu šírku vyhľadávania. Tematické adresáre sa na druhej strane špecializujú na určitý predmet a poskytujú maximálnu hĺbku vyhľadávania znížením šírky pokrytia zdrojov.

Výhodou adresárov je relatívne vysoká kvalita zdrojov, pretože každý web v ňom si prezerá a vyberá osoba. Tematické zoskupenie stránok vám umožňuje pohodlne lokalizovať stránky s podobnou tematikou. Tento režim prevádzky je vhodný na objavovanie nových stránok na tému, ktorá vás zaujíma – je presnejší ako používanie vyhľadávača. Odporúča sa používať webové adresáre na prvé zoznámenie sa s akoukoľvek tematickou oblasťou, ako aj na vyhľadávanie nejasných dopytov - budete mať možnosť „prechádzať“ sekciami adresára a presnejšie určiť, čo potrebujete.

Nevýhody webových adresárov sú známe. V prvom rade ide o pomalé dopĺňanie databázy, keďže zaradenie stránky do katalógu si vyžaduje účasť osoby. Z hľadiska efektívnosti nie je webový adresár súperom pre vyhľadávače. Okrem toho sú webové adresáre výrazne horšie ako vyhľadávače, pokiaľ ide o veľkosť databázy.

Pri vyhľadávaní na internete nemožno ignorovať množstvo pojmov, ktoré s touto oblasťou úzko súvisia a často sa používajú na opis a hodnotenie vyhľadávačov. Napríklad:šírka a hĺbka vyhľadávanie na internete. Široké vyhľadávanie je vyhľadávanie, ktoré zachytáva čo najviac zdrojov informácií. Zároveň sa za dostatočnú považuje aspoň zmienka o konkrétnej stránke, ktorá zodpovedá dopytu. Hĺbka vyhľadávania sa vzťahuje na podrobnosti indexovania a následného vyhľadávania každého konkrétneho zdroja. Mnoho vyhľadávačov má napríklad rôzne prístupy k indexovaniu rôznych stránok. Veľké a obľúbené stránky sú indexované v maximálnej miere, roboty sa snažia nevynechať ani jednu stránku takéhoto zdroja. Zároveň na iných stránkach je možné indexovať iba hlavnú stránku a niekoľko stránok s obsahom. Tieto okolnosti samozrejme ovplyvňujú následné pátranie. Hlboké vyhľadávanie funguje na princípe „je lepšie zahrnúť nadbytočné informácie do výsledkov, ako vynechať akékoľvek údaje relevantné pre tému vyhľadávania“.

Je úplne bežné sa stretnúť s pojmami ako napr globálne a lokálne vyhľadávanie na internete. Lokálne vyhľadávanie na internete zohľadňuje geografickú polohu používateľa a uprednostňujú sa výsledky, ktoré nejakým spôsobom súvisia s konkrétnou krajinou alebo lokalitou. Globálne vyhľadávanie ignoruje tieto informácie a prehľadá všetky dostupné zdroje.

Pri zostavovaní dopytu v internetových vyhľadávačoch rôzne režimy Vyhľadávanie. Typické režimy vyhľadávania, ktoré sa nachádzajú na väčšine internetových zariadení, zahŕňajú jednoduché a pokročilé Vyhľadávanie. Jednoduché vyhľadávanie vám umožňuje zadať iba jednu funkciu vyhľadávania v jednom dotaze. Pokročilé vyhľadávanie umožňuje vytvoriť dopyt z viacerých podmienok ich prepojením s logickými operátormi.

Na spresnenie vyhľadávacích dopytov sa používajú rôzne metódy. filtre . Filtre sú tie alebo iné pomocné prostriedky na zostavenie dotazu, ktoré sa nevzťahujú na obsahovú stránku podmienok dotazu, ale obmedzujú výsledky vyhľadávania na nejaký formálny znak. Napríklad pri použití filtra typu súboru pri vyhľadávaní používateľ neposkytuje systému informácie súvisiace s predmetom jeho požiadavky, ale jednoducho obmedzuje získané výsledky na konkrétny typ súboru uvedený v podmienke jeho požiadavky.

Pre väčšinu používateľov sú hlavným a často jediným prostriedkom vyhľadávania na internete univerzálne vyhľadávače. Ponúkajú dobré pokrytie zdrojov, ako aj sadu nástrojov dostatočnú na základné úlohy vyhľadávania.

Trh univerzálnych vyhľadávačov je pomerne veľký. Pokúsili sme sa analyzovať najznámejšie vyhľadávače a výsledky sú prezentované vo forme tabuľky 1.

Pri výbere univerzálneho vyhľadávača zohráva dôležitú úlohu kvalita zdrojov nájdených s jeho pomocou. Preferovaný vyhľadávací nástroj pre konkrétne úlohy môžete určiť pomocou „metódy značiek“. Jeho podstata spočíva v tom, že najskôr sa zostaví určitý tematický vyhľadávací dopyt, po ktorom sa uskutoční prieskum skupiny ľudí - odborníkov v tejto oblasti, aby identifikovali podľa ich názoru najlepšie internetové zdroje na zvolenú tému. Na základe údajov z prieskumu sa vytvorí zoznam značkovacích lokalít, ktoré sú zaručene relevantné pre dopyt a obsahujú vysokokvalitné informácie. Potom sa požiadavka odošle testovaným vyhľadávačom. Logika vyhodnocovania je jednoduchá: čím vyššie sú lokality so značkami umiestnené vo výsledkoch vyhľadávania, tým lepšie je konkrétny zdroj vhodný na nájdenie informácií o testovacej téme.



Hovorte o tom, čo je v našej dobe informačných technológií a nekonečný rast množstva údajov, ktoré má jednotlivec aj spoločnosť k dispozícii, je veľa problémov so spracovaním informácií a ich vyhľadávaním - to je už rúhanie. Kto len nenastoľuje túto tému. A aby som vás nezaťažoval subjektívnymi a čiastočne aj objektívnymi úsudkami o probléme pozbieranými z rôznych informačných zdrojov, pristúpim priamo k jeho riešeniu. Dnes si povieme niečo o vyhľadávaní. Teda o programoch a serióznych informačných systémoch, ktoré vyhľadávajú dokumenty a dáta, ktoré potrebujeme.

Inovujte "priame vyhľadávanie"

Nie je to tak dávno, keď boli stromy veľké, a informácie aj v lokálna sieť podnikov nebolo až tak veľa, akékoľvek vyhľadávanie sa vykonávalo banálnym vymenovaním hŕstky dostupných súborov a dôslednou kontrolou ich názvov a obsahu. Takéto vyhľadávanie sa nazýva priame a programy (utility) využívajúce technológiu priameho vyhľadávania sú tradične prítomné vo všetkých operačné systémy a balíky nástrojov. Ani výkon moderných počítačov však nestačí na rýchle a primerané vyhľadávanie v gigantických množstvách údajov pri priamom vyhľadávaní. Prehľadávanie v niekoľkých stovkách dokumentov na disku a vyhľadávanie v obrovskej knižnici a niekoľkých desiatkach poštových schránok sú dve rôzne veci. Preto programy na priame vyhľadávanie dnes jednoznačne ustupujú do pozadia – ak hovoríme o univerzálnych nástrojoch.

Samozrejme, vo firemnom sektore tento typ vyhľadávania už dávno nie je žiadaný. Objemy nie sú rovnaké. A preto už mnoho rokov a v poslednej dobe jednoznačne technológie schopné vykonávať rýchle a presné vyhľadávanie dokumentov rôznych formátov a z rôznych zdrojov, viac než relevantné. Nie je to tak dávno, čo „otec“ Microsoftu Bill Gates, ktorý zjavne závidel fenomenálny úspech internetového vyhľadávača Google, na jednej z tlačových konferencií oznámil túžbu softvéru (už a nielen) všetkými možnými spôsobmi propagovať , rozvíjať a prehlbovať tvorbu vyhľadávačov a technológií. Pred vytvorením nejakého fenomenálneho pracovného programu od Microsoftu alebo konkurenčného servera na internete je však ešte priskoro (MSN stále zaostáva za Google). Preto sa obraciame na existujúci vývoj. Index, dopyt, relevantnosť

V jadre moderné technológie existujú dva základné procesy. Po prvé, je to indexovanie dostupných informácií a spracovanie požiadavky, po ktorom nasleduje výstup výsledkov. Pokiaľ ide o prvý, každý program (či už ide o vyhľadávací nástroj na pracovnej ploche, podnikový informačný systém alebo internetový vyhľadávač) vytvára svoju vlastnú oblasť vyhľadávania. To znamená, že spracováva dokumenty a tvorí index týchto dokumentov (organizovaná štruktúra, ktorá obsahuje informácie o spracovávaných údajoch). V budúcnosti je to vytvorený index, ktorý slúži na prácu - rýchle získanie zoznamu potrebných dokumentov podľa požiadavky. Ďalej, aj keď v žiadnom prípade nie je z hľadiska technológie jednoduchý, ale je celkom pochopiteľný bežný používateľ. Program spracuje požiadavku (podľa kľúčového slova) a zobrazí zoznam dokumentov, ktoré obsahujú túto kľúčovú frázu. Keďže informácie sú obsiahnuté v štruktúrovanom indexe, spracovanie dopytu je oveľa (desaťkrát a stokrát!) rýchlejšie ako v prípade priameho vyhľadávania (výber dokumentu sa nevykonáva enumeráciou súborov, ale analýzou textových informácií v index).

Program zobrazí nájdené dokumenty vo výslednom zozname podľa relevantnosti - zhody dokumentu s textom dopytu. V rôznych technológiách, samozrejme, existujú rôzne metódy vyhľadávanie a určenie relevantnosti dokumentu (počet „výskytov“ slova a jeho frekvencia zmienok v dokumente, pomer týchto parametrov k celkovému počtu slov v dokumente, vzdialenosť medzi slovami dopytu fráza vo vyhľadávaných súboroch atď.). Na základe týchto parametrov sa určí „váha“ dokumentu a v závislosti od nej sa ten či onen súbor objaví v zozname výsledkov na určitej pozícii. V prípade internetového vyhľadávania je situácia ešte komplikovanejšia. V tomto prípade je skutočne potrebné vziať do úvahy mnoho ďalších faktorov (príkladom je Page Rank Google). To je ale téma na samostatný článok, takže sa internetu nedotkneme Prehľad vyhľadávačov

Tento článok pojednáva o viacerých možnostiach obľúbené programy vyhľadávanie, ktoré sa môže pochváliť slušnou rýchlosťou aj dobrou funkčnosťou. Ale predvádzať sa v letáku je jedna vec, no postaviť sa pohľadom odborníka je niečo celkom iné. A nebolo ani veľa, ani málo odborníkov, plná kancelária milovníkov, ktorí sa hrabali v softvéri pre jeho použiteľnosť. Na testovacom počítači (Athlon 2,2 MHz, s Náhodný vstup do pamäťe 1 GB, 160 GB pevný disk Seagate IDE 7200 ot./min a systém Windows XP) bola nainštalovaná sada programov: dtSearch Desktop, Snoop Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. Pre testy bola zostavená textová báza dokumentov vo formátoch doc, txt a html s celkovou veľkosťou nie viac, nie menej, ale 20 gigabajtov. Skupina súdruhov pod vedením vášho skromného sluhu testovala, porovnávala a zdieľala svoje subjektívne dojmy z každého softvéru. Zhrnutie zistení nájdete nižšie. dtSearchDesktop

Program, ktorý podľa vývojárov tvrdí, že je najrýchlejší, najpohodlnejší a najlepší vyhľadávač. Ako vo všeobecnosti, tak aj celý zvyšok tejto recenzie. Rozhranie dtSearch je pomerne jednoduché, ale niektoré okná alebo karty sú trochu preplnené prvkami, čo vyvoláva dojem, že sa ťažko používajú. Ale v skutočnosti neexistujú žiadne zvláštne ťažkosti. Jediným skutočne nepríjemným momentom je nedostatočná podpora softvéru v ruštine (napriek tomu, že program dokáže vyhľadávať dokumenty vo viacerých jazykoch, jeho rozhranie je výlučne anglické).

Ale dtSearch je jeden z mála programov, ktorý dokáže indexovať webové stránky do „hĺbky“ špecifikovanej používateľom (avšak berúc do úvahy „dokúpenie“ v doplnkovej sade dtSearch Spider). To je okrem podpory súborov na disku rôznych textové formáty a e-maily od poštová schránka výhľad. Program zároveň nevie pracovať s databázami, ktoré sú pre vyhľadávače takým chutným sústom kvôli veľkému množstvu informácií, ktoré obsahujú a širokej distribúcii vo firmách, a teda v podnikových sieťach. Rýchlosť indexovania dokumentov dtSearch bola na úrovni. Pri pohľade do budúcnosti poviem, že tento program si poradil s indexovaním daného množstva informácií na úrovni s iným súťažiacim – iSYS – a delil sa s ním o druhé miesto v rebríčku naj rýchle systémy. Otestujte 20 gigabajtov informácií dtSearch indexovaných za 6 hodín a 13 minút, čím sa vytvorí index 7,9 GB pre potreby následného vyhľadávania.

Pokiaľ ide o možnosti vyhľadávania, tu sú na úrovni. Po prvé, dtSearch má morfologické vyhľadávanie (hľadanie slova vo všetkých jeho morfologických formách). Využitím tejto príležitosti sa oslobodíte povedzme od myšlienok typu „v akom prípade bolo v dokumente, ktorý potrebujem, použité určité slovo?“. Použitie morfologického vyhľadávania je takmer vždy opodstatnené, preto by malo byť prítomné v každom profesionálnom vyhľadávači.

Zvukové vyhľadávanie je neštandardná funkcia aj pre profesionálne vyhľadávače. Jeho podstata spočíva v tom, že program bude hľadať slová, ktoré znejú rovnako ako slovo, ktoré ste zadali. A najlepšie na tom je, že táto funkcia funguje aj pre ruský jazyk! Napríklad zadanie slova „ear“ do vyhľadávacieho dopytu bude mať za následok nielen slová „ear“, ale aj „ear“.

Veľmi dôležitou funkciou je oprava vyhľadávania chýb. Používa sa na vyhľadávanie slov obsahujúcich syntaktické chyby – môžu to byť buď preklepy alebo chyby v dokumentoch získaných napríklad pomocou systémov rozpoznávania znakov. Jednoduchým príkladom je, že hľadáte slovo klávesnica. Niektorý dokument obsahuje slovo "klávesnica", je zrejmé, že v skutočnosti je toto slovo "klávesnica", len osoba, ktorá píše pri písaní. Teraz, vyhľadávanie opravujúce chyby, zistí a zahrnie dokument so slovom „klávesnica“ do výsledku. Aj v dtSearch je nastavenie, ktoré vám umožňuje určiť stupeň možných chybných znakov.

Hľadajte pomocou synoným. Táto funkcia používa zoznam synoným pre rôzne slová. Takže napríklad zadaním slova „rýchly“ program nájde aj slová „vysokorýchlostný“ a ďalšie, ktoré sú synonymami pre slovo „rýchly“, ak nejaké sú, samozrejme, v zozname synoným sú. . K programu dtSearch nie je dodávaný hotový zoznam synoným, je však možné použiť zoznamy na internete (podľa toho je potrebné pripojenie, čo nie je vždy vhodné), alebo si môžete vytvoriť vlastný zoznam synonymá.

Okrem uvedených funkcií môže dtSearch vyhľadávať pomocou fráz pozostávajúcich zo slov spojených logickými operáciami. Každému slovu v dotaze možno priradiť vlastnú „váhu“, teda význam. Užitočnou možnosťou je použiť slovník skladajúci sa z nedôležitých slov, aby ste ich nebrali do úvahy pri vyhľadávaní, ale aj tento slovník je prázdny a budete si ho musieť vyplniť sami.

Ďalej zvážte možnosti programu pri práci v sieti. V skutočnosti dtSearch neponúka žiadne špecifické sieťové možnosti. Je však celkom možné ho použiť v sieti. Prípadne môžete vytvoriť nejaký index a vložiť ho do verejného (zdieľaného) priečinka. Samotný program je možné nainštalovať každému používateľovi na počítači alebo ho umiestniť aj do priečinka, ktorý je otvorený verejný prístup a vytvorte skratky špeciálnym spôsobom pre každého používateľa samostatne pomocou možností príkazového riadka, ktorých účel je popísaný v súbore pomocníka dodanom s programom. Tiež je tu možnosť automatická inštalácia programov do siete pomocou súboru MSI. Toto zohľadní nastavenia pre každého pripojeného používateľa.

Vo všeobecnosti - dobrý program z kategórie profesionálnych vyhľadávačov. Môže sa kvalifikovať na dobré hodnotenie, získanie dôvery a rešpektu od používateľov však môže byť pre dtSearch ťažké z dôvodu niekoľkých faktorov (nie všetko je s rozhraním hladké, ruskí používatelia sú zbavení, neexistujú žiadne jasné funkcie pre prácu so sieťou) . Čo sa týka priameho vyhľadávania dokumentov, program nemal prekrytia ruským textom. Keďže neboli žiadne s deklarovanou morfológiou, alebo s fuzzy vyhľadávaním. Systém celkom adekvátne našiel potrebné dokumenty tak jednoduchou požiadavkou v jednom slove, ako aj použitím niekoľkých odsekov alebo akéhokoľvek dokumentu ako kľúčovej frázy.

Oficiálna stránka:
Veľkosť distribúcie: 23 MbSnoop Prof Deluxe

Podľa názvu môžete uhádnuť, že v tomto programe je podpora ruského jazyka. Už je pekne. Pokiaľ ide o rozhranie, vo všeobecnosti je trochu nezvyčajné, ale má veľmi atraktívny vzhľad. Ďalšia vec je pohodlie. Veľmi kontroverzné kritérium, ale pravdepodobne riešenie s viacerými oknami nie je tou najlepšou voľbou (požiadavka sa zadá v jednom okne, výsledok sa zobrazí v inom atď.).

Bloodhound stále používa rovnaké indexy na vykonávanie rýchleho vyhľadávania, ale indexovanie je oveľa pomalšie ako iné programy. To je veľmi zvláštne, najmä ak vezmeme do úvahy, že jeho schopnosť spracovávať vyhľadávacie dotazy je veľmi slabá, čo znamená, že štruktúra indexu nie je komplikovaná. S najväčšou pravdepodobnosťou ide o neoptimalizované algoritmy. Ukázalo sa, že tento program je jasným outsiderom indexovania a rýchlosti vyhľadávania: čas strávený vytvorením indexu je šesťkrát dlhší ako pri rovnakých dtSearch a iSYS. Indexovanie 20 gigabajtov textov pre bloodhounda znamenalo 38 hodín a 46 minút práce. A vytvorená „oblasť vyhľadávania“ zaberala na pevnom disku rovnakú veľkosť ako pôvodné dáta s malým mínusom – 19 gigabajtov.

Bloodhound môže byť prezentovaný ako alternatíva štandardné vyhľadávanie v systéme Windows sotva dokáže viac. Skutočnosť, že primárnou úlohou hľadača - najjednoduchšie vyhľadávanie súborov, nie je len malý počet funkcií na analýzu textu vyhľadávacích dopytov a pokročilé vyhľadávanie podľa atribútov súboru, ale dokonca aj okno s výsledkami, ktoré poskytuje priame odkazy na nájdené súbory, ako aj priečinky obsahujúce tieto súbory. Okno s výsledkami nie je príliš informatívne v tom zmysle, že celý nájdený súbor si môžete prečítať iba spustením, to znamená, že nemá zabudovaný prehliadač súborov. Ale je uvedený úryvok zo súboru, kde bolo nájdené hľadané slovo, vo všeobecnosti takáto schéma zobrazenia veľmi pripomína internetové vyhľadávače.

Keď už hovoríme o špecifických možnostiach spracovania vyhľadávacích dopytov, stojí za zmienku, že neexistuje nič také ako „hľadanie textu“, maximum, ktoré možno vyhľadávať, je fráza, už len preto, že neexistuje viacriadkové pole na zadávanie textu. Môžete však tiež analyzovať zadanú frázu a Bloodhound nám ponúka štandardnú sadu vyhľadávania tu: logické operácie, vyhľadávanie podľa masky a vyhľadávanie cenových ponúk ... nie veľa. V programe sú nejaké základy morfologického vyhľadávania, ale pravdepodobne také surové, že to skôr narúša správnu prácu (počas testov bolo zaznamenaných veľa prekrytí s nesprávnym použitím morfológie).

Ale program vám umožňuje pri vyhľadávaní špecifikovať atribúty súboru (dátum dokumentu, názov súboru, názov priečinka) av týchto dotazoch môžete použiť aj rovnakú vyhľadávaciu sadu. Správy môžete vyhľadávať aj zadaním parametrov (Od, Predmet... atď.).

Prišli sme teda na samotné hľadanie, čo je ešte zaujímavé na programe, za ktorý dostal podľa informácií z oficiálnej stránky toľko ocenení? Ťažko povedať, čo je na ňom také zvláštne, s najväčšou pravdepodobnosťou je rozhranie Bloodhoundu priaznivé (len navonok, nehovoriac o použiteľnosti).

Operácie s indexmi sú veľmi štandardné, príjemná je možnosť aktualizovať indexy podľa plánu. Okrem toho je možné indexy používať aj online. Odteraz musíme byť konkrétnejší.

Napriek primitívnosti vyhľadávacích dopytov je možné program použiť na vyhľadávanie súborov, takže jeho použitie môže byť opodstatnené v sieťach. Aj keď s veľkým rozsahom, pretože vo veľkej sieti je prioritou rýchle vyhľadávanie údajov pomocou zložitých vyhľadávacích dopytov kvôli obrovskému množstvu informácií - a sú tu jednoznačne problémy s rýchlosťou vyhľadávania a programu. Musím povedať, že práca so sieťou u Bloodhounda je premyslená ako má. Špeciálne na to je navrhnutá samostatná aplikácia - Bloodhound Server. Funguje rovnako ako len Bloodhound (majú jeden vyhľadávací nástroj), len pre dokumenty hosťované na centrálnom serveri alebo na zdieľaných zdrojoch v firemná sieť. Bloodhound Server vytvára nové indexy na zdieľaných zdrojoch alebo používa predtým vytvorené indexy. Každý používateľ v podnikovej sieti sa môže pripojiť k serveru Bloodhound a použiť ho na prístup k akémukoľvek dokumentu (umiestnenému v aktuálnom indexe) pomocou internetového prehliadača. Súhlasíte, že takáto schéma je mimoriadne pohodlná: ukazuje sa, že súbory vo vašej vlastnej sieti je možné vyhľadávať rovnakým spôsobom ako informácie na internete, napríklad prostredníctvom Google.

Po zhodnotení všetkých výhod a nevýhod tohto programu záver naznačuje, že pre podnikové siete jeho možnosti s najväčšou pravdepodobnosťou nebudú postačovať (napriek dobrej organizácii siete), ale pre domáci počítač alebo dokonca pre domácu sieť áno, v princípe by sa to mohlo hodiť. Aj keď ani rýchlosť práce, ani možnosti vyhľadávania nevzbudzujú optimizmus ...

Oficiálna stránka v ruštine:
Veľkosť distribúcie: 6 MbGoogle Desktop Search + GDS Enterprise

Samozrejme, nemohli sme ignorovať takého významného vývojára. Už názov Google hovorí za všetko. Ľudia, ktorí už roky používajú najvýkonnejší internetový vyhľadávač, sa pravdepodobne bez jedinej pochybnosti rozhodnú nainštalovať tento konkrétny vyhľadávač do svojho počítača. Je to ako premýšľať: Google na vašom domácom počítači! Bez toho, aby sme však podľahli provokáciám s hojne propagovanou značkou, skúsme triezvo a hlavne objektívne zvážiť možnosti „desktopového“ vyhľadávača od Google.

Prvá vec, ktorá vás upúta, je nedostatok vlastného shellu pre program. Google Desktop Search je stále v okne prehliadača, respektíve celé rozhranie desktopovej verzie prešlo na softvér od staršieho internetového brata. Či je to dobré alebo zlé, je diskutabilná otázka: niekomu sa páči minimalizmus v dizajne tohto vyhľadávača a niekto chce vidieť plnohodnotnú aplikáciu naplnenú všemožnými tlačidlami a podobne.

Čo vám padne do oka hneď po dizajne? A skutočnosť, že to isté vyhľadávanie Google Desktop začne indexovať všetko v počítači bez toho, aby to bolo potrebné! A čo je najzaujímavejšie, nie je možné zvoliť cesty indexovania pomocou programu Google Desktop Search. Budete si musieť stiahnuť samostatný program (TweakGDS), ktorý vám umožní mierne rozšírenie nastavenia google Pracovná plocha vrátane určenia miest potrebných na indexovanie. Hoci, kým si to všetko vyrátate, už bude indexovať štandardný pevný disk, takže toto nastavenie je potrebné viac pri práci s veľkým množstvom dát, čo je veľmi dôležité pri použití v podnikových sieťach (verzia Enterprise). Nie je však pravdou, že po stiahnutí TweakGDS budú vaše problémy vyriešené. Koniec koncov, potrebuje Microsoft . Internetová sieť a Microsoft Scripting Runtime. Áno... inštalácia, ako aj prístup k nastaveniam sa mohli zjednodušiť, aj keď vývojári pravdepodobne chápu: prečo písať niečo nové, keď už existuje hotový vyhľadávač, portovaný na lokálny počítač a nech si užívateľ „užije“, a nech si z „tohto“ spraví známe meno ďalšie majstrovské dielo. Poďme, dokončíme túto lyrickú odbočku a prejdeme k hľadaniu.

Pokiaľ ide o analýzu vyhľadávacích dopytov a vydávanie výsledkov, všetko je tu úplne identické s Google na internete: rovnaký systém zobrazovania výsledkov, rovnaký štandardný súbor logických operácií pre vyhľadávacie dopyty. Vo všeobecnosti, vyhľadávanie Google Desktop, napr predchádzajúci program, je určený výhradne na vyhľadávanie súborov – na tieto súbory samozrejme neexistuje interný prehliadač. Počet formátov súborov, ktoré Google Desktop Search podporuje, je celkom dostatočný a príjemné je aj to, že prehľadáva navštívené internetové stránky, pričom dáta berie z vyrovnávacej pamäte. Rýchlosti vyhľadávania a indexovania sú celkom prijateľné. Pravda, na domáce použitie. S pôsobivými 20 gigabajtmi textov sa vyhľadávanie Google Desktop podarilo zvládnuť za 8 hodín a 17 minút. Stráviť niekoľko dní spracovávaním informácií z podnikovej siete veľkého podniku sa neusmieva na žiadneho správcu systému. Pozitívom je, že veľkosť vytvoreného indexu sa ukázala byť na úrovni (4,5 GB) s iným vyhľadávačom testovaným v tejto recenzii – SearchInform.

Veľkou výhodou (alebo vynechaním – rozhodnete sa) Google Desktop Search je, že podporuje doplnky, ktoré môžu veľa zmeniť k lepšiemu. Ďalšia vec je, že pripojenie zásuvných modulov a ich konfigurácia komplikuje úlohu inštalácie vyhľadávača natoľko, že sa začnete pýtať, či je to všetko potrebné, keď môžete nainštalovať normálny plnohodnotný program, v ktorom už bude všetko prítomné. Koniec koncov, na používanie každej funkcie si budete musieť nainštalovať nový doplnok. Dokonca aj na to, aby program plne pracoval s archívmi, je potrebný samostatný krém. Fascinuje a zvádza bezplatné používanie všetkých týchto doplnkových modulov. Ak však neberiete do úvahy desktopovú verziu vyhľadávača, potom kompetentné nastavenie GDS Enterprise nemusí byť vo vašich silách – nie nadarmo ponúkajú špecialisti Google svoje služby na nastavenie vlastného softvér pre vašu sieť len za 10 000 USD.

Ak si napriek tomu osvojíte postup nastavenia a inštalácie (alebo zaplatíte 10 000 $ tímu rýchlej reakcie Google), pochopíte, že zložitosť inštalácie je viac než kompenzovaná veľmi flexibilnými nastaveniami pri použití v podnikových sieťach. Dôležitým aspektom práce programu Google Desktop v podnikovej sieti je používanie skupinové politiky, čo umožňuje nastaviť preferencie pre každého používateľa.

Ak to zhrnieme, treba povedať, že najrozumnejšie využitie tohto programu je domáci alebo pracovný počítač. Pre bežný počítač totiž stačí len nainštalovať program – o zvyšok sa postará sám (ani sa vás nebude na nič pýtať).

Služba Google Desktop Search Enterprise však bude prijateľná v prípadoch, keď je naliehavá potreba flexibilných nastavení sieťovej politiky na používanie vyhľadávacieho nástroja, pričom schopnosť spracovávať vyhľadávacie dopyty bude až na druhom mieste dôležitosti a čas (alebo peniaze) vynaložené na nastavenie programu budú na prvom mieste.

Oficiálna stránka:
Veľkosť distribúcie s TweakGDS: 1,2 MbCopernic Desktop Search

Pre zväčšenie kliknite na obrázok

Rozhranie programu vyvoláva mimoriadne pozitívne emócie - všetko sa robí v súlade so všeobecne uznávanými štandardmi, nič viac, jedným slovom príjemný dizajn. Pre začiatočníka bude veľmi jednoduché pochopiť rozhranie Copernic Desktop Search. Aj keď je trochu trápne, že dizajnéri explicitne vytvorili rozhranie programu, berúc do úvahy skutočnosť, že program bude fungovať v štandardnej téme Windows XP. Pri použití rovnakej klasickej témy program nevyzerá tak pekne. Ale to je skôr vec vkusu.

Pri prvom spustení program ponúka vytvorenie indexov na vyhľadávanie. Zdalo sa trochu nezvyčajné, že po výbere priečinkov na indexovanie program neponúka stlačenie žiadneho tlačidla, napríklad „Spustiť indexovanie“, zatiaľ čo indexovanie sa nespustí automaticky, až potom sa zistilo, že Copernic sa pokúša spustiť indexovanie, keď je počítač nečinný. . Aby ste všetko správne nastavili, budete sa musieť trochu pohrabať v možnostiach programu. Treba poznamenať, že existujú pomerne široké možnosti prispôsobenia. automatické vytváranie index: vstavaný plánovač, schopnosť indexovať, keď je počítač nečinný, na pozadí, s nízkou prioritou. Indexovanie nebolo príliš rýchle – 10 hodín 51 minút – to je pomalšie ako v iných vyhľadávačoch (okrem Bloodhound, ale Copernic je rádovo rýchlejší ako vývoj iSleuthHound Technologies.

Teraz o štruktúre indexu. Vo všeobecnosti na tom nie je nič zvláštne. Je možné vybrať typy súborov, a to ako vo všeobecnej forme, tak aj v podrobnej forme. To znamená, že na začiatku si môžete vybrať, čo chcete indexovať – Dokumenty, Obrázky, Videá, Hudba. Na druhej karte okna možností bude možné vybrať konkrétne typy súborov podľa prípony. Okrem toho môžete index nakonfigurovať tak, aby sa napríklad neindexovali obrázky menšie ako 16 x 16 alebo sa neindexovali zvukové súbory kratšie ako 10 sekúnd. Okrem indexovania súborov z priečinkov dokáže Copernic pracovať s emailami a kontaktmi z adresára Microsoft Outlook a Microsoft Outlook Express, je možné indexovať obľúbené položky a históriu z Internet Explorera.

Pokiaľ ide o možnosti vyhľadávania, sú tu veľmi slabé. Počas testov sa dokonca ukázalo, že program nevyhľadáva dokumenty vo formátoch txt a html v ruštine, čo vám umožňuje nájsť ich iba podľa nadpisov a v žiadnom prípade nie podľa obsahu. Jediná vec, ktorú program poskytuje na zlepšenie efektívnosti vyhľadávania, je použitie štandardná sada logické operácie a už vtedy bola táto možnosť objavená experimentálne, keďže nebola zdokumentovaná. Mimochodom, pomoc programu tiež nie je v poriadku - je k dispozícii iba cez internet, čo, ako vidíte, je veľmi nepohodlné a v sieti nie je príliš veľa informácií o pomoci. Vývojári sa zjavne rozhodli, že jednoduché rozhranie programu neznamená prítomnosť bežnej pomoci. V konverzácii o možnostiach vyhľadávania je potrebné poznamenať, že napriek slabej analýze dopytov poskytuje program zaujímavý systém vyhľadávania - používateľ si môže vybrať typ súborov (obrázky, videá, hudba atď.), zadať vyhľadávací dotaz a vyberte atribúty, ktoré sú špecifické pre vybraný typ súboru. Napríklad pre zvukové súbory, môžu to byť hodnoty z mp3 tagov (interpret, album, dátum atď.), pri obrázkoch si napríklad môžete zvoliť ich veľkosť (podľa rozlíšenia), vo všeobecnosti má každý typ svoje vlastné nastavenia. Po vyhľadaní určitého typu súborov program zobrazí v okne výsledkov veľmi informatívny zoznam a ak vaša požiadavka obsahuje súbory iného typu, môžete ich otvoriť kliknutím na konkrétny odkaz.

Samostatne stojí za zmienku okno zobrazenia výsledkov. Obsah týchto súborov sa zobrazuje pod zoznamom nájdených súborov (podobná schéma sa často používa v poštových klientov). Je pravda, že text je možné prezerať iba v jeho natívnom formáte a neexistuje režim zobrazenia obyčajného textu, čo nie je vždy vhodné, pretože otvorenie dokumentu v tomto prípade trvá dlhšie. Ale vzhľadom na to, že Copernic dokáže vyhľadávať obrázky a hudbu, existuje možnosť prezerania týchto multimediálnych súborov.

Základné princípy tohto programu boli popísané, teraz sa pozrime, čo nám Copernic Desktop Search môže ponúknuť pre prácu so sieťou ... V zásade môžete sledovať veľmi dlho, ale je nepravdepodobné, že by ste niečo videli. Inými slovami, tento program nebol koncipovaný ako sieťový. Copernic Desktop Search je výlučne domáci vyhľadávací nástroj.

Je zrejmé, že jediné (najlogickejšie) využitie tohto programu je domáci počítač. Tu si celkom poradí so všetkými jednoduchými vyhľadávacími dopytmi používateľov, ktoré pozostávajú z jedného alebo dvoch slov, nájde potrebné informácie a oddelenie vyhľadávania podľa typu súboru a podpory multimediálnych súborov spolu s indexovaním na pozadí v režime nízkej priority, v spojení s príjemným rozhraním dáva programu iba silu na získanie dôvery medzi neskúsenými používateľmi.

Oficiálna stránka
Veľkosť distribúcie: 2,6 MbISYS Desktop

Pre zväčšenie kliknite na obrázok

Veľmi výkonný program. Z hľadiska úrovne vybavenia všemožnými funkciami je v zozname niekde blízko ďalšieho vyhľadávača SearchInform. Zároveň je veľkosť inštalačného súboru viac ako 40 Mb! Ťažko povedať, čo by sa dalo napchať do takýchto veľkostí, pretože rovnaký SearchInform s podobnou funkcionalitou zaberá 15 Mb.

Inštalačný proces tu tiež nie je veľmi príjemný, alebo skôr ani proces inštalácie. Ešte pred stiahnutím programu budete vyzvaní na registráciu, inak - nič. Ďalej rozhranie. Je to urobené veľmi pekne, nič nadbytočné nebije do očí, to sú však dojmy človeka, ktorý je už naňho tak trochu zvyknutý. Pre začiatočníka nebude ľahké zistiť, kde a čo je, kam kliknúť a kde nakoniec hľadať. Dôrazne sa odporúča prečítať si nápovedu pred začatím práce – ušetrite si veľa nervov a času. Okrem všetkého ostatného je aj úplná absencia Podpora ruského jazyka v programe. Nie dobré. Okná tu navyše nie sú preťažené ovládačmi, čo však prišlo za cenu viacmodulovosti a použitia prídavných okien. Napríklad vyhľadávacie dotazy sa zadávajú spustením jedného programu a indexy sa spravujú pomocou iného programu. Vyhľadávacie dopyty sa tu zadávajú aj v samostatných, zobrazených poliach. Ťažko povedať, čo je lepšie – preťažené rozhranie alebo všadeprítomné viac okien, skôr je to vec vkusu.

Čo sa týka vytvárania indexov, program poskytuje možnosti na zjednodušenie procesu nastavovania možností pre nový index. Tieto funkcie zahŕňajú niekoľko hotové šablóny na vytváranie indexov v Moje dokumenty, Pošta, Pošta a dokumenty, Špecifický priečinok, Priečinok s vybranými typmi súborov atď. Tieto šablóny uľahčujú vytváranie indexov v prvej fáze. Pomôcka na prácu s indexmi má nie príliš dobré rozhranie, ktoré odstrašuje určitú zložitosť (toto je veľmi subjektívne hodnotenie, aby som bol úprimný), ale ak sa na to pozriete, poskytuje veľa užitočných možností a vo všeobecnosti jeho použitie nespôsobuje veľké ťažkosti. ISYS Desktop je schopný indexovať údaje z rôznych zdrojov údajov a tiež poskytuje mnoho flexibilných nastavení pre takéto indexovanie. Medzi pridané vlastnosti pre indexovanie: podpora pre SQL, FTP, TRIM Context, WORLDOX 2002, skripty. Ak ste pri vytváraní indexu vybrali možnosť „Priečinok s výberom typov súborov“, máte možnosť vybrať typy súborov, ktoré sa majú indexovať, manuálne (podľa prípony). Treba povedať, že podporovaných typov súborov je jednoducho obrovské množstvo, no do existujúceho zoznamu nebude možné pridať vlastný typ (príponu). Môžete si tiež všimnúť prítomnosť plánovača indexovania. ISYS Desktopu trvalo 6 hodín a 13 minút, kým vytvoril index a spracoval 20 gigabajtov informácií, nakoniec ukázal dobrý čas a veľkosť vytvoreného súboru – 7,9 GB.

Vyhľadávacie možnosti tohto programu nie sú zlé. To, čo sa používa v ISYS, je oveľa výkonnejšie ako bežná podpora logických operácií. Z pokročilých funkcií vyhľadávania program ponúka použitie synoným, triediaci filter (podľa cesty, názvu a dátumu vytvorenia súboru). Sada logických operátorov je o niečo širšia ako štandardná sada. Okrem logických operácií vám program umožňuje pracovať s mnohými ďalšími operátormi, ktoré v zásade môžu nahradiť niektoré typy vyhľadávania, napríklad vyhľadávanie s analýzou možno úplne nahradiť použitím špeciálnych operátorov. Veľmi ma prekvapilo, že program nemá vyhľadávanie pomocou morfológie. Toto je vážne opomenutie, pretože pri použití morfologickej analýzy sa výrazne zlepší efektivita vyhľadávania. Okrem toho neexistuje zoznam významných slov, ale existuje rozsiahly zoznam nevýznamných slov. Tiež deklarované funkcie vo vyhľadávaní ako "približné vyhľadávanie" a "heuristická analýza".

ISYS poskytuje na výber niekoľko typov vyhľadávacích dopytov, a to vizuálnych. Robí sa to pomocou rôznych typov okien na zadávanie vyhľadávacích dopytov, v skutočnosti však žiadne okno neumožňuje používať iné technológie ako tie, ktoré sú uvedené vyššie.

Výsledky vyhľadávania sú veľmi informatívne, zobrazujú sa ako zoznam dokumentov zoradených podľa relevantnosti. Nižšie je uvedený náhľad vybraného dokumentu. Na rozdiel od Copernic Desktop Search je tu náhľad k dispozícii iba vo forme čistého textu, nebolo možné dosiahnuť zobrazenie dokumentov v natívnom formáte, či už Word, Html alebo PDF, aj keď to v zásade nie je príliš kritické. Program umožňuje rozdeliť nájdené dokumenty do skupín podľa určitých kritérií (štandardne sú rozdelené podľa relevantnosti). Už nájdené dokumenty si môžete prezerať aj výberom jednotlivých priečinkov (to je užitočné, keď výsledkom je veľmi veľké množstvo dokumentov).

Používanie programu v podnikovej sieti je tiež celkom opodstatnené, pretože poskytuje dobré príležitosti na organizovanie vyhľadávania v sieti. Vyhľadávací systém je založený na vytvorení verejného indexu, ktorý obsahuje indexované údaje z verejných sieťových zdrojov.

V skutočnosti je program od ISYS hodný pozornosti, aspoň sa s ním zoznámiť. Tento program je zrelý projekt s obrovské množstvo funkcie (nie vždy a nie pre každého, samozrejme, sú potrebné, ale predsa). Šanca, že program bude mať nejaké vylepšenia z hľadiska spracovania vyhľadávacích dopytov, nie je známa, ale tento moment možno ho odporučiť na takmer univerzálne použitie. A vzhľadom na to, že pre domáce systémy je stále príliš ťažký, hlavnými miestami jeho inštalácie sú podnikové siete.

Oficiálna stránka:
Veľkosť distribúcie: 40 MbSearchInform

Pre zväčšenie kliknite na obrázok

Asi sa neoplatí začať hneď s popisom rozhrania SearchInform. Najprv by sme mali popísať proces inštalácie, alebo skôr jeden z jeho detailov: bez internetového pripojenia nebudete môcť nainštalovať program. Faktom je, že pred prvým spustením program vyžaduje registráciu používateľa (bezplatne) a odosiela všetky zadané údaje na server. Zdá sa, že vývojári museli prijať takéto opatrenia v boji proti pirátstvu, čo však pozitívne neovplyvnilo jednoduchosť inštalácie.

Rozhranie programu je vytvorené v súlade so všetkými všeobecne uznávanými pravidlami, na prvý pohľad je však trochu ťažkopádne. Pri prvom použití programu sa zdá, že je príliš komplikovaný, niekedy nie je ľahké zapamätať si, na ktorej ponuke alebo karte je požadovaná možnosť, pri dlhšom používaní sa však rozhranie už nezdá byť také hrozne komplikované. Hlavná vec je najprv si prečítať nápovedu.

Po tom, čo ste sa trochu zaoberali rozhraním, môžete začať vytvárať index. Samotný proces je veľmi jednoduchý a rýchlosť indexovania, aj na pohľad, je oveľa vyššia ako u všetkých ostatných vyhľadávačov z recenzie. Jasné čísla testov ukazujú, že SearchInform je dvakrát rýchlejší ako dtSearch a iSYS, pokiaľ ide o rýchlosť indexovania! Poskytnuté dáta v objeme 20 gigabajtov program indexoval v rekordnom čase – 3 hodiny 17 minút. A veľkosť vytvoreného indexu sa ukázala ako najmenšia 4,4 GB - o 100 megabajtov menej ako pri Google Desktop Search.

Program podporuje okrem bežných súborov a priečinkov aj indexovanie e-mailov, pripájanie a indexovanie databáz (!) a iných externých zdrojov (DMS, CRM), hneď pri indexovaní je možné určiť slovník pre morfologické vyhľadávanie a všetky atribúty byť indexované súbory. Po vytvorení indexu, keď sa pokúšate vykonať prvé testovacie vyhľadávanie dokumentov, môže dôjsť k nejasnostiam: "sú tu dva typy vyhľadávania, ale ktorý z nich potrebujem?". Ako už bolo spomenuté, hlavnou vecou je prečítať si pomoc, potom bude všetko jasné. Program je skutočne schopný vykonávať dva typy vyhľadávania – vyhľadávanie fráz a vyhľadávanie dokumentov, ktoré sú obsahovo podobné textu dopytu.

Popis všetkých hlavných funkcií na analýzu vyhľadávacieho dopytu bol uvedený vyššie, takže teraz uvedieme iba možnosti vyhľadávania, ktoré tento program poskytuje. Začnime vyhľadávaním fráz: samozrejme, morfologické vyhľadávanie, vyhľadávanie citátov, logické operácie, vyhľadávanie slovnej parsácie (hľadanie podľa začiatku slova, podľa konca, strednej časti alebo úplnej zhody), zmiešané vyhľadávanie citátov (keď v dokumente musia byť prítomné všetky slová z dopytu, ale nie nevyhnutne v zadanom poradí), vyhľadávanie na opravu chýb, používanie synoným, „hľadanie takmer citátov“ (hľadanie zadanej frázy ako citácie, ale môžu existovať aj iné slová medzi zadanými slovami) atď. Niektoré z uvedených možností majú svoje vlastné špecifické nastavenia. Okrem toho je možné použiť slovník nepodstatných slov a program má už pripravený zoznam týchto slov, na vyhľadávanie môžete použiť aj slovník prioritných slov (samozrejme, budete ho musieť vyplniť seba).

Tu sme v zásade stručne prešli všetkými hlavnými funkciami vyhľadávania fráz.

Prejdime k úvahe o vlastnostiach tohto programu – hľadaniu podobných dokumentov. Vývojári tvrdia, že v žiadnom prípade nejde o jednoduché textové vyhľadávanie, toto je presne „hľadanie podobného“ – tak to všade opisujú, ale dobre, nazvať si to môžete ako chcete – hlavné je. Krátke vyhľadávanie na internete môže rýchlo odhaliť, že takzvané „podobné vyhľadávanie“ je novinkou v oblasti analýzy textu. Tento systém umožňuje nájsť texty, ktoré sú z hľadiska sémantického obsahu podobné. Najpríjemnejšie bolo, že po vykonaní testovacích vyhľadávacích dopytov sa ukázalo, že teória je celkom v súlade s praxou! Program skutočne vyhľadá obsahovo podobné dokumenty a zobrazí ich v zozname zoradené podľa percenta podobnosti.

Ďalej sa pozrime, čo ponúka SearchInform (konkrétne jeho firemná verzia SearchInform Corporate) pre prácu v podnikovej sieti. Existujú dva typy aplikácií: strana servera a strana používateľa. Serverová časť nezávisle spracováva zadané indexy a užívatelia ich môžu použiť na vyhľadávanie v závislosti od pridelených prístupových práv. Používatelia môžu byť nakonfigurovaní automaticky pomocou prihlásenia. Záznamy systému Windows(hovorí odborný jazyk, SearchInform používa overenie Windows NTFS) alebo manuálne (používatelia budú musieť byť pridaní samostatne). Každému používateľovi je možné povoliť alebo zakázať prístup k určitým indexom, používateľov môžete tiež spájať do skupín. Vo všeobecnosti sú nastavenia siete SearchInform pred Google, pokiaľ ide o flexibilitu, a Snoop Server, pokiaľ ide o pohodlie a jednoduchosť.

Oficiálna stránka:
Veľkosť distribúcie: 14,7 Mb Porovnanie rýchlosti indexovania

Vyhľadávací systémČas indexovaniaVeľkosť indexu
Bloodhound Pro Deluxe 4.538 hodín 46 minút19 GB
Isys Desktop 7.06 hodín 13 minút7,9 GB
DtSearch 7.06 hodín 3 minúty8,6 GB
Google Desktop Search Enterprise8 hodín 17 minút4,5 GB
Copernic Desktop Search*10 hodín 51 minút7 GB
SearchInform 1.5.023 hodiny 17 minút4,4 GB

* Väčšinu .html a .txt dokumentov obsahujúcich ruský text, hoci boli indexované, nebolo možné nájsť okrem ich názvov.

Všetky programy si zaslúžia pozornosť.

Na základe testov a dôkladného preskúmania každého programu prezentovaného v prehľade možno vyvodiť určité závery. Vyhľadávanie pomocou programu Google Desktop Search Copernic Desktop Search je teda celkom vhodné pre neskúseného používateľa ako domáci informačný vyhľadávací systém. Robia dobrú prácu s jednoduchými požiadavkami, nezaťažujú používateľa príliš nastaveniami a navyše sú úplne zadarmo. Pokus Google vstúpiť na trh firemných vyhľadávačov zatiaľ nebol úplne opodstatnený: pre plnohodnotnú prácu je potrebné program ovešať ďalšími modulmi a jeho nastavenie nie je ani zďaleka jednoduché. Preto, keď hovoríme o názvoch Desktop Search, že Copernic, že ​​Google za sebou zanecháva výklenok "desktop" vyhľadávačov.

Pravda, výkonnejšie riešenia – dtSearch, iSYS a SearchInform tiež nie sú z ničoho nič a ponúkajú používateľom svoje „desktopové“ verzie. Ale za rozumnú cenu, na rozdiel od bezplatného softvéru od Google a Copernic. Za výkon, rýchlosť a funkčnosť si samozrejme musíte zaplatiť. Vývojári dtSearch, iSYS a SearchInform sa však, samozrejme, zameriavajú hlavne na podnikový sektor. Sieť, funkčnosť, indexovanie a rýchlosť vyhľadávania – to je to, čo odlišuje tieto produkty od ich „konkurentov“. Podľa výsledkov testu bol určený favorit - SearchInform. Program poskytuje možnosť vyhľadávať podobné dokumenty, má najvyššiu rýchlosť indexovania a vyhľadávania a má dobrú sadu funkcií.

Nájsť na internete tie správne a aktuálne informácie je niekedy veľmi ťažké. Množstvo informačného odpadu na webe rastie ako snehová guľa a niekedy je jednoducho nemožné dostať sa k údajom, ktoré skutočne potrebujete, pomocou tradičných služieb Yandex a Google. Kniha, ktorú držíte v rukách, mnohonásobne zvýši efektivitu vášho hľadania informácií na internete. Popisuje techniky, vyhľadávacie stránky a programy na vyhľadávanie špecializovaných informácií. Za moderné druhy internetového vyhľadávania sa považujú: univerzálne vyhľadávanie, vertikálne vyhľadávanie, metavyhľadávacie systémy, budovanie osobných vyhľadávacích nástrojov, vyhľadávanie audiovizuálneho obsahu, vyhľadávanie na skrytom internete. Pre všetky uvažované systémy sú uvedené ich charakteristiky a tipy na čo najefektívnejšie využitie.

Úvod

Vyhľadávanie na internete je dôležitým prvkom práce na webe. Presný počet webových zdrojov moderného internetu je sotva známy nikomu. V každom prípade ide účet do miliárd. Aby ste mohli použiť informácie, ktoré sú v tomto konkrétnom okamihu potrebné, či už na obchodné alebo zábavné účely, musíte ich najskôr nájsť v tomto neustále dopĺňanom oceáne zdrojov. Nie je to vôbec jednoduchá úloha, keďže informácie na modernom webe nie sú štruktúrované, čo spôsobuje problémy pri ich hľadaní. Nie je náhoda, že internetové vyhľadávače sa stali akýmsi „oknám“ do tohto informačného priestoru.

Je nepravdepodobné, že medzi používateľmi internetu budú ľudia, ktorí nikdy nepoužívali veľké univerzálne vyhľadávače. Názvy Google, Yandex a niekoľko ďalších veľkých strojov sú na perách každého. Ide im to skvele denné úlohy Internetové vyhľadávanie a používatelia sa často ani nepokúšajú hľadať náhradu. Zároveň je počet internetových vyhľadávačov v našej dobe v tisícoch. Dôvody takejto rozmanitosti alternatívnych strojov majú rôzne korene. Niektoré projekty sa snažia priamo konkurovať lídrom globálneho trhu prostredníctvom starostlivej práce s národnými internetovými zdrojmi. Iné ponúkajú funkcie dotazovania, ktoré sa nenachádzajú v zavedených vyhľadávačoch. Značný počet alternatívnych strojov sa špecializuje na vyhľadávanie konkrétnej oblasti alebo konkrétneho typu obsahu, pričom pri riešení týchto problémov dosahuje pôsobivé výsledky. Nech je to akokoľvek, zaradenie takýchto vyhľadávačov do vlastného arzenálu internetových vyhľadávacích nástrojov môže výrazne zlepšiť jeho kvalitu. Tu je však jedna nuance: musíte vedieť o takýchto strojoch a byť schopní využiť ich schopnosti.

Predpokladáme, že čitatelia tejto knihy už celkom dobre poznajú techniku ​​vyhľadávania pomocou univerzálnych vyhľadávačov. Tak dobré, že pocítili obmedzenia spojené s ich používaním. S najväčšou pravdepodobnosťou sa takíto ľudia už pokúsili hľadať a aplikovať určité dodatočné nástroje. Tlačené slovo neobchádza ani tému vyhľadávania na internete: pravidelne sa objavujú články a vychádzajú knihy. Ale hrdinovia, ktorých majú, sú spravidla rovnakí - niekoľko popredných univerzálnych vyhľadávačov. Naša kniha je iná v tom, že sa pokúša pokryť celú škálu moderných riešení vyhľadávania. Nájdete tu popisy a odporúčania na využívanie najlepších moderných služieb zameraných na riešenie najbežnejších úloh vyhľadávania. Táto kniha je pre ľudí, ktorí veľa pracujú na internete a používajú web na hľadanie informácií, ktoré potrebujú – či už ide o podnikanie, štúdium alebo hobby.

Aby bolo vyhľadávanie na internete úspešné, musia byť splnené dve podmienky: otázky musia byť dobre formulované a musia byť kladené na vhodných miestach. Inými slovami, od používateľa sa vyžaduje na jednej strane schopnosť preložiť svoje záujmy vyhľadávania do jazyka vyhľadávacieho dopytu a na druhej strane dobrá znalosť vyhľadávacích nástrojov, dostupných vyhľadávacích nástrojov, ich výhod a nevýhody, ktoré umožnia výber najvhodnejších vyhľadávacích nástrojov v každom konkrétnom prípade.

V súčasnosti neexistuje jediný zdroj, ktorý by spĺňal všetky požiadavky na vyhľadávanie na internete. Preto so serióznym prístupom k vyhľadávaniu musíte nevyhnutne použiť rôzne nástroje, pričom každý použijete v najvhodnejšom prípade.

Kapitola 1

Univerzálne internetové vyhľadávače

Univerzálne internetové vyhľadávače sú hlavným a najznámejším prostriedkom vyhľadávania na internete. Takéto vyhľadávače poskytujú maximálne pokrytie rôznych zdrojov. Ide o univerzálny typ, ktorý zahŕňa najväčšie a najpopulárnejšie vyhľadávače. Ide o skutočne výkonné riešenia s množstvom funkcií a nástrojov, o ktorých veľa používateľov často nevie. Pochopenie funkcií a možností univerzálneho vyhľadávania vám umožní zistiť silné stránky a slabé stránky takéto systémy a vedome si vyberajú najefektívnejšie vyhľadávacie nástroje.

Trh univerzálnych vyhľadávačov je pomerne veľký. V tejto kapitole sa budeme zaoberať iba najvýkonnejšími strojmi, ktoré dokážu primerane pracovať s dopytmi v ruštine. Kapitola sa otvára príbehmi o lídroch ruského vyhľadávania - systémoch Google.ru a Yandex. O každom z týchto vyhľadávačov boli napísané knihy a množstvo článkov. Zameriame sa na hlavné charakteristiky, ktoré sú pre koncového užívateľa dôležité a pokúsime sa identifikovať aj ich silné stránky.

Sprevádza ich nový vyhľadávač vyvinutý spoločnosťou Microsoft Corporation - systém Bing, ktorý bol doteraz citeľne ochudobnený o pozornosť, ako aj užitočný a pomerne výkonný vyhľadávač Exalead, ktorého výhodou je dobrá podpora vyhľadávanie v európskych internetových zdrojoch. Tento systém- je stále vzácnym hosťom vo vyhľadávacom arzenáli našich používateľov, takže sa o ňom uvažuje podrobnejšie ako o ostatných.

V tejto kapitole pri recenzovaní systémy Google a Yandex, zameriame sa len na možnosti vyhľadávania na webe a vyhľadávanie v špecializovaných databázach týchto projektov je popísané v nasledujúcich kapitolách o vyhľadávaní obrázkov a videí. Pri iných univerzálnych vyhľadávačoch sú informácie o multimediálnom vyhľadávaní uvedené hneď po zoznámení sa s nimi.

Keďže traja zo štyroch hrdinov tejto kapitoly sú cudzieho pôvodu, hneď poznamenávame, že analyzujeme len možnosti ich ruských verzií. Faktom je, že niektoré funkcie zahraničných systémov, najmä experimentálnych, sú často dostupné iba v pôvodných, spravidla anglických verziách služieb.

Google

Vyhľadávač Google je zaslúžene považovaný za svetového lídra v modernom vyhľadávaní na internete. Založená v roku 1998 Google dodnes patrí medzi popredných udávateľov trendov v oblasti internetového vyhľadávania a webových služieb.

Vývojári Google sa vždy vyznačovali zvýšenou pozornosťou venovanou zlepšovaniu algoritmov ich vyhľadávacieho nástroja, ako aj primeraným konzervativizmom v tejto oblasti. užívateľské rozhranie. Možnosti zostavenia dopytu na Google možno nazvať klasickými a akýmsi štandardom sa stali aj spôsoby zobrazovania výsledkov vyhľadávania. Nedávno Google Developers urobil v týchto oblastiach veľké zmeny - najväčší vyhľadávač začal na pozadí mladých konkurentov vyzerať príliš staromódne.

Google má jednu z najväčších indexových báz na svete, ktorá poskytuje široké pokrytie informačných zdrojov. Informácie indexu Google sú zhrnuté v niekoľkých vertikálnych základoch. Okrem najznámejšej webovej databázy sú to viaceré multimediálne databázy (Obrázky, Videá), pracujúce so zdrojmi relevantných informácií a správ na RSS feedoch, databáza News, ako aj databáza Blogy indexujúca online denníky. Okrem toho Google ponúka širokú škálu dodatočných zdrojov, medzi ktorými stojí za zmienku mapová služba, adresár stránok a služba otázok a odpovedí. Tieto zdroje možno považovať aj za vyhľadávacie nástroje.

Vo webovej databáze Google ponúka jednoduché a pokročilé režimy vyhľadávania na zostavenie dopytu. Iba v režime jednoduchého vyhľadávania z doplnkových nástrojov virtuálna klávesnica. Pokročilé vyhľadávanie ponúka viac možností. Keďže formulár pre rozšírené vyhľadávanie je dostupný takmer vo všetkých vyhľadávacích produktoch Google, zastavme sa pri ňom podrobnejšie (obr. 1.1).

Yandex

Vyhľadávací nástroj Yandex, ktorý bol oficiálne predstavený širokej verejnosti v roku 1997, sa úspešne rozvinul a o desať rokov neskôr sa po prvýkrát zaradil medzi desať najväčších vyhľadávačov na svete. V ruskom segmente internetu si vydobyl vedúce postavenie, ktorého sa napriek rastúcej konkurencii nehodlá vzdať. Charakteristickými črtami Yandexu od začiatku jeho existencie boli jeho vlastné pôvodné algoritmy na určovanie relevantnosti výsledkov vyhľadávania, flexibilné nástroje na prácu s textom dopytu a pri ich spracovaní zohľadňovali zvláštnosti morfológie ruského jazyka.

Yandex sa spolieha na svoje vlastné indexové databázy. Okrem prehľadávania webových dokumentov ponúka systém dobrý výber špecializovaných zdrojov a doplnkových služieb. Yandex v súčasnosti pracuje s obrázkami, videami, správami, blogmi a slovníkmi. Výkonné možnosti vyhľadávania sú tiež súčasťou našej vlastnej kartografickej služby a systému vyhľadávania produktov. Okrem toho Yandex spravuje svoj vlastný katalóg webových stránok. Silný bod Yandex je vyvinutý lokálny vyhľadávací program, ktorý je obzvlášť dôležitý pre našich používateľov. Yandex poskytuje prístup k svojim databázam vývojárom tretích strán. Výsledkom je, že mnoho ruských projektov alternatívneho internetového vyhľadávania využíva zdroje Yandex tak či onak. Okrem bežného vyhľadávacieho systému je ponúkaná aj skrátená verzia Yandex, dostupná na ya.ru. Rozhranie tejto verzie pozostáva len zo vstupného poľa dotazu a tlačidla spustenia vyhľadávania.

Vyhľadávanie dokumentov na webe ponúka jednoduché aj pokročilé režimy vyhľadávania. Jednoduché vyhľadávanie neposkytuje žiadne filtre, čo je kompenzované schopnosťou automaticky analyzovať dopyty v prirodzenom jazyku, sebavedomým spracovaním relatívne dlhých dopytov a systémom automatického dokončovania dopytov. Maximálna dĺžka dopytu je štyridsať slov.

Pokročilý vyhľadávací formulár na zostavenie dopytu ponúka iba jedno pole. Logické operátory spájajúce dopytové slová sa odporúčajú zadávať manuálne, dobre. Yandex má pomerne podrobný dopytovací jazyk. Ostatné nástroje formulárov rozšíreného vyhľadávania sú rôzne filtre (1.4).

Bing

Históriu internetového vyhľadávania od spoločnosti Microsoft nie je ľahké zavolať. Verejne dôsledne ponúkané služby opakovane menili algoritmy, používané databázy a samozrejme aj názvy. Až do začiatku 2000-tych rokov vyhľadávač nemal svoje vlastné databázy a pracoval s externými indexmi od AltaVista, Inktomi a Looksmart. Pôvodný názov MSN Search sa používal do roku 2006 a potom sa na niekoľko rokov zmena názvov vyhľadávača stala pre Microsoft tradíciou.

Spolu s posledným prechodom na vyhľadávanie vo vlastných indexoch sa MSN Search najprv premenoval na Windows LiveLive Search. Nakoniec začiatkom leta 2009 bolo živé vyhľadávanie nahradené novým vyhľadávacím projektom Bing.

„Bing poskytne iný spôsob nazerania na informácie na internete a pomôže používateľom robiť dôležité rozhodnutia,“ začala tlačová správa Microsoftu o spustení Bingu takýmto vyhlásením. Ašpirácie vývojárov boli pochopiteľné: vyhľadávacie nástroje od spoločnosti Microsoft, napriek všetkému úsiliu, boli na Západe v popularite neustále nižšie ako lídri - Google a Yahoo!. Ak hovoríme o ruských jazykových verziách predchádzajúcich vyhľadávacích projektov spoločnosti Microsoft, potom z hľadiska počtu a kvality nájdených odkazov boli oveľa horšie ako veľké ruské vyhľadávače. V snahe dobehnúť konkurentov sa vývojári Bing spoliehali na zlepšenie kvality vyhľadávania a zavedenie nových technológií, z ktorých mnohé získali spolu s firmami, ktoré ich vytvorili.

Treba poznamenať, že Ruská verzia Bing, rovnako ako väčšina ostatných lokalizovaných verzií, nemá množstvo ďalších funkcií, ako napríklad vyhľadávanie v obchode. Keďže v skutočnosti fungujú iba na severe. Amerika, nemá zmysel sa nimi podrobne zaoberať.

Exalead

Jednou z čŕt Európy, a to aj v oblasti internetového vyhľadávania, je veľký počet národných jazykov. Vyhľadávač, ktorý o sebe tvrdí, že je lídrom v Európe, je jednoducho povinný dobre indexovať národné segmenty internetu a kvalitne spracovávať dopyty v mnohých európskych jazykoch, najväčších aj menej bežných. Práve v tejto oblasti môže byť európsky rozvoj vážny konkurenčná výhoda v porovnaní s mocnými zámorskými konkurentmi. Systém Exalead sa v súčasnosti vážne hlási k úlohe takéhoto európskeho vyhľadávača. Tento projekt bol vyvinutý ako súčasť výskumného programu Quaere financovaného Európskou úniou.

Exalead má svoje vlastné indexové databázy. Hlavnými vyhľadávacími zdrojmi systému sú databázy webových dokumentov, obrázkov, videí a noviniek. úvodná stránka Exalead ponúka príležitosť personalizácia. Na túto stránku môžete umiestniť odkazy na svoje obľúbené stránky - zobrazia sa ako grafické miniatúry-snímky obrazovky. Je pravda, že na to si budete musieť bezplatne zaregistrovať účet a povoliť prehliadaču ukladať súbory cookie Exalead.

Exalead Web Search ponúka jednoduché a pokročilé režimy vyhľadávania. Formulár rozšíreného vyhľadávania, podobne ako v Bing, sa otvára priamo na stránke vydania. Upozorňujeme, že Exalead neponúka len známy formulár so sadou ďalších polí, ale aj komplexnú rozbaľovaciu ponuku, ktorá funguje ako sprievodca na spresnenie dotazu (obr. 1.7). Keď vyberiete jednu alebo druhú položku v ponuke sprievodcu, do reťazca dotazu sa pridajú nové prvky a v prípade potreby aj operátory a špeciálne znaky.

Úvod

V súčasnosti internet spája stovky miliónov serverov, ktoré sú hostiteľmi miliárd rôznych stránok a jednotlivých súborov obsahujúcich rôzne druhy informácií. Je to obrovské úložisko informácií. Existujú rôzne spôsoby vyhľadávania informácií na internete.

Vyhľadajte podľa známej adresy. Požadované adresy sú prevzaté z adresárov. Ak poznáte adresu, stačí ju zadať adresný riadok Prehliadač.

Príklad 1. www.gov.ru - server štátnych orgánov Ruska.

Konštrukcia adresy používateľom. Keď poznáte systém generovania internetových adries, môžete vytvárať adresy pri vyhľadávaní webových stránok.

Ku kľúčovému slovu je potrebné pridať tematickú alebo geografickú doménu (názov firmy, podniku, organizácie alebo jednoduché anglické podstatné meno) a musí sa prepojiť intuícia.

Príklad 2 Adresy komerčných webových stránok:

www.samsung.com SAMSUNG),

www.mtv.com (hudobné správy MTV).

Príklad 3. Adresy vzdelávacích inštitúcií:

www.ntu.edu (Národná univerzita USA).

Vyhľadávače internet

Na vyhľadávanie informácií na internete boli vyvinuté špeciálne systémy na vyhľadávanie informácií. Vyhľadávače majú bežnú adresu a zobrazujú sa ako webová stránka obsahujúca špeciálne nástroje na organizáciu vyhľadávania (hľadací reťazec, predmetový katalóg, odkazy). Ak chcete zavolať vyhľadávač, stačí zadať jeho adresu do panela s adresou v prehliadači.

Podľa štatistickej služby LiveInternet.ru je distribúcia vyhľadávacích nástrojov v Rusku približne takáto:

2) Google – 35,0 %

3) Vyhľadávanie na Mail.ru – 8,3 %

4) Rambler – 0,9 %

Podľa spôsobu organizácie informácií sa systémy na vyhľadávanie informácií delia na dva typy: klasifikačné (rubrikátory) a slovníky.

Rubrikátory (klasifikátory)- vyhľadávače, ktoré využívajú hierarchickú (stromovú) organizáciu informácií. Pri vyhľadávaní informácií používateľ prezerá tematické nadpisy a postupne zužuje vyhľadávacie pole (ak napríklad potrebujete nájsť význam slova, musíte najskôr nájsť slovník v klasifikátore a potom nájsť správne slovo v ňom).



Slovníkové vyhľadávače sú výkonné automatické softvérové ​​a hardvérové ​​systémy. S ich pomocou sa prezerajú (skenujú) informácie na internete. Údaje o umiestnení tejto alebo tej informácie sa vkladajú do špeciálnych referenčných kníh-indexov. Ako odpoveď na požiadavku sa vykoná vyhľadávanie v súlade s reťazcom dopytu. V dôsledku toho sa používateľovi ponúknu tie adresy (URL), na ktorých sa v čase skenovania našlo hľadané slovo alebo skupina slov. Výberom ktoréhokoľvek z navrhovaných odkazov môžete prejsť na nájdený dokument. Väčšina moderných vyhľadávačov je zmiešaná.

Najznámejšie a najpopulárnejšie vyhľadávače:

Existujú systémy, ktoré sa špecializujú na vyhľadávanie informačné zdroje v rôznych smeroch.

https://my.mail.ru

https://ru-ru.facebook.com

https://twitter.com

https://www.tumblr.com

https://www.instagram.com atď.

Predmetové vyhľadávače:

Softvérové ​​vyhľadávanie:

Katalógy (tematické zbierky odkazov s anotáciami):

http://www.atrus.ru

Pravidlá vykonávania dotazov

V každom vyhľadávači v časti Pomocník môžete získať informácie o tom, ako hľadať, ako zostaviť reťazec dopytu. Nižšie sú uvedené informácie o typickom „priemernom“ jazyku dopytov.

Jednoduchá žiadosť

Zadajte jedno slovo, ktoré definuje tému vyhľadávania. Napríklad vo vyhľadávači Rambler.ru stačí zadať: automatizácia.

Nájdené sú dokumenty, ktoré obsahujú slová uvedené v žiadosti. Všetky formy ruských slov sú uznávané, spravidla sa ignorujú písmená.

V dotaze môžete použiť znak „*“ alebo „?“. Podpísať "?" v kľúčovom slove sa nahrádza jeden znak, namiesto ktorého je možné nahradiť ľubovoľné písmeno a znak „*“ je postupnosť znakov.

Napríklad dopytovací automat* nájde dokumenty, ktoré obsahujú slová automatický, automatický atď.

Zložitý dotaz

Často je potrebné kombinovať Kľúčové slová pre konkrétnejšie informácie. V tomto prípade sa používajú ďalšie spojovacie slová, funkcie, operátory, symboly, kombinácie operátorov oddelené zátvorkami.

Napríklad dopyt hudba & (beatles beatles) znamená, že používateľ hľadá dokumenty obsahujúce slová hudba a beatles alebo hudba a beatles.

Zoznam vyhľadávacích serverov a adresárov

Adresa Popis
www.excite.com Vyhľadávač s recenziami uzlov a sprievodcami
www.alta-vista.com Vyhľadávací server, dostupné možnosti rozšíreného vyhľadávania
www.hotbot.com vyhľadávací server
www.ifoseek.com Vyhľadávací server (jednoduché použitie)
www.ipl.org Internet Publik library, verejná knižnica fungujúca v rámci projektu World Village
www.wisewire.com WiseWire – organizácia vyhľadávania pomocou umelej inteligencie
www.webcrawler.com WebCrawler - vyhľadávací server, jednoduché použitie
www.yahoo.com Webový katalóg a rozhranie pre prístup k fulltextovému vyhľadávaniu na serveri AltaVista
www.aport.ru Aport - ruský vyhľadávací server
www.yandex.ru Yandex - vyhľadávací server v ruskom jazyku
www.rambler.ru Rambler - vyhľadávací server v ruskom jazyku
Internetové zdroje pomoci
www.yellow.com Zlaté stránky internetu
monk.newmail.ru Vyhľadávače rôznych profilov
www.top200.ru 200 najlepších webových stránok
www.allru.net
www.ru Katalóg ruských internetových zdrojov
www.allru.net/z09.htm Vzdelávacie zdroje
www.students.ru Ruský študentský server
www.cdo.ru/index_new.asp Centrum dištančného vzdelávania
www.open.ac.uk Otvorená univerzita UK
www.ntu.edu Americká národná univerzita
www.translate.ru Elektronický textový prekladač
www.pomorsu.ru/guide.library.html Zoznam odkazov na sieťové knižnice
www.elibrary.ru Vedecká elektronická knižnica
www.citforum.ru E-knižnica
www.infamed.com/psy Psychologické testy
www.pokoleniye.ru Webová stránka Federácie internetového vzdelávania
www.metod.narod.ru Vzdelávacie zdroje
www.spb.osi.ru/ic/distant Dištančné vzdelávanie na internete
www.examen.ru Skúšky a testy
www.kbsu.ru/~book/ Učebnica informatiky
Mega.km.ru Encyklopédie a slovníky

Profesionálne vyhľadávanie informácií na internete

Vyhľadávanie informácií je jedným z najbežnejších a zároveň najbežnejších náročné úlohy s ktorými sa musí každý používateľ na webe vysporiadať. Ak je však pre bežného člena sieťovej komunity znalosť efektívnych metód získavania informácií žiaducou, no zďaleka nie povinnou kvalitou, tak pre informačných profesionálov je schopnosť rýchlo sa orientovať v zdrojoch internetu a nájsť požadované zdroje jednou z možností. základné kvalifikačné zručnosti.

Príčinu ťažkostí, ktoré vznikajú pri získavaní informácií na internete, určujú dva hlavné faktory. Po prvé, počet zdrojov na webe je extrémne veľký. Na konci roka 2001 najhrubšie odhady uvádzali približné číslo 7,5 miliardy dokumentov umiestnených na serveroch po celom svete. Po druhé, množstvo informácií na webe je nielen kolosálne, ale aj mimoriadne dynamické. Za pol minúty, ktorú ste strávili čítaním prvých riadkov tejto časti, sa vo virtuálnom vesmíre objavilo asi sto nových alebo zmenených dokumentov, desiatky sa presunuli na nové adresy a jednotky navždy prestali existovať. Internet nikdy „nespí“, tak ako nikdy „nespí“ naša planéta, po ktorej sa nepretržite valí vlna ľudskej podnikateľskej činnosti presne v súlade so zmenou časových pásiem.

Na rozdiel od stabilnej a kontrolovanej zbierky dokumentov v knižnici sa na webe stretávame s obrovským a neustále sa meniacim informačným súborom, v ktorom je vyhľadávanie údajov veľmi, veľmi zložitý proces. Situácia často veľmi pripomína známu úlohu hľadania ihly v kope sena a niekedy informácie veľkej hodnoty zostávajú nevyžiadané len kvôli ťažkostiam pri ich hľadaní.

Väčšina používateľov globálnej počítačové siete. Amatéri aj profesionáli často používajú rovnaké nástroje. Výsledky rešerší a čas strávený pri nich sa však do značnej miery líšia.

Účelom tejto časti je podrobne sa zoznámiť s nástrojmi a metódami získavania informácií a rozvíjať udržateľné zručnosti pre profesionálne vyhľadávanie na webe všetkých typov údajov: od textov v akomkoľvek formáte až po video a animáciu.