Domov Otázky Profesionální vyhledávání informací na internetu. Přehled programů pro vyhledávání dokumentů a dat Automatické vyhledávání informací na internetu

Profesionální vyhledávání informací na internetu. Přehled programů pro vyhledávání dokumentů a dat Automatické vyhledávání informací na internetu

Co je to

DuckDuckGo je poměrně známý open source vyhledávač. zdrojový kód. Servery jsou umístěny v USA. Kromě vlastního robota využívá vyhledávač výsledky dalších zdrojů: Yahoo, Bing, Wikipedia.

Ten lepší

DuckDuckGo se staví jako dokonalé vyhledávání soukromí a soukromí. Systém neshromažďuje žádná data o uživateli, neukládá protokoly (žádná historie vyhledávání), používání cookies maximálně omezený.

DuckDuckGo neshromažďuje ani nesdílí osobní údaje od uživatelů. Toto jsou naše zásady ochrany osobních údajů.
Gabriel Weinberg, zakladatel DuckDuckGo

Proč to potřebuješ?

Všechny velké vyhledávače se snaží personalizovat výsledky vyhledávání na základě údajů o osobě před monitorem. Tento jev se nazývá „filtrační bublina“: uživatel vidí pouze ty výsledky, které jsou v souladu s jeho preferencemi nebo které systém za takové považuje.

Vytváří objektivní obrázek, který nezávisí na vašem minulém chování na webu, a eliminuje tématiku google reklamy a "Yandex", na základě vašich požadavků. S pomocí DuckDuckGo je snadné vyhledávat informace v cizích jazycích, zatímco Google a Yandex ve výchozím nastavení preferují rusky psané stránky, i když je dotaz zadán v jiném jazyce.

Co je to

not Evil je systém, který prohledává anonymní síť Tor. Chcete-li jej použít, musíte do této sítě přejít například spuštěním specializovaného .

not Evil není jediným vyhledávačem svého druhu. K dispozici je LOOK (výchozí vyhledávání v prohlížeči Tor, přístupné z běžného internetu) nebo TORCH (jeden z nejstarších vyhledávačů v síti Tor) a další. Rozhodli jsme se ne Zlo kvůli nezaměnitelné narážce na Google (stačí se podívat na úvodní stránku).

Ten lepší

Hledá, kam má Google, Yandex a další vyhledávače zásadně přístup.

Proč to potřebuješ?

V síti Tor je mnoho zdrojů, které nelze nalézt na internetu, který dodržuje zákony. A jejich počet poroste s tím, jak se zpřísní kontrola úřadů nad obsahem webu. Tor je druh sítě v rámci webu se svými sociálními sítěmi, sledovači torrentů, médii, obchodní platformy, blogy, knihovny a tak dále.

3. YaCy

Co je to

YaCy je decentralizovaný vyhledávač, který funguje na principu P2P sítí. Každý počítač, který má primární softwarový modul, prohledává internet sám o sobě, to znamená, že jde o obdobu vyhledávacího robota. Získané výsledky jsou shromažďovány ve společné databázi, kterou využívají všichni účastníci YaCy.

Ten lepší

Zde je těžké říci, zda je to lepší nebo horší, protože YaCy je zcela odlišný přístup k organizaci vyhledávání. Neexistence jediného serveru a společnosti vlastníka činí výsledky zcela nezávislými na preferencích kohokoli. Autonomie každého uzlu vylučuje cenzuru. YaCy je schopen prohledávat hluboký web a neindexované veřejné sítě.

Proč to potřebuješ?

Pokud jste zastáncem open source a internet zdarma, není ovlivněn vládními agenturami a velkými korporacemi, pak je YaCy vaší volbou. Lze jej také použít k organizaci vyhledávání v rámci podnikové nebo jiné autonomní sítě. A přestože YaCy není v každodenním životě příliš užitečný, je z hlediska procesu vyhledávání hodnou alternativou k Google.

4. Pipl

Co je to

Pipl je systém určený k vyhledávání informací o konkrétní osobě.

Ten lepší

Autoři Pipl tvrdí, že jejich specializované algoritmy vyhledávají efektivněji než „běžné“ vyhledávače. Upřednostňují se zejména profily sociální sítě, komentáře, seznamy účastníků a různé databáze, kde jsou zveřejňovány informace o lidech, např. databáze soudních rozhodnutí. Vedení Pipl v této oblasti potvrzují Lifehacker.com, TechCrunch a další publikace.

Proč to potřebuješ?

Pokud potřebujete najít informace o osobě žijící v USA, pak bude Pipl mnohem efektivnější než Google. Databáze ruských soudů jsou zjevně pro vyhledávač nepřístupné. S občany Ruska si proto tak dobře neporadí.

Co je to

FindSounds je další specializovaný vyhledávač. Vyhledává v otevřených zdrojích různé zvuky: dům, příroda, auta, lidé atd. Služba nepodporuje požadavky v ruštině, ale existuje působivý seznam značek v ruském jazyce, které můžete vyhledat.

Ten lepší

Ve vydávání pouze zvuků a nic víc. V nastavení si můžete nastavit požadovaný formát a kvalitu zvuku. Všechny nalezené zvuky jsou k dispozici ke stažení. Existuje vyhledávání vzorů.

Proč to potřebuješ?

Pokud potřebujete rychle najít zvuk výstřelu z muškety, ránu sajícího datla nebo výkřik Homera Simpsona, pak je tato služba určena právě vám. A to jsme vybrali pouze z dostupných ruskojazyčných dotazů. Na anglický jazyk spektrum je ještě širší.

Vážně, specializovaná služba znamená specializované publikum. Přijde ale vhod i vám?

Co je to

Wolfram|Alpha je výpočetní vyhledávač. Místo odkazů na články obsahující klíčová slova dává hotovou odpověď na dotaz uživatele. Pokud například zadáte do vyhledávacího formuláře „porovnat populaci New Yorku a San Francisca“ v angličtině, Wolfram|Alpha okamžitě zobrazí tabulky a grafy s porovnáním.

Ten lepší

Tato služba je lepší než ostatní pro vyhledávání faktů a výpočet dat. Wolfram|Alpha shromažďuje a systematizuje znalosti dostupné na webu různé oblasti včetně vědy, kultury a zábavy. Pokud tato databáze obsahuje připravenou odpověď na vyhledávací dotaz, systém ji zobrazí, pokud ne, spočítá a zobrazí výsledek. V tomto případě uživatel vidí jen a nic víc.

Proč to potřebuješ?

Pokud jste například student, analytik, novinář nebo výzkumník, můžete použít Wolfram|Alpha k vyhledání a výpočtu dat souvisejících s vašimi aktivitami. Služba nerozumí všem požadavkům, ale neustále se vyvíjí a je chytřejší.

Co je to

Metasearch engine Dogpile zobrazuje kombinovaný seznam výsledků z vyhledávačů. Google SERPs, Yahoo a další populární systémy.

Ten lepší

Za prvé, Dogpile zobrazuje méně reklam. Za druhé, služba používá k nalezení a zobrazení speciální algoritmus nejlepší skóre z různých vyhledávačů. Podle vývojářů Dogpile jejich systém generuje nejúplnější problém na celém internetu.

Proč to potřebuješ?

Pokud nemůžete najít informace na Googlu nebo jiném standardním vyhledávači, vyhledejte je v několika vyhledávačích najednou pomocí Dogpile.

Co je to

BoardReader je textový vyhledávací systém pro fóra, služby Q&A a další komunity.

Ten lepší

Služba umožňuje zúžit pole vyhledávání na sociální stránky. Díky speciálním filtrům můžete rychle najít příspěvky a komentáře, které odpovídají vašim kritériím: jazyk, datum vydání a název webu.

Proč to potřebuješ?

BoardReader může být užitečný pro PR specialisty a další mediální profesionály, kteří se zajímají o názor masmédií na určité otázky.

Konečně

Život alternativních vyhledávačů je často pomíjivý. Lifehacker se zeptal bývalého generálního ředitele ukrajinské pobočky společnosti Yandex Sergeje Petrenka na dlouhodobé vyhlídky takových projektů.

Sergej Petrenko

Bývalý generální ředitel společnosti Yandex.Ukraine.

Pokud jde o osud alternativních vyhledávačů, je jednoduchý: být velmi úzce specializovanými projekty s malým publikem, tedy bez jasných komerčních vyhlídek, nebo naopak s naprostou jasností jejich absence.

Když se podíváte na příklady v článku, můžete vidět, že takové vyhledávače se buď specializují na úzkou, ale poptávanou niku, která se snad jen zatím nerozrostla natolik, aby byla patrná na radarech Googlu nebo Yandexu, nebo testují původní hypotézu v hodnocení, která zatím není použitelná v konvenčním vyhledávání.

Pokud se například náhle ukáže, že vyhledávání Tor je žádané, to znamená, že alespoň procento publika Google bude potřebovat výsledky odtud, pak samozřejmě běžné vyhledávače začnou řešit problém, jak najděte je a ukažte je uživateli. Pokud chování publika ukazuje, že se zdá, že značná část uživatelů ve značném počtu dotazů má relevantnější výsledky, data bez zohlednění faktorů, které závisí na uživateli, pak Yandex nebo Google začnou poskytovat takové výsledky.

„Být lepší“ v kontextu tohoto článku neznamená „být lepší ve všem“. Ano, v mnoha ohledech jsou naši hrdinové daleko od Yandexu (dokonce daleko od Bingu). Ale každá z těchto služeb dává uživateli něco, co giganti z vyhledávacího průmyslu nemohou nabídnout. Určitě také znáte podobné projekty. Podělte se s námi - pojďme diskutovat.

PROFESIONÁLNÍ VYHLEDÁVÁNÍ INFORMACÍ NA INTERNETU

Aby bylo vyhledávání na internetu úspěšné, musí být splněny dvě podmínky: dotazy musí být dobře formulovány a musí být kladeny na vhodných místech. Jinými slovy, od uživatele se na jedné straně vyžaduje, aby byl schopen přeložit své vyhledávací zájmy do daného jazyka vyhledávací dotaz, a na druhé straně dobrá znalost vyhledávačů, dostupných vyhledávacích nástrojů, jejich výhod a nevýhod, které vám umožní vybrat si v každém konkrétním případě ty nejvhodnější vyhledávací nástroje.

V současné době neexistuje jediný zdroj, který by vyhovoval všem požadavkům na vyhledávání na internetu. Proto se seriózním přístupem k vyhledávání musíte nevyhnutelně použít různé nástroje, přičemž každý použijete v nejvhodnějším případě.

Hlavní nástroje pro vyhledávání na internetulze rozdělit do následujících hlavních skupin:

vyhledávače;

Webové adresáře;

referenční zdroje;

Místní programy pro vyhledávání na internetu.

Nejoblíbenějším vyhledávačem jevyhledávače- tzv. internetové vyhledávače (Search Engines). První tři lídři v celosvětovém měřítku jsou poměrně stabilní – to jsou Google, Yahoo! a Bing. Mnoho zemí přidává do tohoto seznamu své vlastní místní vyhledávače optimalizované pro místní obsah. S jejich pomocí můžete teoreticky najít jakékoli konkrétní slovo na stránkách mnoha milionů webů. Z pohledu uživatele je hlavní nevýhodou vyhledávačů nevyhnutelná přítomnostinformační šumve výsledcích. Takto je zvykem nazývat výsledky, které jsou z toho či onoho důvodu zahrnuty v seznamu výsledků, které neodpovídají dotazu.

Přes mnohé odlišnosti fungují všechny internetové vyhledávače na podobných principech a z technického hlediska se skládají z podobných subsystémů. První strukturální část vyhledávače - speciální programy, sloužící k automatickému vyhledávání a následnému indexování webových stránek. Takové programy se obvykle nazývají pavouci nebo roboti. Prohlížejí si kód webových stránek, nacházejí odkazy na nich umístěné, a tak objevují nové webové stránky. Jsou tu také alternativní způsob zařazení webu do indexu. Mnoho vyhledávačů nabízí vlastníkům zdrojů možnost přidat web do své databáze samostatně. Ať je to jakkoli, webové stránky se stahují, analyzují a indexují. Zvýrazňují se v nich strukturní prvky, nalézají se klíčová slova, určují se jejich vazby na jiné stránky a webové stránky. Provádějí se i další operace, jejichž výsledkem je vytvoření indexové báze vyhledávače. Tato základna je druhým hlavním prvkem každého vyhledávače. V současnosti neexistuje jedna absolutně kompletní indexová databáze, která by obsahovala informace o veškerém obsahu internetu. Vzhledem k tomu, že různé vyhledávače používají různé programy pro vyhledávání webových stránek a vytvářejí svůj index pomocí různých algoritmů, mohou se základny indexů vyhledávačů výrazně lišit. Některé stránky jsou indexovány více vyhledávači, ale vždy je určité procento zdrojů obsaženo v databázi pouze jednoho vyhledávače. Skutečnost, že každý vyhledávač má tak originální a nepřekrývající se část indexu, vám umožňuje učinit důležitý praktický závěr: pokud používáte pouze jeden vyhledávač, byť ten největší, určitě přijdete o určité procento užitečných odkazů .

Další částí internetového vyhledávače je vlastní vyhledávací a třídící program. Tyto programy řeší dva hlavní úkoly: nejprve najdou v databázi stránky a soubory, které odpovídají příchozímu požadavku, a poté seřadí výsledné pole dat podle různých kritérií. Úspěch při dosahování cílů hledání do značné míry závisí na efektivitě jejich práce.

Posledním prvkem internetového vyhledávače je uživatelské rozhraní. Kromě běžných požadavků na estetiku a pohodlí pro jakýkoli web mají rozhraní vyhledávačů ještě jeden důležitý požadavek: musí nabízet různé nástroje pro sestavování a zpřesňování dotazů a také řazení a filtrování výsledků. Výhodou vyhledávačů je výborné pokrytí zdrojů, poměrně rychlá aktualizace obsahu databáze a dobrá volba další funkce.

Hlavním nástrojem pro práci s vyhledávači je dotaz.

Pro vyhledávání na internetu se také používají speciální aplikace nainstalované na místním počítači. Mohou to být jak jednoduché programy, tak poměrně složité komplexy pro vyhledávání a analýzu dat. Nejběžnějšími pluginy prohlížeče jsou pluginy prohlížeče, panely prohlížeče navržené pro práci s konkrétní vyhledávací službou a balíčky metasearch s možností analýzy výsledků.

Webové adresáře - jedná se o zdroje, ve kterých jsou stránky distribuovány podle tematických kategorií. Pokud uživatel pracuje s vyhledávači pouze prostřednictvím dotazů, pak má katalog možnost zobrazit celé tematické sekce. Druhým zásadním rozdílem mezi katalogy a automatickými vyhledávači je, že na jejich obsahu se zpravidla přímo podílejí lidé, kteří si prohlížejí zdroje a přiřazují web do té či oné kategorie. Webové adresáře se obvykle dělí na univerzální a tematické. Universal se snaží pokrýt co nejvíce témat. Najdete v nich cokoli: od stránek o poezii po počítačové zdroje. Jinými slovy, mají maximální šířku vyhledávání. Tematické adresáře se naproti tomu specializují na určitý předmět a poskytují maximální hloubku vyhledávání tím, že snižují šíři pokrytí zdrojů.

Výhodou adresářů je relativně vysoká kvalita zdrojů, protože každý web v něm je prohlížen a vybírán osobou. Tematické seskupení webů umožňuje pohodlně lokalizovat weby s podobnou tématikou. Tento způsob provozu je dobrý pro objevování nových stránek na téma, které vás zajímá – je přesnější než použití vyhledávače. Doporučuje se používat webové adresáře pro první seznámení s jakoukoli tematickou oblastí, stejně jako pro vyhledávání fuzzy dotazů - budete mít možnost „procházet“ sekcemi adresáře a přesněji určit, co potřebujete.

Nevýhody webových adresářů jsou známé. Za prvé se jedná o pomalé doplňování databáze, protože zařazení webu do katalogu vyžaduje účast osoby. Pokud jde o efektivitu, webový adresář není konkurentem vyhledávačů. Kromě toho jsou webové adresáře výrazně horší než vyhledávače, pokud jde o velikost databáze.

Když se mluví o vyhledávání na internetu, nelze pominout řadu pojmů, které s touto oblastí úzce souvisejí a často se používají k popisu a hodnocení vyhledávačů. Například:Šířka a hloubka vyhledávání na internetu. Široké vyhledávání je vyhledávání, které zachycuje co nejvíce zdrojů informací. Za dostatečnou se přitom považuje alespoň zmínka o konkrétním webu, který odpovídá dotazu. Hloubka vyhledávání se týká podrobností o indexování a následném vyhledávání každého konkrétního zdroje. Mnoho vyhledávačů má například různé přístupy k indexování různých stránek. Velké a oblíbené stránky jsou indexovány v maximální míře, roboti se snaží nevynechat jedinou stránku takového zdroje. Zároveň na jiných webech lze indexovat pouze hlavní stránku a několik stránek obsahu. Tyto okolnosti samozřejmě ovlivňují následné pátrání. Hluboké vyhledávání funguje na principu „je lepší zahrnout do výsledků nadbytečné informace, než přijít o data relevantní k tématu vyhledávání“.

Zcela běžně se lze setkat s pojmy jako např globální a lokální vyhledávání na internetu. Místní internetové vyhledávání zohledňuje geografickou polohu uživatele a dává přednost výsledkům, které nějak souvisí s konkrétní zemí nebo lokalitou. Globální vyhledávání tyto informace ignoruje a prohledává všechny dostupné zdroje.

Při sestavování dotazu na internetových vyhledávačích, různé režimy Vyhledávání. Mezi typické režimy vyhledávání na většině internetových počítačů patří jednoduché a rozšířené Vyhledávání. Jednoduché vyhledávání umožňuje zadat pouze jednu vyhledávací funkci v jednom dotazu. Pokročilé vyhledávání umožňuje vytvořit dotaz z několika podmínek jejich propojením s logickými operátory.

K upřesnění vyhledávacích dotazů se používají různé metody. filtry . Filtry se nazývají takové nebo jiné pomocné prostředky pro sestavení dotazu, které se nevztahují na obsahovou stránku podmínek dotazu, ale omezují výsledky vyhledávání na nějaký formální znak. Takže například při použití filtru typu souboru při vyhledávání uživatel neposkytuje systému informace související s předmětem jeho požadavku, ale pouze omezuje získané výsledky na konkrétní typ souboru uvedený v podmínce jeho požadavku.

Univerzální vyhledávače jsou pro většinu uživatelů hlavním a často jediným prostředkem pro vyhledávání na internetu. Nabízejí dobré pokrytí zdrojů a také sadu nástrojů dostačujících pro základní vyhledávací úlohy.

Trh s univerzálními vyhledávači je poměrně velký. Pokusili jsme se analyzovat nejznámější vyhledávače a výsledky jsou prezentovány ve formě tabulky 1.

Při výběru univerzálního vyhledávače hraje důležitou roli kvalita zdrojů nalezených s jeho pomocí. Upřednostňovaný vyhledávač pro konkrétní úkoly můžete určit pomocí „metody značek“. Jeho podstata spočívá v tom, že se nejprve sestaví určitý tematický vyhledávací dotaz, načež se dotazuje skupina lidí - odborníků v této oblasti, aby identifikovali podle jejich názoru nejlepší internetové zdroje na zvolené téma. Na základě dat z průzkumu se vytvoří seznam značkových míst, která jsou zaručeně relevantní pro dotaz a obsahují vysoce kvalitní informace. Poté je požadavek odeslán testovaným vyhledávačům. Logika hodnocení je jednoduchá: čím výše jsou ve výsledcích vyhledávání umístěny značkovací stránky, tím lépe je konkrétní zdroj vhodný pro nalezení informací o testovaném tématu.

Mluvte o tom, co je v naší době informační technologie a nekonečný růst množství dat dostupných jak pro jednotlivce, tak pro společnost, je mnoho problémů se zpracováním informací a jejich vyhledáváním - to už je rouhání. Kdo jen toto téma nenastoluje. A abych vás nezatěžoval subjektivními a částečně i objektivními soudy posbíranými z různých informačních zdrojů ohledně problému, přistoupím přímo k jeho řešení. Dnes si povíme něco o hledání. Tedy o programech a seriózních informačních systémech, které vyhledávají dokumenty a data, která potřebujeme.

Upgradujte "přímé vyhledávání"

Není to tak dávno, kdy byly stromy velké a informace i v lokální síť podniků nebylo tolik, jakékoli vyhledávání probíhalo banálním výčtem hrstky dostupných souborů a důslednou kontrolou jejich názvů a obsahu. Takové vyhledávání se nazývá přímé a programy (utility) využívající technologii přímého vyhledávání jsou tradičně přítomny ve všech operační systémy a balíčky nástrojů. Ani výkon moderních počítačů však nestačí na rychlé a dostatečné vyhledávání v gigantických množstvích dat při přímém vyhledávání. Prohledávat několik stovek dokumentů na disku a hledat v obrovské knihovně a několika desítkách poštovních schránek jsou dvě různé věci. Proto programy pro přímé vyhledávání dnes jednoznačně ustupují do pozadí – pokud se bavíme o univerzálních nástrojích.

Samozřejmě, že ve firemním sektoru není tento typ vyhledávání již dlouho žádaný. Objemy nejsou stejné. A proto již řadu let a v poslední době jednoznačně technologie schopné provádět rychlé a přesné vyhledávání dokumentů různé formáty a z různých zdrojů, více než relevantní. Není to tak dávno, co „otec“ Microsoftu Bill Gates, který zjevně záviděl fenomenální úspěch internetovému vyhledávači Google, na jedné z tiskových konferencí oznámil touhu softwaru (již a nejen) všemi možnými způsoby propagovat , rozvíjet a prohlubovat tvorbu vyhledávačů a technologií. Na vytvoření nějakého fenomenálního pracovního programu od Microsoftu nebo konkurenčního serveru na internetu je ale ještě příliš brzy (MSN stále zaostává za Googlem). Proto se obracíme ke stávajícímu vývoji. Index, dotaz, relevance

V jádru moderní technologie existují dva základní procesy. Zaprvé je to indexace dostupných informací a zpracování požadavku a následně výstup výsledků. Pokud jde o první, jakýkoli program (ať už je to stolní vyhledávač, podnikový informační systém nebo internetový vyhledávač) vytváří svou vlastní oblast vyhledávání. To znamená, že zpracovává dokumenty a tvoří index těchto dokumentů (organizovaná struktura, která obsahuje informace o zpracovávaných datech). Do budoucna je to právě vytvořený index, který slouží k práci – rychlému získání seznamu potřebných dokumentů dle požadavku. Dále, i když v žádném případě technologicky nejednoduché, ale je to celkem pochopitelné běžného uživatele. Program zpracuje požadavek (podle klíčového slova) a zobrazí seznam dokumentů, které toto klíčové slovo obsahují. Vzhledem k tomu, že informace jsou obsaženy ve strukturovaném indexu, je zpracování dotazu mnohem (desítky a stovky!) rychlejší než v případě přímého vyhledávání (výběr dokumentu se neprovádí výčtem souborů, ale analýzou textových informací v index).

Program zobrazí nalezené dokumenty ve výsledném seznamu podle relevance - shody dokumentu s textem dotazu. V různých technologiích samozřejmě existují různé metody vyhledávání a určení relevance dokumentu (počet „výskytů“ slova a jeho četnost zmiňování v dokumentu, poměr těchto parametrů k celkovému počtu slov v dokumentu, vzdálenost mezi slovy dotazu fráze ve vyhledaných souborech atd.). Na základě těchto parametrů se určí „váha“ dokumentu a v závislosti na ní se ten či onen soubor objeví v seznamu výsledků na určité pozici. V případě vyhledávání na internetu je situace ještě složitější. V tomto případě je skutečně třeba vzít v úvahu mnoho dalších faktorů (příkladem je Page Rank Google). To je ale téma na samostatný článek, takže se internetu nedotkneme Přehled vyhledávačů

Tento článek pojednává o několika možnostech oblíbené programy vyhledávání, které se může pochlubit jak slušnou rychlostí, tak dobrou funkčností. Ale předvádět se v letáku je jedna věc, ale postavit se pohledu odborníka je věc druhá. A nebylo ani mnoho, ani málo odborníků, plná kancelář milovníků, kteří by se vrtali se softwarem pro jeho použitelnost. Na testovacím počítači (Athlon 2,2 MHz, s paměť s náhodným přístupem 1 GB, 160 GB pevný disk Seagate IDE 7200 ot./min a systém Windows XP) byla nainstalována sada programů: dtSearch Desktop, Snoop Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. Pro testy byla sestavena textová báze dokumentů ve formátech doc, txt a html o celkové velikosti ne více, ne méně, ale 20 gigabajtů. Skupina soudruhů pod vedením vašeho skromného sluhy testovala, porovnávala a sdílela své subjektivní dojmy z každého softwaru. Níže si přečtěte shrnutí zjištění. dtSearchDesktop

Program, který podle vývojářů tvrdí, že je nejrychlejší, nejpohodlnější a nejlepší vyhledávač. Jak obecně, tak i celý zbytek této recenze. Rozhraní dtSearch je poměrně jednoduché, ale některá okna nebo karty jsou poněkud přeplněné prvky, což působí dojmem, že se obtížně používají. Ale ve skutečnosti neexistují žádné zvláštní potíže. Jediným opravdu nepříjemným momentem je chybějící podpora ruského jazykového softwaru (přes to, že program umí vyhledávat dokumenty v několika jazycích, jeho rozhraní je výhradně anglické).

Ale dtSearch je jeden z mála programů, který dokáže indexovat webové stránky do "hloubky" zadané uživatelem (ovšem s přihlédnutím k "dokoupení" v přídavné sadě dtSearch Spider). To je kromě podpory souborů na disku různých textové formáty a e-maily od poštovní schránka výhled. Program přitom neumí pracovat s databázemi, které jsou pro vyhledávače tak chutným soustem kvůli velkému množství informací, které obsahují, a širokému rozšíření ve firmách, potažmo v podnikových sítích. Rychlost indexování dokumentů dtSearch byla na úrovni. Při pohledu do budoucna řeknu, že tento program si poradil s indexováním daného množství informací na stejné úrovni jako jiný soutěžící - iSYS - a dělil se s ním o druhé místo v seznamu nej rychlé systémy. Otestujte 20 gigabajtů informací dtSearch indexovaných za 6 hodin a 13 minut, čímž vytvoříte index o velikosti 7,9 GB pro potřeby následného vyhledávání.

Pokud jde o možnosti vyhledávání, jsou zde na výši. Za prvé, dtSearch má morfologické vyhledávání (hledání slova ve všech jeho morfologických formách). Využitím této příležitosti se osvobodíte řekněme od takových myšlenek jako „v jakém případě bylo určité slovo použito v dokumentu, který potřebuji?“. Použití morfologického vyhledávání je téměř vždy opodstatněné, proto by mělo být přítomno v každém profesionálním vyhledávači.

Zvukové vyhledávání je nestandardní funkcí i pro profesionální hledače. Jeho podstata spočívá v tom, že program bude hledat slova, která znějí stejně jako slovo, které jste zadali. A nejlepší na tom je, že tato funkce funguje i pro ruský jazyk! Například zadáním slova „ear“ do vyhledávacího dotazu se zobrazí nejen slova „ear“, ale také „ear“.

Velmi důležitou funkcí je oprava chyb vyhledávání. Slouží k vyhledávání slov obsahujících syntaktické chyby – mohou to být buď překlepy, nebo chyby v dokumentech získaných například pomocí systémů rozpoznávání znaků. Jednoduchý příklad je, že hledáte slovo klávesnice. Některé dokumenty obsahují slovo „klávesnice“, je zřejmé, že ve skutečnosti je toto slovo „klávesnice“, pouze člověk, který píše při psaní. Nyní, hledání opravující chyby, detekuje a zahrne dokument se slovem „klávesnice“ do výsledku. V dtSearch je také nastavení, které umožňuje určit míru možných chybných znaků.

Hledejte pomocí synonym. Tato funkce používá seznam synonym pro různá slova. Takže například zadáním slova „rychlý“ program najde také slova „vysokorychlostní“ a další, která jsou synonymy pro slovo „rychlý“, jsou-li v seznamu synonym samozřejmě přítomna . K programu dtSearch není dodáván hotový seznam synonym, nicméně je možné seznamy využít na internetu (podle toho je nutné připojení, což není vždy vhodné), nebo si můžete vytvořit vlastní seznam synonyma.

Kromě uvedených funkcí může dtSearch vyhledávat pomocí frází složených ze slov spojených logickými operacemi. Každému slovu v dotazu lze přiřadit vlastní „váhu“, tedy význam. Užitečnou možností je použití slovníku skládajícího se z nedůležitých slov, abyste je při vyhledávání nezohlednili, ale i tento slovník je prázdný a budete si ho muset vyplnit sami.

Dále zvažte možnosti programu při práci na síti. Ve skutečnosti dtSearch nenabízí žádné specifické síťové funkce. Je však docela možné jej použít v síti. Případně můžete vytvořit nějaký index a vložit jej do veřejné (sdílené) složky. Samotný program lze nainstalovat pro každého uživatele na počítači nebo jej umístit také do otevřené složky veřejný přístup a vytvářet zástupce speciálním způsobem pro každého uživatele zvlášť pomocí parametrů příkazového řádku, jejichž účel je popsán v souboru nápovědy dodaném s programem. Také existuje možnost automatická instalace programy do sítě pomocí souboru MSI. Tím se zohlední nastavení pro každého připojeného uživatele.

Obecně - dobrý program z kategorie profesionálních vyhledávačů. Může se kvalifikovat pro dobré hodnocení, nicméně získání důvěry a respektu od uživatelů může být pro dtSearch obtížné kvůli několika faktorům (ne vše je s rozhraním hladké, ruští uživatelé jsou ochuzeni, neexistují žádné jasné funkce pro práci se sítí) . Pokud jde o přímé vyhledávání dokumentů, program neměl překryvy s ruským textem. Protože nebyly žádné s deklarovanou morfologií nebo s fuzzy vyhledáváním. Systém zcela adekvátně našel potřebné dokumenty jak jednoduchou žádostí v jednom slově, tak pomocí několika odstavců nebo jakéhokoli dokumentu jako klíčové fráze.

Oficiální stránka:
Velikost distribuce: 23 MbSnoop Prof Deluxe

Podle názvu můžete odhadnout, že v tomto programu je podpora ruského jazyka. Už je hezky. Co se týče rozhraní, obecně je poněkud neobvyklé, ale vzhledově velmi atraktivní. Další věcí je pohodlí. Velmi kontroverzní kritérium, ale stále pravděpodobně není řešení s více okny tou nejlepší volbou (požadavek je zadán v jednom okně, výsledek je zobrazen v jiném atd.).

Bloodhound stále používá stejné indexy k provádění rychlého vyhledávání, ale indexování je mnohem pomalejší než jiné programy. To je velmi zvláštní, zvláště uvážíme-li, že jeho schopnost zpracovávat vyhledávací dotazy je velmi slabá, což znamená, že struktura indexu není složitá. S největší pravděpodobností jde o neoptimalizované algoritmy. Tento program se ukázal být jasným outsiderem indexování a rychlosti vyhledávání: čas strávený vytvářením indexu je šestkrát delší než u stejných dtSearch a iSYS. Indexování 20 gigabajtů textů pro bloodhounda znamenalo 38 hodin a 46 minut práce. A vytvořená „hledací oblast“ zabírala na pevném disku stejnou velikost jako původní data s malým mínusem – 19 gigabajtů.

Bloodhound může být prezentován jako alternativa standardní vyhledávání v systému Windows to stěží umí víc. O tom, že primárním úkolem Bloodhounda je co nejjednodušší vyhledávání souborů, svědčí nejen malý počet funkcí pro analýzu textu vyhledávacích dotazů a pokročilé vyhledávání podle atributů souborů, ale dokonce i okno s výsledky, které poskytuje přímé odkazy na nalezené soubory a také složky obsahující tyto soubory. Okno výsledků není příliš informativní v tom smyslu, že celý nalezený soubor můžete přečíst pouze jeho spuštěním, to znamená, že nemá vestavěný prohlížeč souborů. Ale je uveden úryvek ze souboru, kde bylo hledané slovo nalezeno, obecně takové schéma zobrazení velmi připomíná internetové vyhledávače.

Když už mluvíme o konkrétních možnostech zpracování vyhledávacích dotazů, stojí za zmínku, že neexistuje nic jako „hledání textu“, maximum, které lze vyhledat, je fráze, už jen proto, že neexistuje víceřádkové pole pro zadávání textu. Zadanou frázi však můžete také analyzovat a Bloodhound nám zde nabízí standardní vyhledávací sadu: logické operace, vyhledávání podle masky a vyhledávání nabídek ... nic moc. V programu jsou nějaké základy morfologického vyhledávání, ale pravděpodobně tak syrové, že to spíše překáží správné práci (při testech bylo zaznamenáno mnoho překryvů s nesprávným použitím morfologie).

Program ale umožňuje při vyhledávání specifikovat atributy souboru (datum dokumentu, název souboru, název složky) a v těchto dotazech můžete také použít stejnou vyhledávací sadu. Zprávy můžete také vyhledávat zadáním parametrů (Od, Předmět... atd.).

Na samotné hledání jsme tedy přišli, co dalšího je na programu, za který podle informací z oficiálních stránek získal tolik ocenění, zajímavého? Těžko říct, co je na něm tak zvláštního, s největší pravděpodobností je rozhraní Bloodhoundu vstřícné (jen navenek, o použitelnosti nemluvě).

Operace s indexy jsou velmi standardní, příjemná je možnost aktualizovat indexy podle plánu. Kromě toho lze indexy používat také online. Od této chvíle musíme být konkrétnější.

Přes primitivnost vyhledávacích dotazů lze s programem vyhledávat soubory, takže jeho použití lze v sítích ospravedlnit. I když s velkým rozsahem, protože ve velké síti je prioritou rychlé vyhledávání dat pomocí složitých vyhledávacích dotazů kvůli obrovskému množství informací - a jsou zde zjevně problémy s rychlostí vyhledávání a programem. Musím říct, že práce se sítí je u Bloodhounda promyšlená jak má. Speciálně pro to je navržena samostatná aplikace - Bloodhound Server. Funguje stejně jako pouze Bloodhound (mají jeden vyhledávač), pouze pro dokumenty hostované na centrálním serveru nebo na sdílených zdrojích v firemní síť. Bloodhound Server vytváří nové indexy na sdílených zdrojích nebo používá dříve vytvořené. Každý uživatel v podnikové síti se může připojit k serveru Bloodhound a použít jej k přístupu k libovolnému dokumentu (umístěnému v aktuálním indexu) pomocí internetového prohlížeče. Souhlasíte, že takové schéma je mimořádně výhodné: ukazuje se, že soubory ve vaší vlastní síti lze vyhledávat stejným způsobem jako informace na internetu například prostřednictvím Google.

Při zhodnocení všech výhod a nevýhod tohoto programu lze závěr naznačit, že pro podnikové sítě jeho možnosti s největší pravděpodobností nebudou stačit (i přes dobrou organizaci práce se sítí), ale pro domácí počítač nebo dokonce pro domácí síť, v zásadě by se to mohlo hodit. Ačkoli ani rychlost práce, ani možnosti vyhledávání neinspirují optimismus ...

Oficiální stránky v ruštině:
Velikost distribuce: 6 MbGoogle Desktop Search + GDS Enterprise

Samozřejmě jsme nemohli ignorovat takového významného vývojáře. Název Google už mluví za vše. Lidé, kteří již léta používají nejvýkonnější internetový vyhledávač, se pravděpodobně bez jediné pochybnosti rozhodnou nainstalovat tento konkrétní vyhledávač do svého počítače. Je to jako přemýšlet: Google na vašem domácím počítači! Aniž bychom však podlehli provokacím s hojně propagovanou značkou, zkusme se střízlivě a hlavně objektivně zamyslet nad možnostmi „desktopového“ vyhledávače od Googlu.

První věc, která vás upoutá, je nedostatek vlastního shellu pro program. Google Desktop Search je stále v okně prohlížeče, respektive celé rozhraní desktopové verze přešlo na software ze staršího internetového bratříčka. Zda je to dobře nebo špatně, je diskutabilní záležitost: někomu se líbí minimalismus v designu tohoto vyhledávače a někdo chce vidět plnohodnotnou aplikaci naplněnou všemožnými tlačítky a podobně.

Co vám padne do oka hned po návrhu? A skutečnost, že totéž vyhledávání Google Desktop začne indexovat vše v počítači, aniž by to bylo vyžadováno! A co je nejzajímavější, není možné zvolit cesty indexování pomocí Google Desktop Search. Budete si muset stáhnout samostatný program (TweakGDS), který vám umožní mírné rozšíření nastavení google Desktop, včetně určení míst nezbytných pro indexování. I když, zatímco na to všechno přijdete, bude již indexovat standardní pevný disk, takže toto nastavení je potřeba spíše při práci s velkým množstvím dat, což je velmi důležité při použití v podnikových sítích (verze Enterprise). Není však pravda, že po stažení TweakGDS budou vaše problémy vyřešeny. Koneckonců potřebuje Microsoft . NET Framework a Microsoft Scripting Runtime. Jo... instalace, stejně jako přístup k nastavení, mohla být jednodušší, i když, pravděpodobně, vývojáři chápou: proč psát něco nového, když už existuje hotový vyhledávač, portovaný na místní počítač a ať si uživatel "užije", a nechť z "tohoto" udělá známé jméno další veledílo. Pojď, dokončíme tuto lyrickou odbočku a přejdeme k hledání.

Pokud jde o analýzu vyhledávacích dotazů a vydávání výsledků, je zde vše naprosto identické s Googlem na internetu: stejný systém zobrazování výsledků, stejná standardní sada logických operací pro vyhledávací dotazy. Obecně platí, že Google Desktop Search, jako předchozí program, je určen výhradně pro vyhledávání souborů - pro tyto soubory samozřejmě neexistuje žádný interní prohlížeč. Počet formátů souborů, které Google Desktop Search podporuje, je zcela dostatečný a příjemné je i to, že prohledává navštívené internetové stránky, přičemž data bere z mezipaměti. Rychlosti vyhledávání a indexování jsou celkem přijatelné. Pravda, pro domácí použití. S působivými 20 gigabajty textů to Google Desktop Search zvládl za 8 hodin a 17 minut. Strávit pár dní zpracováváním informací z podnikové sítě velkého podniku se neusměje na žádného správce systému. Na druhou stranu: velikost vytvořeného indexu se ukázala být na úrovni (4,5 GB) s jiným vyhledávačem testovaným v této recenzi - SearchInform.

Velkou výhodou (nebo opomenutím – rozhodnete se) Google Desktop Search je, že podporuje pluginy, které mohou mnohé změnit k lepšímu. Další věc je, že připojování pluginů a jejich konfigurace komplikuje instalaci vyhledávače natolik, že se začnete ptát, jestli je to všechno nutné, když můžete nainstalovat normální plnohodnotný program, ve kterém již bude vše přítomno. Koneckonců, abyste mohli používat každou funkci, budete muset nainstalovat nový plugin. I k tomu, aby program plnohodnotně pracoval s archivy, je potřeba samostatné pleťové mléko. Fascinuje a svádí zdarma všechny tyto doplňkové moduly. Pokud však neberete v úvahu desktopovou verzi vyhledávače, pak kompetentní nastavení GDS Enterprise nemusí být ve vašich silách – ne nadarmo specialisté Google nabízejí své služby k nastavení vlastního software pro vaši síť za pouhých 10 000 $.

Pokud si přesto osvojíte postup nastavení a instalace (nebo zaplatíte 10 000 USD týmu rychlé reakce Google), pochopíte, že složitost instalace je více než kompenzována velmi flexibilním nastavením při použití v podnikových sítích. Důležitým aspektem práce Google Desktop v podnikové síti je použití skupinové zásady, což umožňuje nastavit preference pro každého uživatele.

Shrneme-li to, je třeba říci, že nejrozumnějším využitím tohoto programu je domácí nebo pracovní počítač. U běžného počítače totiž stačí jen nainstalovat program – zbytek už udělá sám (ani se vás na nic neptá).

Google Desktop Search Enterprise však bude přijatelný v případech, kdy je naléhavě potřeba flexibilní nastavení síťových zásad pro používání vyhledávače, zatímco schopnost zpracovávat vyhledávací dotazy bude až na druhém místě důležitosti a čas (nebo peníze) vynaložené na nastavení programu budou na prvním místě.

Oficiální stránka:
Velikost distribuce s TweakGDS: 1,2 MbCopernic Desktop Search

Pro zvětšení klikněte na obrázek

Rozhraní programu vyvolává extrémně pozitivní emoce - vše je provedeno v souladu s obecně uznávanými standardy, nic zbytečného, jedním slovem příjemný design. Pro začátečníka bude velmi snadné porozumět rozhraní Copernic Desktop Search. I když je poněkud trapné, že designéři explicitně vytvořili rozhraní programu s ohledem na skutečnost, že program bude fungovat ve standardním motivu Windows XP. Při použití stejného klasického motivu program nevypadá tak pěkně. Ale to je spíše otázka vkusu.

Program při prvním spuštění nabídne vytvoření rejstříků pro vyhledávání. Poněkud nezvykle se zdálo, že po výběru složek pro indexování program nenabízí stisknutí žádného tlačítka, jako například „Spustit indexování“, zatímco indexování se nespustí automaticky, teprve poté bylo zaznamenáno, že Copernic se pokouší spustit indexování, když je počítač nečinný . Budete se muset trochu pohrabat v možnostech programu, abyste vše správně nastavili. Je třeba poznamenat, že existují poměrně široké možnosti přizpůsobení. automatické vytváření index: vestavěný plánovač, schopnost indexovat, když je počítač nečinný, na pozadí, s nízkou prioritou. Indexování nebylo příliš rychlé – 10 hodin 51 minut – to je pomalejší než u jiných vyhledávačů (s výjimkou Bloodhounda, ale Copernic je řádově rychlejší než vývoj iSleuthHound Technologies.

Nyní o struktuře indexu. Obecně na tom není nic zvláštního. Je možné vybírat typy souborů, a to jak v zobecněné podobě, tak v podrobné. To znamená, že zpočátku si můžete vybrat, co chcete indexovat – Dokumenty, Obrázky, Videa, Hudba. Na druhé záložce okna možností bude možné vybrat konkrétní typy souborů podle přípony. Kromě toho můžete index nakonfigurovat tak, aby například obrázky menší než 16x16 nebyly indexovány nebo zvukové soubory kratší než 10 sekund nebyly indexovány. Kromě indexování souborů ze složek umí Copernic pracovat s e-maily a kontakty z adresáře Microsoft Outlook a Microsoft Outlook Express, je možné indexovat Oblíbené a Historii z Internet Exploreru.

Pokud jde o možnosti vyhledávání, jsou zde velmi slabé. Během testů se dokonce ukázalo, že program nevyhledává dokumenty ve formátech txt a html v ruštině, takže je můžete najít pouze podle nadpisů a v žádném případě podle obsahu. Jediná věc, kterou program poskytuje ke zlepšení efektivity vyhledávání, je použití standardní sada logické operace a dokonce i tehdy byla tato možnost experimentálně objevena, protože nebyla zdokumentována. Mimochodem, pomoc programu také není v pořádku - je k dispozici pouze přes internet, což, jak vidíte, je velmi nepohodlné a v síti není příliš mnoho informací o pomoci. Vývojáři se zjevně rozhodli, že jednoduché rozhraní programu neznamená přítomnost normální nápovědy. V konverzaci o možnostech vyhledávání je třeba poznamenat, že i přes špatnou analýzu dotazů poskytuje program zajímavý vyhledávací systém - uživatel si může vybrat typ souborů (obrázky, videa, hudba atd.), zadat vyhledávací dotaz a vyberte atributy, které jsou specifické pro vybraný typ souboru. Například pro zvukové soubory, mohou to být hodnoty z mp3 tagů (interpret, album, datum atd.), u obrázků si například můžete vybrat jejich velikost (podle rozlišení), obecně má každý typ své vlastní nastavení. Po vyhledání určitého typu souborů program zobrazí v okně výsledků velmi informativní seznam a pokud váš požadavek obsahuje soubory jiného typu, můžete je otevřít kliknutím na konkrétní odkaz.

Samostatně stojí za zmínku okno zobrazení výsledku. Obsah těchto souborů se zobrazuje pod seznamem nalezených souborů (podobné schéma se často používá v poštovní klienti). Je pravda, že text lze prohlížet pouze v jeho nativním formátu a neexistuje režim zobrazení prostého textu, což není vždy vhodné, protože otevření dokumentu v tomto případě trvá déle. Ale vzhledem k tomu, že Copernic umí vyhledávat obrázky a hudbu, existuje možnost prohlížení těchto multimediálních souborů.

Základní principy tohoto programu byly popsány, nyní se podívejme, co nám Copernic Desktop Search může nabídnout pro práci se sítí... V zásadě se můžete dívat velmi dlouho, ale je nepravděpodobné, že byste nic viděli. Jinými slovy, tento program nebyl koncipován jako síťový. Copernic Desktop Search je výhradně domácí vyhledávač.

Je zřejmé, že jediné (nejlogičtější) použití tohoto programu je domácí počítač. Zde si zcela poradí se všemi jednoduchými vyhledávacími dotazy uživatelů, skládajícími se z jednoho nebo dvou slov, vyhledá potřebné informace a oddělení vyhledávání podle typů souborů a podpora multimediálních souborů spolu s indexováním na pozadí v režimu nízké priority. , ve spojení s příjemným rozhraním pouze dodávají programu sílu získat důvěru mezi nezkušenými uživateli.

Oficiální stránka
Velikost distribuce: 2,6 MbISYS Desktop

Pro zvětšení klikněte na obrázek

Velmi výkonný program. Co do úrovně výbavy všemožnými funkcemi je v seznamu někde u dalšího vyhledávače SearchInform. Přitom velikost instalačního souboru je více než 40Mb! Těžko říct, co by se do takových velikostí dalo nacpat, protože stejný SearchInform s podobnou funkčností zabere 15Mb.

Proces instalace zde také není příliš příjemný, respektive ani proces instalace. Ještě před stažením programu budete požádáni o registraci, jinak - nic. Dále rozhraní. Je udělaný moc pěkně, nic nadbytečného nebije do očí, nicméně to jsou dojmy člověka, který je na něj už tak trochu zvyklý. Pro začátečníka nebude snadné zjistit, kde a co je, kam kliknout a kde nakonec hledat. Důrazně se doporučuje přečíst si nápovědu před zahájením práce – ušetříte si spoustu nervů a času. Kromě všeho ostatního také je úplná absence Podpora ruského jazyka v programu. Špatný. Okna zde navíc nejsou přetížená ovládacími prvky, ale to přišlo za cenu vícemodulů a použití dalších oken. Například vyhledávací dotazy se zadávají spuštěním jednoho programu a indexy se spravují pomocí jiného programu. Vyhledávací dotazy se zde také zadávají do samostatných, zobrazených polí. Těžko říct, co je lepší - přetížené rozhraní nebo všudypřítomné více oken, spíše je to věc vkusu.

Pokud jde o vytváření indexů, program poskytuje možnosti pro zjednodušení procesu nastavení možností pro nový index. Tyto funkce zahrnují několik hotové šablony pro vytváření rejstříků pro Moje dokumenty, Pošta, Pošta a dokumenty, Specifická složka, Složka s vybranými typy souborů atd. Tyto šablony usnadňují vytváření rejstříků v první fázi. Nástroj pro práci s indexy má nepříliš dobré rozhraní, které zastrašuje určitou složitost (upřímně řečeno, toto je velmi subjektivní hodnocení), ale pokud se na něj podíváte, poskytuje mnoho užitečných možností a obecně jeho použití nezpůsobuje mnoho obtíží. ISYS Desktop je schopen indexovat data z různých zdrojů dat a také poskytuje mnoho flexibilních nastavení pro takové indexování. Mezi další funkce pro indexování: podpora pro SQL, FTP, TRIM Context, WORLDOX 2002, skripty. Pokud jste při vytváření indexu vybrali možnost "Složka s výběrem typů souborů", máte možnost vybrat typy souborů, které se mají indexovat, ručně (podle přípony). Nutno říci, že podporovaných typů souborů je prostě obrovské množství, ale do stávajícího seznamu nebude možné přidat vlastní typ (příponu). Můžete si také všimnout přítomnosti plánovače indexování. ISYS Desktopu trvalo 6 hodin a 13 minut, než vytvořil index a zpracoval 20 gigabajtů informací, nakonec ukázal dobrý čas a velikost vytvořeného souboru – 7,9 GB.

Vyhledávací schopnosti tohoto programu nejsou špatné. To, co se používá v ISYS, je mnohem výkonnější než běžná podpora logických operací. Z funkcí pokročilého vyhledávání program nabízí použití synonym, třídicí filtr (podle cesty, názvu a data vytvoření souboru). Sada logických operátorů je poněkud širší než standardní sada. Kromě logických operací umožňuje program pracovat s mnoha dalšími operátory, které v zásadě mohou nahradit některé typy vyhledávání, například vyhledávání s parsováním lze zcela nahradit použitím speciálních operátorů. Velmi mě překvapilo, že program nemá vyhledávání pomocí morfologie. To je vážné opomenutí, protože při použití morfologické analýzy se výrazně zlepší efektivita vyhledávání. Kromě toho neexistuje seznam významných slov, ale existuje rozsáhlý seznam nevýznamných slov. Také deklarované takové funkce ve vyhledávání jako "přibližné vyhledávání" a "heuristická analýza".

ISYS poskytuje výběr z několika typů vyhledávacích dotazů, zejména vizuálních. To se provádí pomocí různých typů oken pro zadávání vyhledávacích dotazů, nicméně ve skutečnosti žádné okno neumožňuje používat jiné technologie než ty, které jsou uvedeny výše.

Výsledky vyhledávání jsou velmi informativní, zobrazují se jako seznam dokumentů seřazených podle relevance. Níže je náhled vybraného dokumentu. Na rozdíl od Copernic Desktop Search je zde náhled k dispozici pouze ve formě prostého textu, nebylo možné dosáhnout zobrazení dokumentů v nativním formátu, ať už Word, Html nebo PDF, i když to v zásadě není příliš kritické. Program umožňuje rozdělit nalezené dokumenty do skupin podle určitých kritérií (standardně jsou rozděleny podle relevance). Můžete také zobrazit již nalezené dokumenty výběrem jednotlivých složek (to je užitečné, když výsledkem je velmi velký počet dokumentů).

Použití programu v podnikové síti je také zcela oprávněné, protože poskytuje dobré příležitosti pro organizaci vyhledávání v síti. Vyhledávací systém je založen na vytvoření veřejného indexu, který obsahuje indexovaná data z veřejných síťových zdrojů.

Ve skutečnosti je program od ISYS hodný pozornosti, alespoň se s ním seznámit. Tento program je vyspělý projekt s obrovské množství funkce (ne vždy a ne pro každého jsou samozřejmě potřeba, ale i tak). Šance, že program bude mít nějaká vylepšení z hlediska zpracování vyhledávacích dotazů, nejsou známy, ale tento moment lze jej doporučit pro téměř univerzální použití. A vzhledem k tomu, že je pro domácí systémy stále příliš těžký, jsou hlavními místy jeho instalace podnikové sítě.

Oficiální stránka:
Velikost distribuce: 40 MbSearchInform

Pro zvětšení klikněte na obrázek

Asi nemá cenu hned začínat popisem rozhraní SearchInform. Nejprve bychom měli popsat proces instalace, nebo spíše jeden z jeho detailů: bez připojení k internetu nebudete moci program nainstalovat. Faktem je, že před prvním spuštěním program vyžaduje registraci uživatele (zdarma) a odesílá všechna zadaná data na server. Zdá se, že vývojáři museli přijmout taková opatření v boji proti pirátství, ale to pozitivně neovlivnilo snadnost instalace.

Rozhraní programu je vytvořeno v souladu se všemi obecně uznávanými pravidly, na první pohled je však poněkud těžkopádné. Při prvním použití programu se zdá, že je příliš komplikovaný, někdy není snadné si zapamatovat, ve kterém menu nebo záložce se požadovaná možnost nachází, nicméně při delším používání už rozhraní nepůsobí tak strašně složitě. Hlavní je si nejprve přečíst nápovědu.

Poté, co se trochu vypořádáte s rozhraním, můžete začít vytvářet index. Samotný proces je velmi jednoduchý a rychlost indexování i na pohled je mnohem vyšší než u všech ostatních vyhledávačů z recenze. Jasná testovací čísla ukazují, že SearchInform je dvakrát rychlejší než dtSearch a iSYS, pokud jde o rychlost indexování! Poskytnutá data v objemu 20 gigabajtů program indexoval v rekordním čase – 3 hodiny 17 minut. A velikost vytvořeného indexu se ukázala jako nejmenší 4,4 GB - o 100 megabajtů méně než u Google Desktop Search.

Program podporuje kromě běžných souborů a složek také indexování e-mailů, připojování a indexování databází (!) a dalších externích zdrojů (DMS, CRM), ihned při indexování lze určit slovník pro morfologické vyhledávání a všechny atributy umí být indexované soubory. Po vytvoření indexu, když se pokusíte provést první testovací vyhledávání dokumentů, můžete dojít k určitému zmatku: "Existují dva typy vyhledávání, ale který z nich potřebuji?". Jak již bylo zmíněno dříve, hlavní věcí je přečíst si nápovědu, pak bude vše jasné. Program je skutečně schopen provádět dva typy vyhledávání – frázové vyhledávání a vyhledávání dokumentů, které jsou obsahově podobné textu dotazu.

Popis všech hlavních funkcí pro analýzu vyhledávacího dotazu byl uveden výše, takže nyní uvedeme pouze možnosti vyhledávání, které tento program poskytuje. Začněme hledáním frází: samozřejmě morfologické hledání, hledání citací, logické operace, hledání slovní parsací (hledání podle začátku slova, podle konce, podle střední části nebo úplné shody), smíšené hledání citací (když v dokumentu musí být přítomna všechna slova z dotazu, ale ne nutně v zadaném pořadí), vyhledávání oprav chyb, používání synonym, „hledání téměř citací“ (hledá zadanou frázi jako citaci, ale mohou existovat i jiné slova mezi zadanými slovy) atd. Některé z uvedených možností mají svá vlastní specifická nastavení. Navíc je možné použít slovník nepodstatných slov a program má již připravený seznam těchto slov, pro vyhledávání můžete využít i slovník prioritních slov (samozřejmě jej budete muset vyplnit vy sám).

Zde jsme v zásadě krátce prošli všemi hlavními funkcemi vyhledávání frází.

Přejděme k úvahám o vlastnostech tohoto programu – vyhledávání podobných dokumentů. Vývojáři tvrdí, že se v žádném případě nejedná o jednoduché textové vyhledávání, jde přesně o „hledání podobného“ – tak to všude popisují, ale oukej, můžete si to říkat, jak chcete – hlavní je. Krátké vyhledávání na internetu může rychle odhalit, že takzvané „podobné vyhledávání“ je novinkou v oblasti analýzy textu. Tento systém umožňuje vyhledávat texty, které jsou z hlediska sémantického obsahu podobné. Nejpříjemnější bylo, že po provedení testovacích vyhledávacích dotazů se ukázalo, že teorie je zcela v souladu s praxí! Program skutečně vyhledává obsahově podobné dokumenty a zobrazuje je v seznamu seřazeném podle procenta podobnosti.

Dále se podívejme, co nabízí SearchInform (zejména jeho firemní verze SearchInform Corporate) pro práci v podnikové síti. Existují dva typy aplikací: strana serveru a strana uživatele. Serverová část nezávisle zpracovává zadané indexy a uživatelé je mohou používat k vyhledávání v závislosti na přidělených přístupových právech. Uživatele lze konfigurovat automaticky pomocí přihlášení. Záznamy systému Windows(rčení odborný jazyk, SearchInform používá ověřování Windows NTFS) nebo ručně (uživatelé budou muset být přidáni samostatně). Každému uživateli lze povolit nebo zakázat přístup k určitým indexům, můžete také sdružovat uživatele do skupin. Obecně platí, že nastavení sítě SearchInform předčí Google z hlediska flexibility a Snoop Server z hlediska pohodlí a jednoduchosti.

Oficiální stránka:
Velikost distribuce: 14,7 Mb Porovnání rychlosti indexování

Vyhledávací systém	Čas indexování	Velikost indexu
Bloodhound Pro Deluxe 4.5	38 hodin 46 minut	19 GB
Isys Desktop 7.0	6 hodin 13 minut	7,9 GB
DtSearch 7.0	6 hodin 3 minuty	8,6 GB
Google Desktop Search Enterprise	8 hodin 17 minut	4,5 GB
Copernic Desktop Search *	10 hodin 51 minut	7 GB
SearchInform 1.5.02	3 hodiny 17 minut	4,4 GB

* Většinu dokumentů .html a .txt obsahujících ruský text, i když byly indexovány, nebylo možné najít jinak než podle jejich názvů.

Všechny programy stojí za pozornost.

Na základě testů a pečlivého zkoumání každého programu prezentovaného v recenzi lze vyvodit určité závěry. Google Desktop Search Copernic Desktop Search je tedy docela vhodný pro nezkušené uživatele jako domácí informační vyhledávací systém. Odvedou dobrou práci s jednoduchými požadavky, uživatele příliš nezatěžují nastavením a navíc jsou zcela zdarma. Pokus Googlu vstoupit na trh firemních vyhledávačů zatím nemá silné opodstatnění: pro plnohodnotnou práci je potřeba program ověsit dalšími moduly a jeho nastavení není zdaleka jednoduché. Proto, když vyslovíme názvy Desktop Search, že Copernic, že Google za sebou nechá výklenek "desktop" vyhledávačů.

Pravda, výkonnější řešení – dtSearch, iSYS a SearchInform také nejsou z čista jasna a nabízejí uživatelům své „desktopové“ verze. Ale za rozumnou cenu, na rozdíl od svobodného softwaru od Google a Copernic. Za výkon, rychlost a funkčnost si samozřejmě musíte zaplatit. Ale vývojáři dtSearch, iSYS a SearchInform se samozřejmě zaměřují hlavně na podnikový sektor. Síť, funkčnost, indexace a rychlost vyhledávání – to je to, co odlišuje tyto produkty od jejich „konkurence“. Podle výsledků testu byl určen favorit - SearchInform. Program poskytuje možnost vyhledávat podobné dokumenty, má nejvyšší rychlost indexování a vyhledávání a má dobrou sadu funkcí.

Najít ty správné a aktuální informace na internetu je někdy velmi obtížné. Množství informačního odpadu na webu roste jako sněhová koule a někdy je prostě nemožné dostat se k datům, která skutečně potřebujete, pomocí tradičních Yandex a Google. Kniha, kterou držíte v rukou, mnohonásobně zvýší efektivitu vašeho hledání informací na internetu. Popisuje techniky, vyhledávací stránky a programy pro vyhledávání specializovaných informací. Zvažují se moderní varianty internetového vyhledávání: univerzální vyhledávání, vertikální vyhledávání, metasearch systémy, budování osobních vyhledávačů, vyhledávání audiovizuálního obsahu, vyhledávání na skrytém internetu. U všech uvažovaných systémů jsou uvedeny jejich charakteristiky a tipy pro co nejefektivnější využití.

Úvod

Vyhledávání na internetu je důležitým prvkem práce na webu. Přesný počet webových zdrojů moderního internetu zná s jistotou jen stěží. V každém případě jde účet do miliard. Abyste mohli využít informace, které jsou v tuto konkrétní chvíli potřeba, ať už pro obchodní nebo zábavní účely, musíte je nejprve najít v tomto neustále doplňovaném oceánu zdrojů. To není vůbec snadný úkol, protože informace na moderním webu nejsou strukturované, což způsobuje problémy při jejich vyhledávání. Ne náhodou se internetové vyhledávače staly jakýmisi „okny“ do tohoto informačního prostoru.

Je nepravděpodobné, že mezi uživateli internetu budou lidé, kteří nikdy nepoužívali velké univerzální vyhledávače. Názvy Google, Yandex a pár dalších velkých strojů má na rtech každý. Vycházejí skvěle s denní úkoly Hledání na internetu a často se uživatelé ani nesnaží hledat náhradu. Zároveň se počet internetových vyhledávačů v naší době pohybuje v tisících. Důvody pro takovou rozmanitost alternativních strojů mají různé kořeny. Některé projekty se snaží přímo konkurovat lídrům globálního trhu pečlivou prací s národními internetovými zdroji. Jiné nabízejí funkce dotazování, které nenajdete v zavedených vyhledávačích. Značný počet alternativních strojů se specializuje na vyhledávání konkrétní oblasti nebo určitého typu obsahu a dosahuje působivých výsledků při řešení těchto problémů. Ať je to jakkoli, zařazení takových vyhledávačů do vlastního arzenálu internetových vyhledávacích nástrojů může výrazně zlepšit jeho kvalitu. Zde je však jedna nuance: musíte o takových strojích vědět a být schopni využít jejich schopnosti.

Předpokládáme, že čtenáři této knihy již techniku vyhledávání pomocí univerzálních vyhledávačů dobře znají. Tak dobře, že cítili omezení spojená s jejich používáním. S největší pravděpodobností se takoví lidé již pokusili vyhledat a použít určité další nástroje. Tištěné slovo neobchází ani téma vyhledávání na internetu: pravidelně se objevují články i knihy. Ale hrdinové, které mají, jsou zpravidla stejní - několik předních univerzálních vyhledávačů. Naše kniha je odlišná v tom, že se pokouší pokrýt celou řadu moderních vyhledávacích řešení. Naleznete zde popisy a doporučení pro využití nejlepších moderních služeb zaměřených na řešení nejčastějších vyhledávacích úloh. Tato kniha je určena lidem, kteří hodně pracují na internetu a používají web k vyhledání informací, které potřebují – ať už jde o podnikání, studium nebo hobby.

Aby bylo vyhledávání na internetu úspěšné, musí být splněny dvě podmínky: dotazy musí být dobře formulovány a musí být kladeny na vhodných místech. Jinými slovy, po uživateli je požadována na jedné straně schopnost převést své vyhledávací zájmy do jazyka vyhledávacího dotazu a na druhé straně dobrá znalost vyhledávačů, dostupných vyhledávacích nástrojů, jejich výhod a nevýhody, které umožní výběr nejvhodnějších vyhledávacích nástrojů v každém konkrétním případě.

Kapitola 1

Univerzální internetové vyhledávače

Univerzální internetové vyhledávače jsou hlavním a nejznámějším prostředkem pro vyhledávání na internetu. Takové vyhledávače poskytují maximální pokrytí různých zdrojů. Jedná se o univerzální typ, který zahrnuje největší a nejoblíbenější vyhledávače. Jedná se o opravdu výkonná řešení se spoustou funkcí a nástrojů, o kterých mnoho uživatelů často neví. Pochopení funkcí a možností univerzálního vyhledávání vám umožní zjistit silné stránky a slabé stránky takové systémy a vědomě volit ty nejefektivnější vyhledávací nástroje.

Trh s univerzálními vyhledávači je poměrně velký. V této kapitole se budeme zabývat pouze nejvýkonnějšími stroji, které mohou adekvátně pracovat s dotazy v ruštině. Kapitola se otevírá příběhy o vůdcích ruského vyhledávání - systémech Google.ru a Yandex. O každém z těchto vyhledávačů byly napsány knihy a spousta článků. Zaměříme se na hlavní charakteristiky, které jsou pro koncového uživatele důležité, a také se pokusíme identifikovat jejich silné stránky.

Doprovází je nový vývoj vyhledávání od Microsoft Corporation - systém Bing, který byl dosud citelně ochuzen o pozornost, a také užitečný a vcelku výkonný vyhledávač Exalead, jehož výhodou je dobrá podpora vyhledávání v evropských internetových zdrojích. Tento systém- je stále vzácným hostem ve vyhledávacím arzenálu našich uživatelů, takže je zvažován podrobněji než ostatní.

V této kapitole při recenzování systémy Google a Yandex se zaměříme pouze na možnosti vyhledávání na webu a vyhledávání ve specializovaných databázích těchto projektů je pojednáno v následujících kapitolách o vyhledávání obrázků a videí. U ostatních univerzálních vyhledávačů jsou informace o multimediálním vyhledávání uvedeny ihned po seznámení s nimi.

Protože tři ze čtyř hrdinů této kapitoly jsou cizího původu, hned poznamenáváme, že pouze analyzujeme možnosti jejich ruských verzí. Faktem je, že některé funkce zahraničních systémů, zejména experimentálních, jsou často dostupné pouze v původních, zpravidla anglických verzích služeb.

Google

Vyhledávač Google je právem považován za světového lídra v moderním vyhledávání na internetu. Založena v roce 1998 Google dodnes patří mezi vedoucí trendy v oblasti internetového vyhledávání a webových služeb.

Vývojáři Google se vždy vyznačovali zvýšenou pozorností ke zlepšování algoritmů svého vyhledávače a přiměřeným konzervatismem v oboru. uživatelské rozhraní. Možnosti sestavení dotazu na Google lze nazvat klasickými a jakýmsi standardem se staly i způsoby zobrazení výsledků vyhledávání. Nedávno Google Developers provedl v těchto oblastech velké změny - největší vyhledávač začal na pozadí mladých konkurentů vypadat příliš staromódně.

Google má jednu z největších indexových základen na světě, která poskytuje široké pokrytí informačních zdrojů. Informace o indexu Google jsou shrnuty na několika vertikálních základech. Kromě nejznámější webové databáze existuje několik multimediálních databází (Obrázky, Videa), které pracují se zdroji relevantních informací a zpráv na RSS zdrojích, databáze Novinky a také databáze Blogy, která indexuje síťové deníky. Kromě toho Google nabízí širokou škálu dalších zdrojů, mezi nimiž stojí za zmínku mapová služba, adresář stránek a služba otázek a odpovědí. Tyto zdroje lze také považovat za vyhledávací nástroje.

Ve webové databázi nabízí Google jednoduché a pokročilé režimy vyhledávání pro sestavení dotazu. Pouze v režimu jednoduchého vyhledávání z doplňkových nástrojů virtuální klávesnice. Rozšířené vyhledávání nabízí více možností. Vzhledem k tomu, že formulář pro pokročilé vyhledávání je dostupný téměř ve všech vyhledávacích produktech Google, zastavme se u něj podrobněji (obr. 1.1).

Yandex

Vyhledávač Yandex, který byl oficiálně představen široké veřejnosti v roce 1997, se úspěšně vyvinul a o deset let později se poprvé zařadil mezi deset největších vyhledávačů na světě. V ruském segmentu internetu si vydobyl přední pozici, které se i přes rostoucí konkurenci nehodlá vzdát. Charakteristickými rysy Yandexu od počátku jeho existence byly jeho vlastní originální algoritmy pro určování relevance výsledků vyhledávání, flexibilní nástroje pro práci s textem dotazu a zohlednění zvláštností morfologie ruského jazyka při jejich zpracování.

Yandex se spoléhá na své vlastní indexové databáze. Kromě vyhledávání ve webových dokumentech nabízí systém dobrý výběr specializovaných zdrojů a doplňkových služeb. Yandex v současné době pracuje s obrázky, videi, zprávami, blogy a slovníky. Výkonné možnosti vyhledávání jsou také zabudovány do naší vlastní kartografické služby a do systému vyhledávání produktů. Kromě toho Yandex spravuje svůj vlastní katalog webových stránek. Silný bod Yandex je vyvinutý místní vyhledávací program, který je zvláště důležitý pro naše uživatele. Yandex poskytuje přístup ke svým databázím vývojářům třetích stran. Výsledkem je, že mnoho ruských alternativních internetových vyhledávacích projektů využívá zdroje Yandex tak či onak. Kromě obvyklého vyhledávacího systému je nabízena také zkrácená verze Yandex, dostupná na ya.ru. Rozhraní této verze se skládá pouze ze vstupního pole dotazu a tlačítka pro spuštění vyhledávání.

Vyhledávání dokumentů na webu nabízí jednoduché i pokročilé režimy vyhledávání. Jednoduché vyhledávání neposkytuje žádné filtry, což je kompenzováno schopností automaticky analyzovat dotazy v přirozeném jazyce, sebevědomým zpracováním relativně dlouhých dotazů a systémem automatického dokončování dotazů. Maximální délka dotazu je čtyřicet slov.

Pokročilý vyhledávací formulář pro sestavení dotazu nabízí pouze jedno pole. Logické operátory spojující slova dotazu se navrhují zadávat ručně, dobře. Yandex má poměrně podrobný dotazovací jazyk. Zbytek nástrojů pro pokročilé vyhledávání jsou různé filtry (1.4).

Bing

Historii internetového vyhledávání od společnosti Microsoft není snadné dovolat. Veřejnosti důsledně nabízené služby opakovaně měnily algoritmy, používané databáze a samozřejmě i názvy. Až do počátku roku 2000 neměl vyhledávač své vlastní databáze a pracoval s externími indexy od AltaVista, Inktomi a Looksmart. Původní název MSN Search se používal do roku 2006 a poté se na několik let změna názvů vyhledávače stala pro Microsoft tradicí.

Spolu s konečným přechodem na vyhledávání ve vlastních indexech bylo MSN Search přejmenováno nejprve na Windows LiveLive Search. Nakonec bylo na začátku léta 2009 živé vyhledávání nahrazeno novým vyhledávacím projektem Bing.

„Bing poskytne jiný způsob nahlížení na informace na internetu a pomůže uživatelům dělat důležitá rozhodnutí,“ začala tisková zpráva Microsoftu o spuštění Bingu takovýmto prohlášením. Aspirace vývojářů byly pochopitelné: vyhledávače od společnosti Microsoft, navzdory veškerému úsilí, byly na Západě v popularitě trvale nižší než vůdci - Google a Yahoo!. Pokud mluvíme o ruskojazyčných verzích předchozích vyhledávacích projektů společnosti Microsoft, pak z hlediska počtu a kvality nalezených odkazů byly mnohem horší než velké ruské vyhledávače. Ve snaze dohnat konkurenty se vývojáři Bing spoléhali na zlepšení kvality vyhledávání a zavedení nových technologií, z nichž mnohé byly získány společně s firmami, které je vytvořily.

Je třeba poznamenat, že Ruská verze Bing, stejně jako většina ostatních lokalizovaných verzí, postrádá řadu dalších funkcí, jako je vyhledávání v obchodě. Protože ve skutečnosti fungují pouze na severu. Ameriko, nemá smysl se jimi podrobně zabývat.

Exalead

Jedním z rysů Evropy, a to i v oblasti vyhledávání na internetu, je velký počet národních jazyků. Vyhledávač, který se prohlašuje za lídra v Evropě, prostě musí dobře indexovat národní segmenty internetu a kvalitně zpracovávat dotazy v mnoha evropských jazycích, jak největších, tak těch méně obvyklých. Právě v této oblasti může být evropský rozvoj seriózní konkurenční výhodu ve srovnání s mocnými zámořskými konkurenty. Do role takového evropského vyhledávače se v současnosti vážně hlásí systém Exalead. Tento projekt byl vyvinut jako součást výzkumného programu Quaere financovaného Evropskou unií.

Exalead má své vlastní indexové databáze. Hlavním vyhledávacím zdrojem systému jsou databáze webových dokumentů, obrázků, videí a zpráv. úvodní stránka Exalead nabízí příležitost personalizace. Na tuto stránku můžete umístit odkazy na své oblíbené stránky - zobrazí se jako grafické náhledy-screenshoty. Je pravda, že k tomu si budete muset zdarma zaregistrovat účet a povolit prohlížeči ukládat soubory cookie Exalead.

Exalead Web Search nabízí jednoduché a pokročilé režimy vyhledávání. Formulář pro pokročilé vyhledávání se stejně jako v Bingu otevře přímo na stránce problému Všimněte si, že Exalead nenabízí pouze známý formulář se sadou dalších polí, ale také komplexní rozevírací nabídku, která funguje jako průvodce pro upřesnění dotazu (obr. 1.7). Když vyberete jednu nebo druhou položku v nabídce průvodce, do řetězce dotazu se přidají nové prvky a v případě potřeby operátory a speciální znaky.

Úvod

V současné době internet sjednocuje stovky milionů serverů, které hostí miliardy různých stránek a jednotlivých souborů obsahujících různé druhy informací. Je to obrovské úložiště informací. Existují různé způsoby vyhledávání informací na internetu.

Vyhledávání podle známé adresy. Požadované adresy jsou převzaty z adresářů. Pokud znáte adresu, stačí ji zadat adresní řádek Prohlížeč.

Příklad 1. www.gov.ru - server státních orgánů Ruska.

Konstrukce adresy uživatelem. Se znalostí systému generování internetových adres můžete vytvářet adresy při vyhledávání webových stránek.

Ke klíčovému slovu je potřeba přidat tematickou nebo geografickou doménu (název firmy, podniku, organizace nebo jednoduché anglické podstatné jméno) a musí se propojit intuice.

Příklad 2 Adresy komerčních webových stránek:

www.samsung.com SAMSUNG),

www.mtv.com (hudební zprávy MTV).

Příklad 3. Adresy vzdělávacích institucí:

www.ntu.edu (Národní univerzita USA).

Vyhledávače Internet

Pro vyhledávání informací na internetu byly vyvinuty speciální systémy vyhledávání informací. Vyhledávače mají běžnou adresu a zobrazují se jako webová stránka obsahující speciální nástroje pro organizaci vyhledávání (hledaný řetězec, předmětový katalog, odkazy). Chcete-li zavolat vyhledávač, stačí zadat jeho adresu do adresního řádku prohlížeče.

Podle statistické služby LiveInternet.ru je distribuce vyhledávačů v Rusku přibližně následující:

2) Google – 35,0 %

3) Vyhledávání na Mail.ru – 8,3 %

4) Rambler – 0,9 %

Podle způsobu organizace informací se systémy vyhledávání informací dělí na dva typy: klasifikační (rubrikátory) a slovníkové.

Rubrikátoři (klasifikátory)- vyhledávače, které používají hierarchickou (stromovou) organizaci informací. Při vyhledávání informací uživatel prohlíží tematické nadpisy a postupně zužuje vyhledávací pole (například pokud potřebujete najít význam slova, musíte nejprve najít slovník v klasifikátoru a poté najít správné slovo v něm).

Slovníkové vyhledávače jsou výkonné automatické softwarové a hardwarové systémy. S jejich pomocí se prohlížejí (skenují) informace na internetu. Údaje o umístění té či oné informace se zapisují do speciálních rejstříků referenčních knih. V reakci na požadavek se provede vyhledávání podle řetězce dotazu. Díky tomu jsou uživateli nabídnuty ty adresy (URL), na kterých bylo v době skenování nalezeno hledané slovo nebo skupina slov. Výběrem kteréhokoli z navrhovaných odkazů můžete přejít na nalezený dokument. Většina moderních vyhledávačů je smíšená.

Nejznámější a nejoblíbenější vyhledávače:

Existují systémy, které se na vyhledávání specializují informační zdroje v různých směrech.

https://my.mail.ru

https://ru-ru.facebook.com

https://twitter.com

https://www.tumblr.com

https://www.instagram.com atd.

Předmětové vyhledávače:

Hledání softwaru:

Katalogy (tematické sbírky odkazů s poznámkami):

http://www.atrus.ru

Pravidla provádění dotazu

V každém vyhledávači v sekci Nápověda získáte informace o tom, jak hledat, jak sestavit řetězec dotazu. Níže jsou uvedeny informace o typickém „průměrném“ dotazovacím jazyce.

Jednoduchá žádost

Zadejte jedno slovo, které definuje hledané téma. Například do vyhledávače Rambler.ru stačí zadat: automatizace.

Jsou nalezeny dokumenty, které obsahují slova uvedená v žádosti. Všechny formy ruských slov jsou uznávány, zpravidla se ignorují písmena.

V dotazu můžete použít znak "*" nebo "?". Podepsat "?" v klíčovém slově je nahrazen jeden znak, na jehož místo lze nahradit libovolné písmeno a znak "*" je posloupnost znaků.

Například dotazovací automat* najde dokumenty, které obsahují slova automatický, automatický atd.

Složitý dotaz

Často je potřeba kombinovat klíčová slova pro konkrétnější informace. V tomto případě se používají další spojovací slova, funkce, operátory, symboly, kombinace operátorů oddělené závorkami.

Například dotaz music & (beatles beatles) znamená, že uživatel hledá dokumenty obsahující slova music a beatles nebo music a beatles.

Seznam vyhledávacích serverů a adresářů


Adresa	Popis
www.excite.com	Vyhledávač s recenzemi uzlů a průvodci
www.alta-vista.com	Vyhledávací server, dostupné možnosti pokročilého vyhledávání
www.hotbot.com	vyhledávací server
www.ifoseek.com	Vyhledávací server (snadné použití)
www.ipl.org	Internet Publik library, veřejná knihovna fungující v rámci projektu World Village
www.wisewire.com	WiseWire – organizace vyhledávání pomocí umělé inteligence
www.webcrawler.com	WebCrawler - vyhledávací server, snadné použití
www.yahoo.com	Webový katalog a rozhraní pro přístup k fulltextovému vyhledávání na serveru AltaVista
www.aport.ru	Aport - ruský jazykový vyhledávací server
www.yandex.ru	Yandex - ruskojazyčný vyhledávací server
www.rambler.ru	Rambler - ruskojazyčný vyhledávací server
Zdroje nápovědy na internetu
www.yellow.com	Zlaté stránky internetu
monk.newmail.ru	Vyhledávače různých profilů
www.top200.ru	200 nejlepších webových stránek
www.allru.net
www.ru	Katalog ruských internetových zdrojů
www.allru.net/z09.htm	Vzdělávací zdroje
www.students.ru	Ruský studentský server
www.cdo.ru/index_new.asp	Centrum distančního vzdělávání
www.open.ac.uk	Otevřená univerzita UK
www.ntu.edu	Americká národní univerzita
www.translate.ru	Elektronický překladač textů
www.pomorsu.ru/guide.library.html	Seznam odkazů na síťové knihovny
www.elibrary.ru	Vědecká elektronická knihovna
www.citforum.ru	E-knihovna
www.infamed.com/psy	Psychologické testy
www.pokoleniye.ru	Web federace internetového vzdělávání
www.metod.narod.ru	Vzdělávací zdroje
www.spb.osi.ru/ic/distant	Dálkové studium na internetu
www.examen.ru	Zkoušky a testy
www.kbsu.ru/~book/	Učebnice informatiky
Mega.km.ru	Encyklopedie a slovníky

Profesionální vyhledávání informací na internetu

Vyhledávání informací je jedním z nejčastějších a zároveň nejrozšířenějších náročné úkoly se kterými se musí každý uživatel na webu vypořádat. Pokud je však pro běžného člena síťové komunity znalost efektivních metod vyhledávání informací žádoucí, ale zdaleka ne povinnou kvalitou, pak pro informační profesionály je schopnost rychle se orientovat v internetových zdrojích a najít požadované zdroje jednou z možností. základní kvalifikační dovednosti.

Důvod obtíží, které vznikají při vyhledávání informací na internetu, je určen dvěma hlavními faktory. Za prvé, počet zdrojů na webu je extrémně velký. Na konci roku 2001 nejhrubší odhady uváděly přibližné číslo 7,5 miliardy dokumentů umístěných na serverech po celém světě. Za druhé, množství informací na webu je nejen kolosální co do objemu, ale také extrémně dynamické. Za půl minuty, kterou jste strávili čtením prvních řádků této části, se ve virtuálním vesmíru objevila asi stovka nových nebo změněných dokumentů, desítky byly přesunuty na nové adresy a jednotky navždy přestaly existovat. Internet nikdy „nespí“, stejně jako nikdy „nespí“ naše planeta, po které se nepřetržitě valí vlna lidské obchodní činnosti přesně v souladu se změnou časových pásem.

Na rozdíl od stabilní a kontrolované sbírky dokumentů v knihovně se na webu potýkáme s gigantickým a neustále se měnícím informačním polem, v němž je hledání dat velmi, velmi složitý proces. Situace často velmi připomíná známý úkol najít jehlu v kupce sena a někdy zůstávají informace velké hodnoty nevyžádané pouze kvůli obtížnosti jejich nalezení.

Většina uživatelů globální počítačové sítě. Amatéři i profesionálové často používají stejné nástroje. Výsledky vyhledávání a čas strávený na nich se však do značné míry liší.

Účelem této sekce je podrobně se seznámit s nástroji a metodami vyhledávání informací a rozvíjet udržitelné dovednosti pro profesionální vyhledávání na webu všech typů dat: od textů v jakémkoli formátu po video a animace.

Jen o komplexu. Programy. Žehlička. Internet. Okna

Profesionální vyhledávání informací na internetu. Přehled programů pro vyhledávání dokumentů a dat Automatické vyhledávání informací na internetu

Co je to

Ten lepší

Proč to potřebuješ?

Co je to

Ten lepší

Proč to potřebuješ?

3. YaCy

Co je to

Ten lepší

Proč to potřebuješ?

4. Pipl

Co je to

Ten lepší

Proč to potřebuješ?

Co je to

Ten lepší

Proč to potřebuješ?

Co je to

Ten lepší

Proč to potřebuješ?

Co je to

Ten lepší

Proč to potřebuješ?

Co je to

Ten lepší

Proč to potřebuješ?

Konečně

Úvod

Kapitola 1

Univerzální internetové vyhledávače

Google

Yandex

Bing

Exalead