Vyhledávání informací na internetu

Internet roste velmi rychlým tempem, tak najděte nezbytné informace mezi stovkami miliard webových stránek a stovkami milionů souborů je to stále obtížnější. K vyhledávání informací se používají speciální vyhledávače, které obsahují neustále aktualizované informace o umístění webových stránek a souborů na stovkách milionů internetových serverů.

Vyhledávače obsahují tematicky seskupené informace o informačních zdrojích World Wide Web v databázích. Speciální programy – roboti periodicky „obcházejí“ internetové webové servery, čtou všechny nalezené dokumenty, zvýrazňují v nich klíčová slova a zadávají internetové adresy dokumentů do databáze.

Většina vyhledávačů umožňuje autorovi webu zadávat informace do databáze vyplněním registračního formuláře. V procesu vyplňování dotazníku zadá vývojář webu adresu webu, jeho název, Stručný popis obsah stránek a také klíčová slova, podle kterých bude nejjednodušší stránky najít.

Vyhledávání klíčových slov. Vyhledání dokumentu v databázi vyhledávače se provádí zadáním dotazů do vyhledávací pole.

Požadavek musí obsahovat jedno nebo více klíčových slov, která jsou pro tento dokument hlavní. Chcete-li například vyhledat samotné internetové vyhledávače, můžete zadat klíčová slova " ruský systém vyhledávat informace na internetu“ (obr. 6.21).

Po nějaké době po odeslání požadavku vyhledávač vrátí seznam internetových adres dokumentů, ve kterých byla nalezena zadaná klíčová slova. Pro zobrazení tohoto dokumentu v prohlížeči stačí aktivovat odkaz, který na něj ukazuje (obr. 6.22).

Pokud byla klíčová slova vybrána neúspěšně, může být seznam adres dokumentů příliš velký (může obsahovat desítky nebo dokonce stovky tisíc odkazů). Chcete-li seznam zúžit, můžete do vyhledávacího pole zadat další klíčová slova nebo použít adresář vyhledávače.

Jedním z nejúplnějších a nejvýkonnějších vyhledávačů je Google (www.google.ru), který ve své databázi ukládá 8 miliard webových stránek a každý měsíc roboti zadají 5 milionů nových stránek. V Runetu (ruská část internetu) mají rozsáhlé databáze obsahující 200 milionů dokumentů, každá má vyhledávače Yandex (www.yandex.ru) a Rambler (www.rambler.ru).

Vyhledávání v hierarchickém adresářovém systému. V databázi vyhledávače jsou webové stránky seskupeny do hierarchické předmětové adresáře, které jsou obdobou věcného katalogu v knihovně.

Tématické sekce nejvyšší úrovně, například: Internet, počítače, věda a vzdělávání a tak dále, obsahují vnořené adresáře. Internetový adresář může například obsahovat podadresáře Hledat, pošta a další (obr. 6.23).

Vyhledávání informací v adresáři se omezuje na výběr konkrétního adresáře, po kterém se uživateli zobrazí seznam odkazů na internetové adresy nejnavštěvovanějších a nejsmysluplnějších webových stránek. Každý odkaz je obvykle anotován, tedy obsahuje krátký komentář k obsahu dokumentu.

Vyhledávač Aport (www.aport.ru) má nejúplnější víceúrovňový hierarchický tematický katalog ruských internetových zdrojů. Katalog obsahuje podrobnou anotaci obsahu webových stránek a uvedení jejich geografického umístění.

Vyhledávání souborů. Pro vyhledávání souborů na serverech pro archivaci souborů existují specializované vyhledávače, včetně vyhledávače FileSearch (www.filesearch.ru). Chcete-li vyhledat soubor, musíte do vyhledávacího pole zadat název souboru a vyhledávač vrátí internetové adresy serverů pro archivaci souborů, které ukládají soubor s daným názvem.

Vyhledávání informací v rusky mluvící části internetu pomocí většiny vyhledávačů: Google, Rambler, Aport, Applex a vyhledávače souborů Research lze provést pomocí integrovaného vyhledávače Gogle.ru (obr. 6.24). K tomu stačí zadat klíčová slova do vyhledávací lišty, pomocí přepínačů nastavit typ požadovaných informací a kliknout na tlačítko s názvem vyhledávače Gogle.ru (obr. 6.24). Stačí zadat klíčová slova do vyhledávacího pole, pomocí přepínačů nastavit typ požadovaných informací a kliknout na tlačítko s názvem vyhledávače.


Rýže. 6.24. Integrovaný vyhledávač Google.ru

Metody vyhledávání na internetu

Tři způsoby vyhledávání na webu

Internet obecně a zejména World Wide Web poskytuje předplatiteli přístup k tisícům serverů a milionům webových stránek, které uchovávají nepředstavitelné množství informací. Jak se neztratit v tomto „informačním oceánu“? Chcete-li to provést, musíte se naučit hledat a najít potřebné informace v síti.

Jak již bylo zmíněno, existují tři hlavní způsoby vyhledávání informací na internetu.

1. Zadání adresy stránky. Tohle je nejvíc rychlý způsob vyhledávání, ale lze jej použít pouze v případě, že je známa přesná adresa dokumentu.

2. Navigace pomocí hypertextových odkazů. Toto je nejméně pohodlná metoda, protože ji lze použít k vyhledávání dokumentů, které jsou svým významem blízké aktuálnímu dokumentu. Pokud je aktuální dokument věnován např. hudbě, pak se pomocí hypertextových odkazů tohoto dokumentu těžko dostanete na stránky věnované sportu.

3. Volání vyhledávacího serveru vyhledávač) . Použití vyhledávačů je nejpohodlnější způsob, jak najít informace. V současnosti jsou v rusky mluvící části internetu oblíbené následující vyhledávací servery:

    Yandex;
    Tramp;
    Aport.

Existují i ​​jiné vyhledávače. Například, efektivní systém vyhledávání implementované na serveru poštovní služby mail.ru.

Vyhledávací servery

Nejdostupnější a nejpohodlnější způsob vyhledávání informací v Celosvětová Síť je používání vyhledávačů. Informace lze zároveň vyhledávat podle katalogů, ale i podle sady klíčových slov charakterizujících hledaný textový dokument.

Zvažte použití vyhledávacích serverů podrobněji. vyhledávací server obsahuje velké množství odkazů na nej různé dokumenty a všechny tyto odkazy jsou uspořádány do tematických adresářů. Například: sport, kino, auta, hry, věda atd. Navíc tyto odkazy nastavuje server nezávisle, v automatický režim pravidelným prohlížením všech webových stránek, které se objevují na World Wide Web. Kromě toho vyhledávací servery poskytují uživateli možnost vyhledávat informace podle klíčových slov. Po zadání klíčových slov začne vyhledávací server procházet dokumenty na jiných webových serverech a zobrazí odkazy na ty dokumenty, ve kterých jsou zadaná slova nalezena. Výsledky vyhledávání jsou obvykle seřazeny v sestupném pořadí podle zvláštního hodnocení dokumentu, které udává, jak dobře daný dokument odpovídá kritériím vyhledávání nebo jak často je na webu požadován.

Jazyk dotazu vyhledávače

Skupina klíčových slov, vytvořená podle určitých pravidel – pomocí dotazovacího jazyka, se nazývá požadavek na vyhledávací server. Dotazovací jazyky pro různé vyhledávače jsou velmi podobné. Více se o tom můžete dozvědět v části „Nápověda“ požadovaného vyhledávacího serveru. Jako příklad zvažte pravidla pro generování dotazů pomocí vyhledávače Yandex.

Syntaxe operátora Co znamená operátor Žádost o příklad
mezera nebo & Logické AND (uvnitř věty) fyzioterapie
&& Logické AND (v dokumentu) recepty && (tavený sýr)
| Logické NEBO fotografie | fotografie | snímek | fotografický obraz
+ Povinná přítomnost slova v nalezeném dokumentu +být nebo +nebýt
() Seskupování slov (technologie | výroba) (sýr | tvaroh)
~ binární operátor A NE (v rámci věty) banky ~ zákon
~~
nebo
_
Binární operátor AND NOT (v dokumentu) Průvodce Paříží ~~ (agentura | zájezd)
/(nm) Vzdálenost ve slovech (mínus (-) - zpět, plus (+) - vpřed) dodavatelů /2 káva hudba /(-2 4) vzdělání volná místa ~ /+1 student
" " Hledání frází "malá červená karkulka" Ekvivalentně: červená / +1 karkulka
&&/(nm) Vzdálenost ve větách (mínus (-) - zpět, plus (+) - vpřed) banka && /1 daně

Získat nejlepší skóre hledejte, musíte si pár zapamatovat jednoduchá pravidla:

    1. Nehledejte informace pouze na jedno klíčové slovo.

    2. Nejlepší je nezadávat klíčová slova velkými písmeny, protože to může způsobit, že nebudou nalezena stejná slova napsaná malými písmeny.

    3. Pokud vaše hledání nepřineslo žádné výsledky, zkontrolujte, zda existují klíčová slova x pravopisných chyb.

Moderní vyhledávače poskytují možnost připojit se k vygenerovanému požadavku sémantického analyzátoru. S jeho pomocí můžete zadáním slova vybrat dokumenty, ve kterých jsou odvozeniny tohoto slova v různých pádech, časech atd.

testové otázky

1. Jak se vyhledávají dokumenty podle klíčových slov? V adresářovém systému?

Úkoly k seberealizaci

6.8 Praktický úkol. Porovnejte výsledky vyhledávání dokumentů podle klíčových slov pomocí různých vyhledávačů (použijte integrovaný vyhledávač Google).

6.9 Praktický úkol. Vyhledejte na serverech archivace soubor přehrávače médií WinAmp.

Říká se, že všechno je na internetu. Ve skutečnosti tomu tak není. Materiály pro umístění na web připravují skuteční lidé, a proto tam najdete jen to, co považují za nutné zveřejnit. Řeka je však napájena potoky a díky jejich kreativitě se dnes na internetu vytvořily již asi dvě miliardy webových stránek. V důsledku toho se katalogizace zdrojů dostupných na webu stala velkým problémem. Přestože se problémem zabývají tisíce organizací, nejenže se neblíží k vyřešení, ale je stále aktuálnější. Procento katalogizovaných zdrojů neustále klesá. V minulé roky tento podzim byl katastrofální. Pokud se tedy v roce 1999 procento katalogizovaných zdrojů přiblížilo 40 %, pak jen v jednom příštím roce kleslo na 25 %.

Závěr je jednoduchý: Webový prostor se zaplňuje rychleji, než je systematizován.

Bohužel nemáme důvod předpokládat, že se v blízké budoucnosti může cokoliv změnit k lepšímu. Z toho vyplývá, že vyhledávání informací na internetu lze považovat za jeden z nejobtížnějších úkolů.

Chcete-li vyhledat informace, které vás zajímají, musíte prohlížeči sdělit adresu webové stránky, na které se nachází. Jedná se o nejrychlejší a nejspolehlivější typ vyhledávání. Pro rychlý přístup ke zdroji, stačí spustit prohlížeč a zadat adresu stránky do adresního řádku.

Adresy webových stránek jsou uvedeny ve speciálních adresářích, tištěných publikacích, znějí v éteru populárních rozhlasových stanic a z televizních obrazovek.

Pokud neznáte adresu, pak pro hledání informací na internetu existují vyhledávače, obsahující informace o internetových zdrojích.

Každý vyhledávač je velká databáze klíčových slov souvisejících s webovými stránkami, na kterých se nachází. Chcete-li vyhledat adresu serveru s informacemi, které vás zajímají, musíte do pole vyhledávače zadat klíčové slovo, několik slov nebo frázi. Tím odešlete dotaz do vyhledávače. Výsledky hledání jsou uvedeny jako seznam adres webových stránek, kde se tato slova vyskytují.

Vyhledávače se zpravidla skládají ze tří částí: robot, index a program pro zpracování požadavků.

Robot (Spider, Robot nebo Bot) je program, který navštěvuje webové stránky a čte (celkově nebo částečně) jejich obsah.

Roboti vyhledávačů se liší svým individuálním schématem analýzy obsahu webové stránky.

Index je úložiště dat, které obsahuje kopie všech stránek navštívených roboty.

Indexy v jednotlivých vyhledávačích se liší množstvím a způsobem ukládání informací. Databáze předních vyhledávačů ukládají informace o desítkách milionů dokumentů a objemy jejich indexů jsou stovky gigabajtů. Indexy jsou periodicky aktualizovány a doplňovány, takže výsledky práce jednoho vyhledávače se stejným dotazem se mohou lišit, pokud bylo vyhledávání provedeno v různých časech.

Obsluha dotazů je program, který podle požadavku uživatele „vyhledá“ v indexu potřebné informace a vrátí odkazy na nalezené dokumenty.

Sada odkazů na výstupu systému je distribuována programem v sestupném pořadí od nejvyššího stupně shody odkazu s požadavkem po nejnižší.

V Rusku jsou nejběžnější vyhledávače:

  • Rambler (www.rambler.ru);
  • Yandex (www.yandex.ru);
  • Mail (www.mail.ru).

V zahraničí je vyhledávačů mnohem více. Nejoblíbenější jsou:

  • Alta Vista (www.altavista.com);
  • Rychlé vyhledávání (www.alltheweb.com);
  • Northern Light (www.northernlight.com).

Yandex je možná nejlepší vyhledávač na ruském internetu. Tato databáze obsahuje asi 200 000 serverů a až 30 milionů dokumentů, které systém naskenuje během několika sekund. Na příkladu tohoto systému si ukážeme, jak se informace hledají.

Vyhledávání informací se nastavuje zadáním klíčového slova do speciálního rámečku a stisknutím tlačítka "Najít" vpravo od rámečku.

Výsledky vyhledávání se objeví během několika sekund a jsou seřazeny podle důležitosti – nejdůležitější dokumenty jsou umístěny na začátku seznamu. V tomto případě je pořadí nalezeného dokumentu určeno místem v dokumentu, kde se klíčové slovo nachází (je důležitější v názvu dokumentu než kdekoli jinde) a počtem zmínek o klíčovém slově (tzv. více zmínek, tím vyšší hodnost).

Stránky umístěné na prvních místech seznamu tedy vedou nikoli z obsahového hlediska, ale prakticky, ve vztahu k frekvenci uvádění klíčového slova. V tomto ohledu bychom se neměli omezovat na prohlížení prvních deseti stránek navržených vyhledávačem.

Obsah stránky lze nepřímo posoudit jejím stručným popisem umístěným vyhledávačem pod adresou stránek. Někteří bezohlední autoři stránek, aby zvýšili pravděpodobnost, že se jejich webová stránka objeví na prvních místech ve vyhledávači, záměrně zařazují do dokumentu nesmyslné opakování klíčového slova. Jakmile ale vyhledávač takový „rozházený“ dokument detekuje, automaticky ho vyřadí ze své databáze.

Dokonce i seřazený seznam dokumentů nabízených vyhledávačem v reakci na klíčovou frázi nebo slovo může být téměř ohromující. V tomto ohledu poskytuje Yandex (stejně jako další výkonné vyhledávače) možnost v rámci prvního seznamu vybrat dokumenty, které přesněji odrážejí účel vyhledávání, tedy upřesnit nebo zlepšit výsledky vyhledávání. Například seznam 34 899 webových stránek na klíčové slovo. Zadáním kvalifikačního klíčového slova do příkazu "Hledat v nálezu" se seznam zmenší na 750 stránek a zadáním dalšího kvalifikačního slova do tohoto příkazu se seznam zmenší na 130 webových stránek.

Vyhledávací adresáře jsou systematickou sbírkou (výběrem) odkazů na jiné internetové zdroje. Odkazy jsou organizovány jako tematický rubrikátor, n představuje hierarchickou strukturu, ve které můžete najít informace, které potřebujete.

Vezměme si jako příklad strukturu internetového katalogu vyhledávání Yandex.

Toto je obecný adresář, protože obsahuje odkazy na internetové zdroje téměř ve všech možných směrech. Tento adresář obsahuje následující témata:

  • Obchod a ekonomika;
  • Společnost a politika;
  • Věda a vzdělávání;
  • Počítače a komunikace;
  • Příručky a odkazy;
  • Domov a rodina;
  • Zábava a rekreace;
  • Kultura a umění.

Každý téma zahrnuje mnoho pododdíly a ty zase obsahují nadpisy atd.

Předpokládejme, že připravujete akci ke Dni vítězství a chcete na internetu vyhledat slova slavné vojenské písně Bulata Okudžavy „Slyšíte dunění bot“. Vyhledávání lze organizovat následovně:

Yandex > Katalog > Kultura a umění > Hudba > Autorská píseň

Tato metoda vyhledávání je poměrně rychlá a efektivní. Na závěr se vám nabízí jen pár odkazů, mezi nimiž jsou odkazy na stránky s písněmi slavných bardů. Zbývá jen najít na webu archiv s texty B. Okudžavy a vybrat v něm požadovaný text.

Další příklad. Předpokládejme, že se chystáte koupit mobilní telefon a chcete porovnat vlastnosti zařízení od různých společností. Vyhledávání lze provést pod následujícími katalogovými titulky:.

Yandex > Katalog > Počítače a komunikace > mobilní připojení> Mobilní telefony

Po obdržení omezené množství odkazy, můžete si je rychle prohlédnout a vybrat telefon zkoumáním charakteristik firem a modifikací zařízení.

Většina vyhledávačů má schopnost vyhledávat podle klíčových slov. Toto je jeden z nejběžnějších typů vyhledávání.

Chcete-li vyhledávat podle klíčových slov, musíte ve speciálním okně zadat slovo nebo několik slov, která chcete vyhledat, a kliknout na tlačítko Najít.

Vyhledávač najde ve své databázi a zobrazí dokumenty obsahující tato slova. Takových dokumentů může být mnoho, ale mnoho v tomto případě nemusí nutně znamenat dobro.

Pojďme provést několik experimentů s některým z vyhledávačů. Předpokládejme, že se rozhodneme založit akvárium a zajímáme se o jakékoli informace na toto téma. Na první pohled nejjednodušší je vyhledat slovo „akvárium“. Pojďme si to ověřit například ve vyhledávači Yandex. Výsledek hledání bude velké množství stránky – obrovské množství odkazů. Navíc, když se podíváte pozorněji, budou mezi nimi stránky, které zmiňují skupinu Aquarium B. Grebenshchikova, obchodní centra a neformální sdružení se stejným názvem a mnoho dalšího, co nemá nic společného s akvarijními rybami.

Je snadné odhadnout, že takové hledání nemůže uspokojit ani nenáročného uživatele. Příliš mnoho času bude muset strávit výběrem ze všech navrhovaných dokumentů těch, které se týkají tématu, které potřebujeme, a ještě více seznámením se s jejich obsahem.

Okamžitě můžeme usoudit, že obvykle není vhodné vyhledávat podle jednoho slova, protože jedním slovem určit téma dokumentu, webové stránky nebo webu je velmi obtížné. Výjimkou jsou vzácná slova a termíny, které se mimo jejich předmětovou oblast téměř nikdy nepoužívají.

Máte-li určitou sadu nejběžnějších výrazů v požadované oblasti, můžete použít pokročilé vyhledávání. Na Obr. zobrazí se okno pokročilého vyhledávání ve vyhledávači Yandex. V tomto režimu jsou možnosti dotazovacího jazyka implementovány jako formulář. Podobnou službu včetně slovníkových filtrů nabízejí snad všechny vyhledávače.

Zkusme si ujasnit podmínky hledání a zadat slovní spojení „akvarijní rybka“. Počet odkazů se sníží více než 20krát. Tento výsledek nám vyhovuje více, ale přesto se mezi navrhovanými odkazy můžete setkat například s ruskými suvenýrovými sadami zápalkových štítků s obrázky ryb a sbírkami počítačových spořičů obrazovky a katalogy akvarijních ryb s fotografiemi a akvaristikou obchody s doplňky. Je zřejmé, že bychom měli pokračovat ve zpřesňování podmínek vyhledávání.

Aby bylo vyhledávání produktivnější, mají všechny vyhledávače speciální dotazovací jazyk s vlastní syntaxí. Tyto jazyky jsou si v mnoha ohledech podobné. Naučit se je všechny je poměrně obtížné, ale každý vyhledávač má systém nápovědy, který vám umožní ovládat požadovaný jazyk.

Zde je několik jednoduchých pravidel pro generování požadavku ve vyhledávači Yandex.

Klíčová slova v dotazu by měla být psána malými (malými) písmeny.

Tím zajistíte, že se budou vyhledávat všechna klíčová slova, nejen ta, která začínají velkým písmenem.

Vyhledávání bere v úvahu všechny formy slova podle pravidel ruského jazyka, bez ohledu na formu slova v dotazu.

Pokud bylo například v dotazu uvedeno slovo „vědět“, pak slova „vím“, „vím“ atd. také splní vyhledávací podmínku.

Chcete-li vyhledat stabilní frázi, uzavřete slova do uvozovek.

Například „porcelánové nádobí“.

Chcete-li hledat přesný tvar slova, musíte před slovo vložit vykřičník.

Chcete-li například vyhledat slovo „září“ v genitivu, napište „!září“.

Chcete-li hledat v jedné větě, slova v dotazu jsou oddělena mezerou nebo znaménkem &

Například „dobrodružný román“ nebo „dobrodružství a román“. Několik slov napsaných v dotazu, oddělených mezerami, znamená, že všechna musí být zahrnuta v jedné větě hledaného dokumentu.

Pokud chcete vybrat pouze ty dokumenty, ve kterých se vyskytuje každé slovo uvedené v dotazu, vložte před každý z nich znaménko plus „+“. Pokud naopak chcete některá slova z výsledku vyhledávání vyloučit, vložte před toto slovo mínus "-". Značky "+" a "-" je třeba psát s mezerou od předchozího a společně s následujícím slovem.

Například dotaz „Volga-car“ najde dokumenty, které obsahují slovo „Volga“ a nikoli slovo „car“.

Při hledání synonym nebo slov, která jsou si významem blízká, můžete mezi slova vložit svislou čáru „|“.

Například pro dotaz „dítě | dítě | baby“ najde dokumenty s kterýmkoli z těchto slov.

Místo jednoho slova v dotazu můžete nahradit celý výraz. Chcete-li to provést, musíte to vzít v závorkách

Například "(dítě | miminko | děti | miminko) + (péče | výchova)".

Znak "~" (tilda) vám umožňuje najít dokumenty s větou obsahující první slovo, ale neobsahující druhé.

Například vyhledávání "knihy ~ obchod" najde všechny dokumenty obsahující slovo "knihy", které vedle sebe (ve větě) nemají slovo "obchod".

Pokud se operátor jednou opakuje (například & nebo ~), vyhledávání se provádí uvnitř věty. Operátor double (&&,~~) vyhledává v dokumentu.

Například při hledání „rakovina ~~ astrologie“ najdete dokumenty se slovem „rakovina“, které s astrologií nesouvisejí.

Vraťme se k příkladu akvarijních ryb. Po přečtení několika dokumentů nabízených vyhledávačem je jasné, že hledání informací na internetu by nemělo začínat výběrem akvarijních ryb. Akvárium je komplexní biologický systém, jehož vytvoření a údržba vyžaduje speciální znalosti, čas a vážné investice.

Na základě obdržených informací může osoba provádějící vyhledávání na internetu radikálně změnit strategii dalšího vyhledávání a rozhodnout se prostudovat odbornou literaturu týkající se zkoumané problematiky.

Pro vyhledávání literatury nebo fulltextových dokumentů je možný následující dotaz:

"+ (akvárium | akvarista | akvarista) + pro začátečníky + (rady | literatura) + (článek | diplomová práce | fulltext) - (cena | obchod | rozvoz | katalog)".

Po zpracování požadavku vyhledávačem byl výsledek velmi úspěšný. Již první odkazy vedou k požadovaným dokumentům.

Nyní můžete shrnout výsledky vyhledávání, vyvodit určité závěry a rozhodnout o možných akcích:

  • Zastavte další hledání, jelikož z různých důvodů je údržba akvária nad vaše síly.
  • Přečtěte si navrhované články a pokračujte v uspořádání akvária.
  • Hledejte materiály o křečcích nebo andulkách.
  1. Jaký typ vyhledávání je nejrychlejší a nejspolehlivější?
  2. Kde může uživatel najít adresy webových stránek?
  3. Co je hlavním účelem vyhledávače?
  4. Jaké jsou části vyhledávače?
  5. Jaké znáte vyhledávače?
  6. Jaká je technologie vyhledávání podle rubrikátoru vyhledávače?
  7. Co je technologie vyhledávání klíčových slov?
  8. Kdy byste měli ve vyhledávacích kritériích použít + nebo -?
  9. Jaká kritéria vyhledávání v Yandexu jsou nastavena následující frází:

    (chůva|vychovatelka|guvernantka)++(péče|vzdělávání|dozor) ?

  10. Co znamená zdvojení znaménka (~~ nebo ++) při vytváření složitého dotazu?

Cvičení.

Úkol 1. Hledejte v adresářích.

Pomocí adresáře vyhledávače vyhledejte následující informace (podle pokynů učitele):

  1. Text písně populární hudební skupiny
  2. Repertoár Mariinského divadla pro aktuální týden
  3. Charakteristika poslední model mobilní telefon známá společnost (dle vašeho výběru)
  4. Recept na ukrajinský boršč s knedlíkem
  5. Dlouhodobá předpověď počasí ve vaší oblasti (alespoň 10 dní)
  6. Fotografie vašeho oblíbeného umělce současné písně
  7. přibližné náklady multimediální počítač(cena)
  8. Informace o volných místech na pozici tajemníka ve vašem kraji či městě
  9. Horoskop vašeho znamení zvěrokruhu pro aktuální den

Na základě výsledků vyhledávání vytvořte písemnou zprávu ve Wordu: prezentujte nalezený, zkopírovaný a zformátovaný materiál v dokumentu. Předložte zprávu učiteli.

Úkol 2. Vytvoření požadavku na přesný název nebo nabídku.

Znáte přesný název dokumentu, například „Hygienické požadavky na osobní elektronické počítače a organizaci práce“. Formulujte dotaz pro vyhledání celého textu dokumentu na internetu.

Uložte výsledek hledání do své složky. Předložte učiteli.

Úkol 3. Tvorba složitých dotazů.

  • V libovolném vyhledávači požádejte o vyhledání informací o ruské lázni. Odstraňte nabídky služeb, inzeráty na koupelnové doplňky a další inzeráty. Zaměřte své pátrání na účinek ruské lázně na tělo.
  • Sestavte složitý dotaz a vyhledejte informace o péči o domácí kočky. Vylučte z vyhledávání velké kočky (jako jsou lvi), stejně jako nabídky ke koupi, prodeji, fotografie na tapetu atd.
  • Vyplňte text požadavku a výsledek hledání ve Wordu a předložte jej učiteli.
Úkol 4. Tématické hledání.

Ať už to znáte, hledejte na internetu informace o historii výpočetní techniky. Hledejte různými směry: historické prostředí, technologie, osobnosti. Prezentujte výsledky vyhledávání formou prezentace. Použijte ve své prezentaci vícestupňový obsah ve formě hypertextových odkazů.

Problém vyhledávání a prostředky jeho organizace

Gigantické a stále narůstající množství informací dostupných na internetu vč. funkční, činí problém vyhledání potřebných informací velmi relevantním a složitým. Rychlost vyhledávání potřebných informací do značné míry určuje profesionalitu uživatele internetu. Stojí za to říci, že pro automatizaci ϶ᴛᴏth úkolu, různé, jak cizí, tak domácí systémy vyhledávání, což jsou webové stránky zvláštního druhu. Navzdory dostupnosti mnoha nástrojů pro automatizaci vyhledávání zůstává tento úkol poměrně pracný a vyžaduje od uživatele určité zkušenosti, intuici a znalost terminologie používané v jeho oboru.

Odhad publikovaný v časopise Nature 8. července 1999 odhadoval, že počet veřejně indexovaných webových stránek byl 800 milionů. O rok později se autor studie (Steve Lawrence z NEC Research Institute) domníval, že se jejich počet téměř zdvojnásobil na 1,5 miliardy. I ty nejlepší vyhledávače neindexují více než jednu stránku ze šesti. Stojí za to říci, že pro extrakci užitečné informace z internetu, musíte vědět, kde a jak hledat.

Vyhledávací nástroj Internet Exploreru zjednodušuje přístup k vyhledávacím nástrojům a eliminuje potřebu znát adresy vyhledávačů. V tomto případě je lepší přímo kontaktovat vyhledávače načtením stránky ϲᴏᴏᴛʙᴇᴛϲᴛʙ.

Podle způsobu organizace vyhledávání a poskytovaných možností lze všechny vyhledávací nástroje podmíněně rozdělit do následujících skupin:

katalogy a specializované databáze;

vyhledávače;

metasearch systémy.

Katalogy a databáze

Katalogy na WWW jsou obdobou systematických knihovních katalogů. Vyhledávání v adresáři spočívá v postupném procházení hierarchického seznamu odkazů nazývaných nadpisy nebo kategorie. První stránka adresáře obsahuje odkazy na hlavní témata, jako je kultura a umění; Medicína a zdraví; Společnost a politika; Obchod a ekonomika; Zábava atd. Kliknutím na odkaz (kategorii) ϲᴏᴏᴛʙᴇᴛϲᴛʙ se otevře stránka obsahující odkazy s podrobnostmi o vybraném tématu (rubrike). Na každé stránce otevřené při pohybu v katalogu tím či oním způsobem je uvedena sekvence zobrazených vnořených nadpisů, například Business World: Finance: Analytics atd.

Všechny katalogy jsou vytvářeny a udržovány v aktuálním stavu ručně specialisty, stejně jako bibliografové sestavují a udržují katalogy knihoven. Je vhodné poznamenat, že popis dokumentu provádějí buď zpracovatelé katalogu, nebo autor. Díky ϶ᴛᴏmu je obsah stránek zařazených do katalogu nejadekvátnější nadpisu, ke kterému jsou přiřazeny. Ale s ohledem na rychlost doplňování a změny informací na internetu „ruční“ způsob údržby katalogů neumožňuje stejně odrážet skutečný stav internetových zdrojů na toto téma.

Vyhledávače

(vyhledávače, vyhledávače, vyhledávací roboti)

Existují desítky velkých a tisíce malých a specializovaných webových stránek věnovaných vyhledávání na internetu. Vyhledávací nástroje skupiny ϶ᴛᴏth umožní uživateli podle určitých pravidel formulovat požadavky na informace, které potřebuje (vytvořit dotaz pomocí dotazovacího jazyka). » vyhledávač, ϲᴏᴏᴛʙᴇᴛʙᴇᴛϲᴛʙ sledovat uživatelem definované požadavky (relevantní pro dotaz ) Vyhledávací uzly mohou používat své vlastní internetové indexy, neustále aktualizované speciálními programy zvanými pavouci (pavouci) Program pavouk zkoumá web, kontroluje každý odkaz na dané stránce, poté na stránkách adresovaných odkazů atd. a informuje svého vlastníka o všech stránky pro následné indexování.

Výsledkem vyhledávání je vytvořena jedna nebo více stránek obsahujících odkazy na dokumenty (webové stránky) relevantní k dotazu Za zmínku stojí, že u každého odkazu je uvedeno datum vytvoření dokumentu, jeho objem, míra relevance k dotazu jsou obvykle uvedeny i textové fragmenty, které charakterizují obsah dokumentu. Kliknutím na takový odkaz si můžete stáhnout stránku, která vás zajímá. V případě velmi velkého množství nalezených dokumentů můžete dotaz upřesnit a v ϲᴏᴏᴛʙᴇᴛϲᴛʙ a zopakovat s ním hledání, ale pouze mezi vybranými stránkami (takové hledání se na různých strojích nazývá různě, ale obvykle ϶ᴛᴏ - hledat v nalezeném) V řadě vyhledávačů můžete určitým způsobem změnit odkaz na stránku, jejíž obsah nejlépe vyhovuje vašim potřebám, a zopakovat hledání s tím, že budete hledat podobné.

Výhodou automatického vyhledávání je ve skutečnosti to, že poskytuje pohled na velmi velké množství informací dostupných na internetu v tento moment. Složitost přesného popisu požadavku, který adekvátně odráží vaše informační potřeby, stejně jako ještě větší složitost úkolu automaticky určit míru ϲᴏᴏᴛʙᴇᴛϲᴛʙ vašeho požadavku prohlížených stránek, zároveň vede k tomu, že počet stran zvolený „na první spuštění“ je tradičně buď velmi malý, nebo příliš velký . Obecně je vyhledávání pomocí vyhledávače iterativním (víceprůchodovým) procesem, v jehož důsledku dochází k postupnému zpřesňování formuláře dotazu.

Metavyhledávací stroje

Jak je uvedeno výše, každý vyhledávač prohlíží určitou sadu serverů a vybírá dokumenty v ϲᴏᴏᴛʙᴇᴛϲᴛʙii podle svých vlastních kritérií. Výsledkem je, že vyhledávání stejných klíčových slov různými systémy poskytuje různé výsledky. To vedlo k myšlence vytvořit tzv. metasearch (neboli multisearch) systémy, které samy nic nevyhledávají, ale obracejí se o pomoc na několik vyhledávačů najednou. Všimněte si, že každý z metavyhledávacích strojů má ϲʙᴏth dotazovací jazyk. Systém přeloží dotaz formulovaný v jeho jazyce do dotazovacích jazyků používaných každým vyhledávačem. Dále jsou výsledky vyhledávání podle všech systémů kombinovány a prezentovány ve formě ϲᴏᴏᴛʙᴇᴛϲᴛʙ. Vyhledávání pomocí metavyhledávačů přirozeně trvá déle než konvenční vyhledávače.

Přehled nejpopulárnějších vyhledávačů

Na internetu je velké množství vyhledávačů a každý uživatel se řídí tím, na který je zvyklý nebo který mu poradili kolegové. Použijeme stručný popis nejoblíbenějších vyhledávačů, který je uveden na jednom ze stránek.

1. Google (www.google.com) Nejrychlejší a největší vyhledávač. Bylo indexováno více než 1,3 miliardy stránek (z toho něco přes 700 milionů kompletně, o zbytku je známa pouze adresa a text odkazu). Můžete zahrnout/vyloučit výsledky z konkrétních stránek a/nebo domén. Na rozdíl od většiny vyhledávačů Google hodnotí popularitu zdroje podle počtu odkazů, které na něj vedou z jiných stránek. Existuje tematické vyhledávání - Apple Macintosh, BSD UNIX, Linux, americká vláda a univerzitní vyhledávání - vyhledávání ve zdrojích předních vědeckých a vzdělávacích institucí.

2. Yandex (www.yandex.ru) Nejlepší domácí vyhledávač. Indexuje především ruskojazyčné zdroje, zatímco ϶ᴛᴏm není z hlediska schopností horší než zahraniční systémy. Vyhledávání lze provádět přesně nebo v libovolných slovních tvarech, omezených datem, s uvedením webu nebo jeho podadresáře. Můžete vyhledávat na základě tzv. citačního indexu, vyhledávat obrázky, skripty, applety; nastavit jazyk dokumentu. Potřebné odkazy se tradičně nacházejí v prvních deseti výsledcích. Má „odlehčenou“ verzi (s minimem designových prvků) na http://www.ya.ru.

3. AltaVista (www.altavista.com) Poskytuje velké rozšíření vyhledávacích kritérií: v Pokročilém vyhledávání je na výběr časový interval, který zahrnuje datum vytvoření nebo úpravy zdroje, podpora 25 jazyků; existuje možnost vydat jeden výsledek na stránku (϶ᴛᴏ zužuje okruh vyhledávání bez obětování kvality) Power search má standardní sadu funkcí. AV byl donedávna velkým portálem, ale z finančních (nejen) důvodů výrazně omezil počet služeb.

4 Yahoo! (www.yahoo.com) Je důležité poznamenat, že jeden z prvních vyhledávačů na internetu. Na rozdíl od standardní sada funkce, umožňuje vybrat zdroje podle data (4 roky, 1, 3, 6 měsíců, týden, 1, 3 dny) Podporuje možnost zadat znak "*" místo libovolné sekvence znaků v klíčových slovech. Na Yahoo! byl sestaven rozsáhlý strukturovaný katalog kategorií (kategorií), nejprve se v nich vyhledává, poté ve vlastním archivu, poté pomocí systémy Google. Vyhledávání v kategoriích dává dobré výsledky – je jich málo a jsou velmi dobré.

5. Lycos (www.lycos.com) V poslední době - ​​jeden z nejpopulárnějších systémů. S tím vším neposkytuje žádné speciální funkce - "AND" "OR", vyhledávání frází, povinná přítomnost / absence slova; v pokročilých funkcích - vyhledávání v názvu, URL, názvu hostitele a / nebo názvu domény; 25 jazyků, včetně ruštiny - jedním slovem celá "obecně přijímaná" sada. Můžete určit typ obsahu zdroje – auto, knihy, ftp, stahování, zprávy atd. Je zřejmé, že popularita Lycos je důsledkem rozsahu ϶ᴛᴏth velkého projektu.

6. Rambler (www.rambler.ru) Donedávna nejznámější ruský vyhledávač. Pokročilé vyhledávání vám neumožňuje hledat fráze a běžné vyhledávání až do února 1999 jen zřídka přineslo přijatelné výsledky. Od února systém ϶ᴛᴏ používá vylepšený vyhledávač, design se změnil, ale kvalita Rambleru se stále nevyrovná Yandexu a Aportu (podle autora, který analyzuje vyhledávače) Stránka má katalog hodnocení Rambler Top 100 zdrojů, jeden z uznávaných zdrojů statistických informací o internetových projektech.

7. Aport (www.aport.ru) Další dobrý ruský vyhledávač. Vyhledávání se provádí pomocí textu (pouze ve všech slovních tvarech) a pomocí URL logické operátory a operátor "…" (avšak zastavovací slova ve frázi jsou stále ignorována), podle data a v samostatných polích (název, popis atd.), metaznaky * a! Prezentace výsledků vyhledávání je ve srovnání s jinými ruskými vyhledávači nejlépe navržená. Určité pochybnosti vyvolává design hlavní stránky, která je zjevně zahlcena informacemi. Na http://aport.ru je o něco „lehčí“ verze.

Jak vybrat vyhledávač

Při hledání na internetu jsou důležité dvě složky – úplnost (nic se neztratilo) a přesnost (nenašlo se nic navíc).

1. Pokrytí a hloubka

Pokrytí označuje objem databáze vyhledávače, který se měří třemi ukazateli – celkovým množstvím indexovaných informací, počtem unikátních serverů a počtem unikátních dokumentů. Hloubkou se rozumí, zda existuje omezení počtu stránek nebo hloubky vnoření adresářů na jednom serveru.

Jak zkontrolovat: Některé stroje píší statistiky robotů na tuto stránku. Můžete si to ale ověřit sami – musíte se jich pár zeptat vyhledávací dotazy, skládající se z jednoho slova (ɥᴛᴏ pro vyloučení vlivu dotazovacího jazyka, včetně různých interpretací prostoru), a když se ϶ᴛᴏm podíváte na statistiku výsledků vydaných strojem - obvykle je to uvedeno na začátku seznamu kolik dokumentů bylo celkem nalezeno. Kromě toho, že by slova měla být z různých oblastí, je dobré vzít i slova různé váhy – rare, „medium“ a „heavy“ (frequently), a porovnat počet nalezených. Zejména těžká slova testují plný text (indexování všech slov v dokumentu) vyhledávače.

Obtížnější je kontrola hloubky chůze robota - pro ϶ᴛᴏ je nutné vzít některé stránky např. s rozvětvenou strukturou archivu a zkontrolovat, zda jsou dokumenty indexovány, kam se lze dostat pouze např. za 6 kliknutí na odkazy.

2. Rychlost procházení a relevance odkazů

Rychlost procházení webu ukazuje, jak rychle je nově přidaný zdroj indexován a jak rychle se aktualizují informace v databázi. Nezapomeňte, že důležitým ukazatelem kvality vyhledávače (jeho robota) bude nejen zachycení nových území, ale také sledování stavu těch již pokrytých. Servery mizí a zůstávají, stránky na nich se aktualizují. Odkazy, které vyhledávač uvádí v seznamu nalezených, musí za prvé existovat a za druhé jejich obsah musí odpovídat požadavku.

Jak zkontrolovat: Objektivní informace lze získat analýzou protokolů serveru - robot vyhledávače je obvykle reprezentován názvem svého stroje (nebo podobným), takže můžete vidět, jak často server navštěvuje, kolik stránek si prohlíží, atd. Bohužel je obvykle ke studiu k dispozici pouze protokol ϲʙᴏ jeho stránek, takže zůstává experimentální metoda.

Chcete-li určit rychlost procházení, musíte někde vytvořit stránku s textem, přidat ji do vyhledávačů a zjistit, jak rychle se začne zobrazovat. Nebo změnit existující stránku. Stojí za zmínku, že pro určení relevance odkazů zkontrolujte dokumenty alespoň na první stránce nalezeného seznamu pro několik dotazů. Zpráva nenalezeno označuje, že dokument již neexistuje.

3. Kvalita vyhledávání (subjektivní ukazatel)

Stojí za zmínku, že každý vyhledávač má ϲʙᴏ a algoritmus pro řazení výsledků vyhledávání. Čím blíže k horní části seznamu je požadovaný dokument, tím lépe funguje relevance.

Jak zkontrolovat: Pouze experimentem. Pro srovnání se doporučuje zadávat požadavky různých délek. Můžete také použít jazyk dotazu, zatímco ϶ᴛᴏm ti, kteří se zdráhají číst popis, mohou použít stránku s rozšířeným dotazem („pokročilé vyhledávání“ v Aport a Yandex, „podrobný dotaz“ v Rambleru – možnosti překladu do ruštiny „pokročilé vyhledávání“ )

Kromě relevance existují důležité uživatelské vlastnosti.

4. Rychlost vyhledávání

Pokud vyhledávač reaguje pomalu, je neefektivní s ním pracovat. Stojí za to dodat, že rychlost, kterou uživatel vidí, závisí nejen na samotném vyhledávači, ale také na internetových kanálech.

Jak zkontrolovat: Experimentem - musíte hledat požadavky různých délek, různé<тяжести>slovy a v různou denní dobu (zatížení serveru je během dne výrazně nerovnoměrné, vrchol je asi tři až čtyři odpoledne)

5. Možnosti vyhledávání (práce s jazykem dokumentu, dotazovacím jazykem)

Dalším bodem srovnání je, co přesně a jak vyhledávač přispívá do indexu. Stojí za zmínku, že fulltextový vyhledávač indexuje všechna slova v textu viditelná uživateli. Přítomnost morfologie umožňuje najít požadovaná slova ve všech deklinacích nebo konjugacích. Kromě ϶ᴛᴏgo, in jazyk HTML existují značky, které může zpracovat i vyhledávač (názvy, odkazy, popisky obrázků atd.)

Téměř všechny stroje mají dotazovací jazyk ve formě standardních logických operátorů (AND, OR, NOT). Někteří jsou schopni hledat fráze nebo slova na danou vzdálenost – ϶ᴛᴏ je často důležité pro získání rozumného výsledku. Doplňkovou funkcí bude vyhledávání v zónách dokumentu – nadpisy, odkazy, klíčová slova (META KEYWORDS) atd. Další funkce dotazovací jazyk - dotaz v přirozeném jazyce, který nevyžaduje znalost operátorů.

Jak zkontrolovat: Obvykle jsou tyto informace zveřejněny na serveru vyhledávače (v Nápovědě "e). Všimněte si, že se však doporučuje kontrolovat skutečné dotazy, protože někdy je jako platné uvedeno to, co chcete.

6. Další vybavení

Jedná se o další funkce, které vyhledávač uživatelům poskytuje. To zahrnuje všechny druhy možností vyhledávání (specializované stránky, vyhledávání podobných dokumentů, omezení rozsahu vyhledávání) a seznam nalezených serverů a vyhledávání podle dat a serverů a uživatelsky přívětivé rozhraní vyhledávač a možnost jeho personalizace.

Jak zkontrolovat: Informace mohou být částečně zveřejněny na serveru vyhledávače, ale nejlepší je zkusit s těmito funkcemi pracovat sami.

Je jasné, že tato analýza bude nějakou dobu trvat. Kromě toho vyhledávače, stejně jako zbytek internetu, nestojí na místě. Přitom vzhledem k tomu, že vyhledávání informací je jednou z důležitých součástí počítačová technologie, ϶ᴛᴏ by měla být věnována dostatečná pozornost - alespoň ne menší než schopnost pracovat v lokální síti.

Na webu Yandex.ru byl proveden průzkum: proč je internet potřebný a co mu chybí (http://www.yandex.ru/polling/9.html) Údaje z průzkumu byly distribuovány v sestupném pořadí takto: Internet je používá se jako adresář (23, 76 %), výzkumný nástroj (15,45 %), zábava (14,15 %) a teprve na čtvrtém místě - zdroj zpráv (12,32 %) Optimisticky znělo, že 10 % uživatelů vždy a 73 % často se podaří najít informace, které potřebujete. A co na internetu chybí: informace, dobré vyhledávání a pořádek (včetně: uspořádanosti, struktury, struktury, strukturovanosti, strukturování, ale i systémů, systematizace, systematizace, systematičnosti a systematizace)

ODPOVĚZ NA OTÁZKY:

Jaké jsou metody organizace vyhledávání na internetu?

Jak se vyhledávají informace v katalozích a databázích?

Jak se zadávají informace do katalogů a databází?

Co jsou internetové vyhledávače?

Jak se tvoří informační databáze ve vyhledávačích?

Kde začíná hledání informací ve vyhledávačích?

Co je žádost?

Jak se hledají informace ve vyhledávačích?

Co znamená relevance dotazu?

Co lze dělat v případě velkého množství dokumentů nalezených při dalším hledání?

Co jsou metavyhledávače?

Jaký je zásadní rozdíl mezi metavyhledávači a konvenčními vyhledávači?

Který z následujících systémů bude metasearch engine:

Jaké jsou nejoblíbenější domácí vyhledávače?

Jaké jsou nejoblíbenější zahraniční vyhledávače?

Jaké dvě složky jsou důležité při vyhledávání informací na internetu?

Jaké vlastnosti určují efektivitu vyhledávačů při vyhledávání informací na internetu?

Podmínky použití:
Práva duševního vlastnictví k materiálu - Informační počítačové sítě- Borisov N.A., Lukin A.A. patří jejímu autorovi. Tato příručka / kniha je zveřejněna pouze pro informační účely, bez zapojení do komerčního oběhu. Všechny informace (včetně „Téma 3. Vyhledávání informací na INTERNETU“) jsou shromažďovány z otevřených zdrojů nebo je přidávají uživatelé zdarma.
Pro plné využití zveřejněných informací Správa projektu stránek důrazně doporučuje zakoupit knihu / manuál Informační počítačové sítě - Borisov N.A., Lukin A.A. v jakémkoli internetovém obchodě.

Tag-block: Informační počítačové sítě - Borisov N.A., Lukin A.A., 2015. Téma 3. Vyhledávání informací na INTERNETU.

(C) Stránka právního úložiště 2011–2016

Tři způsoby vyhledávání na webu

Internet obecně a zejména World Wide Web poskytuje předplatiteli přístup k tisícům serverů a milionům webových stránek, které uchovávají nepředstavitelné množství informací. Jak se neztratit v tomto „informačním oceánu“? Chcete-li to provést, musíte se naučit hledat a najít potřebné informace v síti.

Jak již bylo zmíněno, existují tři hlavní způsoby vyhledávání informací na internetu.

1. Zadání adresy stránky. Toto je nejrychlejší metoda vyhledávání, ale lze ji použít pouze v případě, že je přesně známa adresa dokumentu.

2. Navigace pomocí hypertextových odkazů. Toto je nejméně pohodlná metoda, protože ji lze použít k vyhledávání dokumentů, které mají pouze podobný význam jako aktuální dokument. Pokud je aktuální dokument věnován např. hudbě, pak se pomocí hypertextových odkazů tohoto dokumentu těžko dostanete na stránky věnované sportu.

3. Kontaktování vyhledávacího serveru (vyhledávač). Použití vyhledávačů je nejpohodlnější způsob, jak najít informace. V současnosti jsou v rusky mluvící části internetu populární následující vyhledávací servery: Yandex; Tramp.

Existují i ​​jiné vyhledávače. Například na serveru poštovní služby mail.ru je implementován účinný vyhledávací systém.

Vyhledávací servery

Nejdostupnějším a nejpohodlnějším způsobem hledání informací na World Wide Web je použití vyhledávačů. Informace lze zároveň vyhledávat podle katalogů, ale i podle sady klíčových slov charakterizujících hledaný textový dokument.

Zvažte použití vyhledávacích serverů podrobněji. vyhledávací server obsahuje velké množství odkazů na širokou škálu dokumentů a všechny tyto odkazy jsou systematizovány v tematických adresářích. Například: sport, filmy, auta, hry, věda atd. Navíc tyto odkazy nastavuje server nezávisle, automaticky pravidelným prohlížením všech webových stránek, které se objevují na World Wide Web. Kromě toho vyhledávací servery poskytují uživateli možnost vyhledávat informace podle klíčových slov. Po zadání klíčových slov začne vyhledávací server procházet dokumenty na jiných webových serverech a zobrazí odkazy na ty dokumenty, ve kterých jsou zadaná slova nalezena. Výsledky vyhledávání jsou obvykle seřazeny v sestupném pořadí podle zvláštního hodnocení dokumentu, které udává, jak dobře daný dokument odpovídá kritériím vyhledávání nebo jak často je na webu požadován.

Jazyk dotazu vyhledávače

Skupina klíčových slov, vytvořená podle určitých pravidel – pomocí dotazovacího jazyka, se nazývá požadavek na vyhledávací server. Dotazovací jazyky pro různé vyhledávače jsou velmi podobné. Více se o tom můžete dozvědět v části „Nápověda“ požadovaného vyhledávacího serveru. Zvažte pravidla pro generování dotazů na příkladu vyhledávače Yandex.

Syntaxe operátora Co znamená operátor Žádost o příklad
mezera nebo & Logické AND (uvnitř věty) Pevné zubní protézy
&& Logické AND (v dokumentu) Typy && (pevné zubní protézy)
| Logické NEBO fotografie | fotografie | snímek | fotografický obraz
+ Povinná přítomnost slova v nalezeném dokumentu +být nebo +nebýt
() Seskupování slov (technologie | výroba) (sýr | tvaroh)
~ Binární operátor AND NOT (uvnitř věty) banky ~ zákon
~~ nebo _ Binární operátor AND NOT (v dokumentu) Průvodce Paříží ~~ (agentura | zájezd)
/(nm) Vzdálenost ve slovech (mínus (-) - zpět, plus (+) - vpřed) dodavatelů /2 káva hudba /(-2 4) vzdělání volná místa ~ /+1 student
« « Hledání frází "Pevné zubní protézy" Ekvivalent: Fixní /+1 zubní protézy
&&/(nm) Vzdálenost ve větách (mínus (-) - zpět, plus (+) - vpřed) lékařství && /1 zubní protézy

Obecná informace.

V současné době internet sjednocuje stovky milionů serverů, které hostí miliardy různých stránek a jednotlivých souborů obsahujících různé druhy informací. Je to obrovské úložiště informací. Existují různé způsoby vyhledávání informací na internetu.

Vyhledávání podle známé adresy. Požadované adresy jsou převzaty z adresářů. Pokud znáte adresu, stačí ji zadat adresní řádek Prohlížeč.

www.gov.ru - server ruských státních orgánů.

Konstrukce adresy uživatelem. Se znalostí systému generování internetových adres můžete vytvářet adresy při vyhledávání webových stránek.

Ke klíčovému slovu je potřeba přidat tematickou nebo geografickou doménu (název firmy, podniku, organizace nebo jednoduché anglické podstatné jméno) a musí se propojit intuice.

Adresy komerčních webových stránek:

www.cnn.com (CNN World News),

www.sony.com SONY),

www.mtv.com (hudební zprávy MTV).

Adresy vzdělávacích institucí:

www.ntu.edu (Národní univerzita USA).

Adresy regionálních serverů:

www.poland.net (Polsko),

www.israil.net (Izrael).

Internetové vyhledávače

Pro vyhledávání informací na internetu byly vyvinuty speciální systémy vyhledávání informací. Vyhledávače mají běžnou adresu a zobrazují se jako webová stránka obsahující speciální nástroje pro organizaci vyhledávání (hledaný řetězec, předmětový katalog, odkazy). Chcete-li zavolat vyhledávač, stačí zadat jeho adresu do adresního řádku prohlížeče.

Podle způsobu organizace informací se systémy vyhledávání informací dělí na dva typy: klasifikační (rubrikátory) a slovníkové.

Rubrikátory (klasifikátory) jsou vyhledávače, které využívají hierarchickou (stromovou) organizaci informací. Při vyhledávání informací uživatel prohlíží tematické nadpisy a postupně zužuje vyhledávací pole (například pokud potřebujete najít význam slova, musíte nejprve najít slovník v klasifikátoru a poté jej v něm najít správné slovo).

Slovníkové vyhledávací systémy jsou výkonné automatické softwarové a hardwarové systémy. S jejich pomocí se prohlížejí (skenují) informace na internetu. Údaje o umístění té či oné informace se zapisují do speciálních rejstříků referenčních knih. V reakci na požadavek se provede vyhledávání podle řetězce dotazu. Díky tomu jsou uživateli nabídnuty ty adresy (URL), na kterých bylo v době skenování nalezeno hledané slovo nebo skupina slov. Výběrem kteréhokoli z navrhovaných odkazů můžete přejít na nalezený dokument. Většina moderních vyhledávačů je smíšená.

Nejznámější a nejoblíbenější vyhledávače:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

Existují systémy, které se na vyhledávání specializují informační zdroje v různých směrech.

Hledat lidi na internetu:

www.whowhere.ru www. bigfoot.com

Vyhledávání podle diskusních skupin (Usenet):

www.dejanews.com

Předmětové vyhledávače:

Vyhledávání software:

Hledat v archivech souborů:

http://ftpseach.com city.ru, http://ftpsearch. licos.com

Katalogy (tematické sbírky odkazů s poznámkami):

http://www.atrus.ru

Často lze efektivní vyhledávání informací provádět pomocí regionálních katalogů - specializovaných serverů obsahujících údaje o podnicích nebo webových zdrojích města nebo regionu. Například pro Petrohrad je takový katalog umístěn na adrese http://www.spb.ru.

Seznam IPS lze nalézt na www.monk. newmail.ru

Podrobnější seznam vyhledávačů a adresářů je uveden v tabulce. 3.2.

Pravidla provádění dotazu

V každém vyhledávači v sekci Nápověda získáte informace o tom, jak hledat, jak sestavit řetězec dotazu. Níže jsou uvedeny informace o typickém „průměrném“ dotazovacím jazyce.

Jednoduchá žádost.

Zadejte jedno slovo, které definuje hledané téma. Například do vyhledávače Rambler.ru stačí zadat: automatizace.

Jsou nalezeny dokumenty, které obsahují slova uvedená v žádosti. Všechny formy ruských slov jsou uznávány, zpravidla se ignorují písmena.

V dotazu můžete použít znak "*" nebo "?". Podepsat "?" v klíčovém slově je nahrazen jeden znak, na jehož místo lze nahradit libovolné písmeno a znak "*" je posloupnost znaků.

Například dotazovací automat* najde dokumenty, které obsahují slova automatický, automatický atd.

Komplexní požadavek.

Často je potřeba klíčová slova kombinovat, abyste získali konkrétnější informace. V tomto případě se používají další spojovací slova, funkce, operátory, symboly, kombinace operátorů oddělené závorkami.

Například dotaz music & (beatles | beatles) znamená, že uživatel hledá dokumenty obsahující slova music a beatles nebo music a beatles.

Tabulka 3.1 ukazuje pravidla pro generování požadavků přijatá v systému Aport (http://www.aport.ru).

Tabulka 3.1

Operátoři pro formování požadavků

Operátor Synonyma Komentář
A A & Dotaz najde dokumenty obsahující obě klíčová slova. Může a nemusí být napsáno. Například dotaz: informatika a učebnice je ekvivalentní učebnici informatiky
NEBO NEBO | Vyhledá dokumenty, které používají jedno ze zadaných slov nebo obě slova současně
NE NE-~ Vyhledávání je omezeno na dokumenty, které neobsahují slovo uvedené za operátorem
" " " " Dvojité nebo jednoduché uvozovky vám umožní najít frázi
Datum = datum:datum= Vyhledávání je omezeno na dokumenty, které spadají do zadaného intervalu data Příklad 1. měna datum=01/02/2002-01/03/2002. Tento požadavek vrátí dokumenty obsahující slovo "měna" s datem mezi 1. únorem 2002 a 1. březnem 2002. Příklad 2. datum=01/03/2002 měna Příklad 3. datum:<02/03/2002 валюта

Tabulka 3.2

Seznam vyhledávacích serverů a adresářů

Adresa Popis
www.excite.com Vyhledávač s recenzemi uzlů a průvodci
www.alta-vista.com Vyhledávací server, dostupné možnosti pokročilého vyhledávání
www.hotbot.com vyhledávací server
www.poland.net www.israil.net Regionální vyhledávací servery Polska, Izraele
www.ifoseek.com Vyhledávací server (snadné použití)
www.ipl.org Internet Publik library, veřejná knihovna fungující v rámci projektu World Village
www.wisewire.com WiseWire - organizace vyhledávání pomocí umělé inteligence
www.webcrawler.com WebCrawler - vyhledávací server, snadné použití
www.yahoo.com Webový katalog a rozhraní pro přístup k fulltextovému vyhledávání na serveru AltaVista
www.aport.ru Aport - ruský jazykový vyhledávací server
www.yandex.ru Yandex - ruskojazyčný vyhledávací server
www.rambler.ru Rambler - ruskojazyčný vyhledávací server
Zdroje nápovědy na internetu
www.yellow.com Zlaté stránky internetu
mnich. newmail.ru Vyhledávače různých profilů
www.top200.ru 200 nejlepších webových stránek
www.allru.net
www.ru Katalog ruských internetových zdrojů
www.allru.net/z09. htm Vzdělávací zdroje
www.students.ru Ruský studentský server
www.cdo.ru/index_new. asp Centrum distančního vzdělávání
www.otevřít. ac. Spojené království Otevřená univerzita UK
www.ntu.edu Americká národní univerzita
www.translate.ru Elektronický překladač textů
www.pomorsu.ru/guide. knihovna.html Seznam odkazů na síťové knihovny
www.elibrary.ru Vědecká elektronická knihovna
www.citforum.ru E-knihovna
www.infamed.com/psy Psychologické testy
www.pokoleniye.ru Web federace internetového vzdělávání
www.metoda. people.ru Vzdělávací zdroje
www.spb. www.osi.ru/ic/distant Dálkové studium na internetu
www.examen.ru Zkoušky a testy
www.kbsu.ru/~book/ Učebnice informatiky
Mega. km.ru Encyklopedie a slovníky

Hledání informací na internetu: úskalí

Problémy, které neleží na povrchu, se často projeví až "zpětně", po ukončení určité etapy průzkumných prací a možná na základě jejich výsledků již nějaké rozhodnutí. Co brání zprůhlednění situace od samého začátku fungování toho či onoho systému vyhledávání informací (IPS)? Odpověď je poměrně jednoduchá: nedostatek komplexních informací tohoto druhu na straně vývojáře. Přímým důsledkem toho je nespolehlivost přijímaných dat a jejich nekontrolovaná ztráta. Je vzácné najít na webu vyhledávač, který nemá některé „nedokumentované“ funkce. Zdálo by se, že uživatel nepotřebuje tolik informací, konkrétně:

jak je databáze IPS naplněna a jaký je její objem;

celá řada možností vyhledávacího jazyka systému;

hlavní rysy prezentace výsledků vyhledávání, především algoritmus pro řazení záznamů ze seznamu odpovědí na vyhledávací dotaz.

Bohužel, zdrojem takových informací obvykle není dokument dostupný z hlavní stránky vyhledávacího serveru, ale publikace jednotlivých autorů roztroušené po webu, knihy a počítačové časopisy. Mezi důvody tohoto stavu zjevně patří nejen nedbalost vývojáře, ale také faktor zvaný marketingová politika. Jednoduše řečeno, poskytnutí nejúplnějších informací o sobě vyhledávači nemusí mít vždy pozitivní vliv na jeho hodnocení. Nicméně v některých případech je uživatel docela schopný vzít situaci pod kontrolu. Často je možné pomocí testování zjistit vlastnosti vybrané vyhledávací služby. Vytváření speciálních testovacích dotazů, které rychle objasní přesně ten aspekt fungování systému, který je pro aktuální úlohu nejdůležitější, se v mnoha případech ukazuje jako netriviální. Jak se vyhnout některým problémům při práci s IPS, budeme věnovat naši diskusi. Jako příklady ilustrující prezentaci budou uvažovány široce známé internetové vyhledávače.