Hľadanie informácií na internete

Internet rastie veľmi rýchlym tempom, tak nájdite potrebné informácie medzi stovkami miliárd webových stránok a stovkami miliónov súborov je to čoraz ťažšie. Na vyhľadávanie informácií sa používajú špeciálne vyhľadávače, ktoré obsahujú neustále aktualizované informácie o umiestnení webových stránok a súborov na stovkách miliónov internetových serverov.

Vyhľadávače obsahujú tematicky zoskupené informácie o informačných zdrojoch World Wide Web v databázach. Špeciálne programy – roboty periodicky „obchádzajú“ internetové webové servery, čítajú všetky dokumenty, s ktorými sa stretávajú, zvýrazňujú v nich kľúčové slová a zadávajú internetové adresy dokumentov do databázy.

Väčšina vyhľadávačov umožňuje autorovi webovej stránky zadať informácie do databázy vyplnením registračného formulára. V procese vypĺňania dotazníka zadá vývojár stránky adresu stránky, jej názov, Stručný opis obsah stránky, ako aj kľúčové slová, podľa ktorých bude najjednoduchšie stránku nájsť.

Vyhľadávanie podľa kľúčových slov. Vyhľadávanie dokumentu v databáze vyhľadávača sa vykonáva zadaním dopytov vyhľadávacie pole.

Žiadosť musí obsahovať jedno alebo viac kľúčových slov, ktoré sú pre tento dokument hlavné. Ak chcete napríklad vyhľadať samotné internetové vyhľadávače, môžete zadať kľúčové slová „ ruský systém hľadať informácie na internete“ (obr. 6.21).

Po určitom čase po odoslaní požiadavky vyhľadávač vráti zoznam internetových adries dokumentov, v ktorých boli nájdené zadané kľúčové slová. Pre zobrazenie tohto dokumentu v prehliadači stačí aktivovať odkaz, ktorý naň ukazuje (obr. 6.22).

Ak boli kľúčové slová vybraté neúspešne, zoznam adries dokumentov môže byť príliš veľký (môže obsahovať desiatky alebo dokonca stovky tisíc odkazov). Ak chcete zúžiť zoznam, môžete do vyhľadávacieho poľa zadať ďalšie kľúčové slová alebo použiť adresár vyhľadávacieho nástroja.

Jedným z najkompletnejších a najvýkonnejších vyhľadávacích nástrojov je Google (www.google.ru), ktorý vo svojej databáze uchováva 8 miliárd webových stránok a každý mesiac roboty zadajú 5 miliónov nových stránok. V Runete (ruská časť internetu) majú rozsiahle databázy obsahujúce 200 miliónov dokumentov vyhľadávače Yandex (www.yandex.ru) a Rambler (www.rambler.ru).

Vyhľadávajte v hierarchickom adresárovom systéme. V databáze vyhľadávacieho nástroja sú webové stránky zoskupené do hierarchické predmetové adresáre, ktoré sú obdobou vecného katalógu v knižnici.

Tematické sekcie najvyššej úrovne, napríklad: Internet, počítače, veda a vzdelávanie a tak ďalej, obsahujú vnorené adresáre. Napríklad internetový adresár môže obsahovať podadresáre Hľadať, Mail a iné (obr. 6.23).

Vyhľadávanie informácií v adresári je obmedzené na výber konkrétneho adresára, po ktorom sa používateľovi zobrazí zoznam odkazov na internetové adresy najnavštevovanejších a najzmysluplnejších webových stránok. Každý odkaz je zvyčajne anotovaný, t.j. obsahuje krátky komentár k obsahu dokumentu.

Vyhľadávací nástroj Aport (www.aport.ru) má najkompletnejší viacúrovňový hierarchický tematický katalóg internetových zdrojov v ruskom jazyku. Katalóg obsahuje podrobnú anotáciu obsahu webových stránok a označenie ich geografickej polohy.

Vyhľadávanie súborov. Na vyhľadávanie súborov na serveroch na archiváciu súborov existujú špecializované vyhľadávacie nástroje vrátane vyhľadávacieho nástroja FileSearch (www.filesearch.ru). Ak chcete vyhľadať súbor, musíte do vyhľadávacieho poľa zadať názov súboru a vyhľadávací nástroj vráti internetové adresy serverov na archiváciu súborov, ktoré ukladajú súbor s daným názvom.

Vyhľadávanie informácií v rusky hovoriacej časti internetu pomocou väčšiny vyhľadávačov: Google, Rambler, Aport, Applex a vyhľadávacieho nástroja Research je možné vykonať pomocou integrovaného vyhľadávača Gogle.ru (obr. 6.24). Ak to chcete urobiť, stačí zadať kľúčové slová do vyhľadávacieho panela, pomocou prepínačov nastaviť typ požadovaných informácií a kliknúť na tlačidlo s názvom vyhľadávača Gogle.ru (obr. 6.24). Stačí zadať kľúčové slová do vyhľadávacieho panela, pomocou prepínačov nastaviť typ požadovaných informácií a kliknúť na tlačidlo s názvom vyhľadávača.


Ryža. 6.24. Integrovaný vyhľadávací nástroj Google.ru

Metódy vyhľadávania na internete

Tri spôsoby vyhľadávania na webe

Internet vo všeobecnosti a najmä World Wide Web poskytuje predplatiteľovi prístup k tisíckam serverov a miliónom webových stránok, ktoré uchovávajú nepredstaviteľné množstvo informácií. Ako sa nestratiť v tomto „informačnom oceáne“? Aby ste to dosiahli, musíte sa naučiť vyhľadávať a nájsť potrebné informácie v sieti.

Ako už bolo spomenuté, existujú tri hlavné spôsoby, ako nájsť informácie na internete.

1. Zadanie adresy stránky. Toto je najviac rýchly spôsob vyhľadávanie, ale možno ho použiť len vtedy, ak je známa presná adresa dokumentu.

2. Navigácia pomocou hypertextových odkazov. Toto je najmenej pohodlná metóda, pretože ju možno použiť na vyhľadávanie dokumentov, ktoré sú len blízke aktuálnemu dokumentu. Ak je aktuálny dokument venovaný napríklad hudbe, tak sa pomocou hypertextových odkazov tohto dokumentu len ťažko dostanete na stránku venovanú športu.

3. Volanie vyhľadávacieho servera vyhľadávač) . Používanie vyhľadávačov je najpohodlnejším spôsobom vyhľadávania informácií. V súčasnosti sú v rusky hovoriacej časti internetu populárne nasledujúce vyhľadávacie servery:

    Yandex;
    Rambler;
    Aport.

Existujú aj iné vyhľadávače. Napríklad, efektívny systém vyhľadávanie implementované na serveri Poštová služba mail.ru.

Vyhľadávacie servery

Najdostupnejší a najpohodlnejší spôsob vyhľadávania informácií v World Wide Web je používanie vyhľadávačov. Zároveň je možné informácie vyhľadávať podľa katalógov, ako aj podľa súboru kľúčových slov charakterizujúcich hľadaný textový dokument.

Zvážte použitie vyhľadávacích serverov podrobnejšie. vyhľadávací server obsahuje veľké množstvo odkazov na naj rôzne dokumenty a všetky tieto odkazy sú usporiadané do tematických adresárov. Napríklad: šport, kino, autá, hry, veda atď. Navyše tieto odkazy nastavuje server nezávisle, v automatický režim pravidelným prezeraním všetkých webových stránok, ktoré sa objavujú na World Wide Web. Okrem toho vyhľadávacie servery poskytujú používateľovi možnosť vyhľadávať informácie podľa kľúčových slov. Po zadaní kľúčových slov začne vyhľadávací server prehľadávať dokumenty na iných webových serveroch a zobrazí odkazy na tie dokumenty, v ktorých sa nachádzajú zadané slová. Výsledky vyhľadávania sú zvyčajne zoradené v zostupnom poradí podľa špeciálneho hodnotenia dokumentu, ktoré udáva, do akej miery daný dokument zodpovedá kritériám vyhľadávania alebo ako často sa požaduje na webe.

Jazyk dopytov vyhľadávacieho nástroja

Skupina kľúčových slov, vytvorená podľa určitých pravidiel - pomocou jazyka dopytu, sa nazýva požiadavka na vyhľadávací server. Jazyky dopytov pre rôzne vyhľadávače sú veľmi podobné. Viac sa o tom môžete dozvedieť v sekcii „Pomocník“ požadovaného vyhľadávacieho servera. Zvážte pravidlá na generovanie dopytov pomocou vyhľadávacieho nástroja Yandex ako príklad.

Syntax operátora Čo znamená operátor Žiadosť o príklad
medzera alebo & Logické AND (v rámci vety) fyzioterapia
&& Logické AND (v rámci dokumentu) recepty && (tavený syr)
| Logické ALEBO foto | fotografovanie | snímka | fotografický obraz
+ Povinná prítomnosť slova v nájdenom dokumente +byť alebo +nebyť
() Zoskupovanie slov (technológia | výroba) (syr | tvaroh)
~ binárny operátor A NIE (v rámci vety) banky ~ zákon
~~
alebo
_
Binárny operátor AND NOT (v dokumente) Cestovný sprievodca Paríž ~~ (agentúra | zájazd)
/(nm) Vzdialenosť v slovách (mínus (-) - späť, plus (+) - dopredu) dodávatelia /2 káva hudba /(-2 4) vzdelanie voľné miesta ~ /+1 študent
" " Vyhľadávanie fráz "malá červená čiapočka" Ekvivalent: červená / +1 čiapočka
&&/(nm) Vzdialenosť vo vetách (mínus (-) - späť, plus (+) - dopredu) banka && /1 dane

Získať najlepšie skóre hľadať, musíte si niekoľko zapamätať jednoduché pravidlá:

    1. Nehľadajte informácie len na jedno kľúčové slovo.

    2. Najlepšie je nezadávať kľúčové slová veľkými písmenami, pretože to môže spôsobiť, že tie isté slová napísané malými písmenami sa nenájdu.

    3. Ak vyhľadávanie nevrátilo žiadne výsledky, skontrolujte, či existujú Kľúčové slová x pravopisných chýb.

Moderné vyhľadávače poskytujú možnosť pripojiť sa k vygenerovanej požiadavke sémantického analyzátora. S jeho pomocou môžete zadaním slova vybrať dokumenty, v ktorých sa nachádzajú deriváty tohto slova v rôznych pádoch, časoch atď.

testovacie otázky

1. Ako sa vyhľadávajú dokumenty podľa kľúčových slov? V adresárovom systéme?

Úlohy na sebarealizáciu

6.8 Praktická úloha. Porovnajte výsledky vyhľadávania dokumentov podľa kľúčového slova pomocou rôznych vyhľadávacích nástrojov (použite integrovaný vyhľadávací nástroj Google).

6.9 Praktická úloha. Vyhľadajte na serveroch archívu súbor prehrávača médií WinAmp.

Hovorí sa, že všetko je na internete. V skutočnosti nie je. Materiály na zverejnenie na webe pripravujú skutoční ľudia, a preto tam nájdete len to, čo považujú za potrebné zverejniť. Rieku však napájajú potoky a vďaka ich kreativite už dnes na internete vznikli asi dve miliardy webových stránok. V dôsledku toho sa katalogizácia zdrojov dostupných na webe stala veľkým problémom. Napriek tomu, že sa problémom zaoberajú tisícky organizácií, nielenže sa nepribližuje k vyriešeniu, ale je čoraz akútnejší. Percento katalogizovaných zdrojov neustále klesá. AT posledné roky tento pád bol katastrofálny. Ak sa teda v roku 1999 percento katalogizovaných zdrojov priblížilo k 40 %, potom len v jednom nasledujúcom roku kleslo na 25 %.

Záver je jednoduchý: Webový priestor sa zapĺňa rýchlejšie, ako je systematizovaný.

Žiaľ, nemáme dôvod predpokladať, že sa v blízkej budúcnosti môže čokoľvek zmeniť k lepšiemu. Z toho vyplýva, že vyhľadávanie informácií na internete možno považovať za jednu z najťažších úloh.

Ak chcete vyhľadať informácie, ktoré vás zaujímajú, musíte prehliadaču povedať adresu webovej stránky, na ktorej sa nachádza. Toto je najrýchlejší a najspoľahlivejší typ vyhľadávania. Pre rýchly prístup k zdroju, stačí spustiť prehliadač a zadať adresu stránky do panela s adresou.

Adresy webových stránok sú uvedené v špeciálnych adresároch, tlačených publikáciách, znejú v éteri populárnych rozhlasových staníc a z televíznych obrazoviek.

Ak nepoznáte adresu, potom na vyhľadávanie informácií na internete existujú vyhľadávače, obsahujúce informácie o internetových zdrojoch.

Každý vyhľadávací nástroj je veľká databáza kľúčových slov súvisiacich s webovými stránkami, na ktorých sa nachádza. Ak chcete vyhľadať adresu servera s informáciami, ktoré vás zaujímajú, musíte do poľa vyhľadávača zadať kľúčové slovo, niekoľko slov alebo frázu. Takto odošlete dopyt do vyhľadávača. Výsledky vyhľadávania sú uvedené ako zoznam adries webových stránok, na ktorých sa tieto slová vyskytujú.

Vyhľadávače sa spravidla skladajú z troch častí: robot, index a program na spracovanie požiadaviek.

Robot (Spider, Robot alebo Bot) je program, ktorý navštevuje webové stránky a číta (celkovo alebo čiastočne) ich obsah.

Roboty vyhľadávacích nástrojov sa líšia svojou individuálnou schémou analýzy obsahu webovej stránky.

Index je úložisko údajov, ktoré obsahuje kópie všetkých stránok navštívených robotmi.

Indexy v každom vyhľadávači sa líšia množstvom a spôsobom, akým sú informácie uložené. Databázy popredných vyhľadávačov uchovávajú informácie o desiatkach miliónov dokumentov a objemy ich indexov sú stovky gigabajtov. Indexy sa pravidelne aktualizujú a dopĺňajú, takže výsledky práce jedného vyhľadávača s rovnakým dopytom sa môžu líšiť, ak bolo vyhľadávanie vykonané v rôznych časoch.

Query handler je program, ktorý podľa požiadavky užívateľa „vyhľadá“ index potrebné informácie a vráti odkazy na nájdené dokumenty.

Súbor odkazov na výstupe systému program distribuuje v zostupnom poradí od najvyššieho stupňa zhody odkazu s požiadavkou po najnižší.

V Rusku sú najbežnejšie vyhľadávacie nástroje:

  • Rambler (www.rambler.ru);
  • Yandex (www.yandex.ru);
  • Mail (www.mail.ru).

V zahraničí je vyhľadávačov oveľa viac. Najpopulárnejšie sú:

  • Alta Vista (www.altavista.com);
  • Rýchle vyhľadávanie (www.alltheweb.com);
  • Northern Light (www.northernlight.com).

Yandex je možno najlepší vyhľadávací nástroj na ruskom internete. Táto databáza obsahuje približne 200 000 serverov a až 30 miliónov dokumentov, ktoré systém naskenuje v priebehu niekoľkých sekúnd. Na príklade tohto systému si ukážeme, ako sa informácie vyhľadávajú.

Vyhľadávanie informácií sa nastavuje zadaním kľúčového slova do špeciálneho rámčeka a stlačením tlačidla „Nájsť“ napravo od rámčeka.

Výsledky vyhľadávania sa zobrazia v priebehu niekoľkých sekúnd a sú zoradené podľa dôležitosti – najdôležitejšie dokumenty sú umiestnené na začiatku zoznamu. V tomto prípade je poradie nájdeného dokumentu určené miestom v dokumente, kde sa kľúčové slovo nachádza (v názve dokumentu je dôležitejšie ako na akomkoľvek inom mieste) a počtom zmienok o kľúčovom slove (tzv. čím viac zmienok, tým vyššie hodnotenie).

Stránky umiestnené na prvých miestach v zozname teda vedú nie z obsahového hľadiska, ale prakticky, vo vzťahu k frekvencii uvádzania kľúčového slova. V tomto ohľade by sme sa nemali obmedzovať na prezeranie prvých desiatich stránok navrhnutých vyhľadávacím nástrojom.

Obsah stránky možno nepriamo posúdiť jej stručným popisom umiestneným Vyhľadávačom pod adresou stránky. Niektorí bezohľadní autori stránok, aby zvýšili pravdepodobnosť, že sa ich webová stránka objaví na prvých miestach vo vyhľadávači, zámerne vkladajú do dokumentu nezmyselné opakovania kľúčového slova. Akonáhle ale vyhľadávač zaznamená takýto „posypaný“ dokument, automaticky ho vyradí zo svojej databázy.

Dokonca aj zoznam dokumentov, ktoré vyhľadávací nástroj ponúka ako odpoveď na kľúčovú frázu alebo slovo, môže byť takmer ohromujúci. V tomto ohľade poskytuje Yandex (rovnako ako iné výkonné vyhľadávacie nástroje) možnosť v rámci prvého zoznamu vybrať dokumenty, ktoré presnejšie odrážajú účel vyhľadávania, to znamená spresniť alebo zlepšiť výsledky vyhľadávania. Napríklad zoznam 34 899 webových stránok na kľúčové slovo. Zadaním kvalifikujúceho kľúčového slova do príkazu "Hľadať v nájdených" sa zoznam zmenší na 750 stránok a zadaním ďalšieho kvalifikujúceho slova do tohto príkazu sa zoznam zmenší na 130 webových stránok.

Vyhľadávacie adresáre predstavujú systematický zber (výber) odkazov na iné internetové zdroje. Odkazy sú usporiadané ako tematický rubrikátor, n predstavuje hierarchickú štruktúru, v ktorej môžete nájsť informácie, ktoré potrebujete.

Vezmime si ako príklad štruktúru internetového katalógu vyhľadávania Yandex.

Toto je všeobecný adresár, pretože obsahuje odkazy na internetové zdroje takmer vo všetkých možných smeroch. Tento adresár obsahuje nasledovné témy:

  • Obchod a ekonomika;
  • Spoločnosť a politika;
  • Veda a vzdelávanie;
  • Počítače a komunikácia;
  • Príručky a odkazy;
  • Domov a rodina;
  • Zábava a rekreácia;
  • Kultúra a umenie.

Každý tému zahŕňa mnohé pododdielov , a tie zase obsahujú nadpisy atď.

Predpokladajme, že pripravujete podujatie na Deň víťazstva a chcete na internete vyhľadať slová slávnej vojenskej piesne Bulata Okudžavu „Počujete dunenie čižiem“. Vyhľadávanie môže byť organizované nasledovne:

Yandex > Katalóg > Kultúra a umenie > Hudba > Autorská pieseň

Táto metóda vyhľadávania je pomerne rýchla a efektívna. Na konci sa vám ponúka len niekoľko odkazov, medzi ktorými sú aj odkazy na stránky s piesňami známych bardov. Zostáva len nájsť na stránke archív s textami B. Okudzhavu a vybrať v ňom požadovaný text.

Ďalší príklad. Predpokladajme, že si idete kúpiť mobilný telefón a chcete porovnať vlastnosti zariadení od rôznych spoločností. Vyhľadávanie je možné vykonať podľa nasledujúcich katalógových položiek:.

Yandex > Katalóg > Počítače a komunikácia > mobilné pripojenie> Mobilné telefóny

Po prijatí obmedzené množstvo odkazy, môžete ich rýchlo zobraziť a vybrať telefón preskúmaním charakteristík firiem a modifikácií zariadení.

Väčšina vyhľadávačov má schopnosť vyhľadávať podľa kľúčových slov. Toto je jeden z najbežnejších typov vyhľadávania.

Ak chcete vyhľadávať podľa kľúčových slov, musíte zadať slovo alebo niekoľko slov, ktoré chcete vyhľadať, v špeciálnom okne a kliknúť na tlačidlo Hľadať.

Vyhľadávač nájde vo svojej databáze a zobrazí dokumenty obsahujúce tieto slová. Takýchto dokumentov môže byť veľa, ale veľa v tomto prípade nemusí znamenať dobro.

Urobme niekoľko experimentov s ktorýmkoľvek z vyhľadávačov. Predpokladajme, že sa rozhodneme založiť akvárium a máme záujem o akékoľvek informácie na túto tému. Na prvý pohľad najjednoduchšie je vyhľadať slovo „akvárium“. Skontrolujeme to napríklad vo vyhľadávači Yandex. Výsledok vyhľadávania bude veľké množstvo stránky - obrovské množstvo odkazov. Navyše, ak sa pozriete bližšie, budú medzi nimi stránky, ktoré spomínajú skupinu Aquarium B. Grebenshchikova, nákupné centrá a neformálne združenia s rovnakým názvom a oveľa viac, čo nemá nič spoločné s akváriovými rybami.

Je ľahké uhádnuť, že takéto vyhľadávanie nemôže uspokojiť ani nenáročného používateľa. Príliš veľa času bude musieť stráviť výberom zo všetkých navrhovaných dokumentov tých, ktoré sa týkajú témy, ktorú potrebujeme, a ešte viac oboznámenia sa s ich obsahom.

Okamžite môžeme skonštatovať, že zvyčajne nie je vhodné hľadať podľa jedného slova, pretože jedným slovom sa dá veľmi ťažko určiť téma dokumentu, webovej stránky alebo lokality. Výnimkou sú zriedkavé slová a výrazy, ktoré sa takmer nikdy nepoužívajú mimo ich predmetu.

Ak máte určitý súbor najbežnejších výrazov v požadovanej oblasti, môžete použiť rozšírené vyhľadávanie. Na obr. zobrazí sa okno rozšíreného vyhľadávania vo vyhľadávacom nástroji Yandex. V tomto režime sú možnosti dopytovacieho jazyka implementované ako formulár. Podobnú službu vrátane slovníkových filtrov ponúkajú takmer všetky vyhľadávače.

Skúsme si ujasniť podmienky vyhľadávania a zadať slovné spojenie „akvarijné ryby“. Počet odkazov sa zníži viac ako 20-krát. Tento výsledok nám vyhovuje viac, ale medzi navrhovanými odkazmi sa môžete stretnúť napríklad s ruskými suvenírovými sadami zápaliek s obrázkami rýb a zbierkami šetričov obrazovky počítača a katalógmi akváriových rýb s fotografiami a akvária obchody s príslušenstvom. Je zrejmé, že by sme mali pokračovať v spresňovaní podmienok vyhľadávania.

Aby bolo vyhľadávanie produktívnejšie, všetky vyhľadávače majú špeciálne dopytovací jazyk s vlastnou syntaxou. Tieto jazyky sú si v mnohých ohľadoch podobné. Naučiť sa všetky z nich je dosť ťažké, ale každý vyhľadávací nástroj má systém pomoci, ktorý vám umožní ovládať požadovaný jazyk.

Tu je niekoľko jednoduchých pravidiel na generovanie žiadosti vo vyhľadávacom nástroji Yandex.

Kľúčové slová v dopyte by mali byť napísané malými (malými) písmenami.

Tým sa zabezpečí, že sa vyhľadajú všetky kľúčové slová, nielen tie, ktoré začínajú veľkým písmenom.

Vyhľadávanie zohľadňuje všetky formy slova podľa pravidiel ruského jazyka bez ohľadu na formu slova v dopyte.

Napríklad, ak bolo v dopyte zadané slovo „know“, potom slová „know“, „know“ atď. budú tiež spĺňať podmienku vyhľadávania.

Ak chcete vyhľadať stabilnú frázu, vložte slová do úvodzoviek.

Napríklad „porcelánový riad“.

Ak chcete vyhľadávať podľa presného tvaru slova, musíte pred slovo vložiť výkričník.

Ak chcete napríklad vyhľadať slovo „september“ v prípade genitívu, napíšte „!september“.

Ak chcete hľadať v rámci jednej vety, slová v dopyte sú oddelené medzerou alebo znakom &

Napríklad „dobrodružný román“ alebo „dobrodružstvo a román“. Niekoľko slov napísaných v dopyte oddelených medzerami znamená, že všetky musia byť zahrnuté v jednej vete hľadaného dokumentu.

Ak chcete vybrať iba tie dokumenty, v ktorých sa vyskytuje každé slovo zadané v dotaze, vložte pred každý z nich znamienko plus „+“. Ak naopak chcete z výsledku vyhľadávania vylúčiť akékoľvek slová, vložte pred toto slovo mínus „-“. Značky "+" a "-" sa musia písať s medzerou od predchádzajúceho a spolu s nasledujúcim slovom.

Napríklad dotaz „Volga-car“ nájde dokumenty, ktoré obsahujú slovo „Volga“ a nie slovo „auto“.

Pri hľadaní synoným alebo slov, ktoré sú si blízke významom, môžete medzi slová vložiť zvislú čiaru „|“.

Napríklad pre dotaz „dieťa | dieťa | baby“ nájde dokumenty s ktorýmkoľvek z týchto slov.

Namiesto jedného slova v dotaze môžete nahradiť celý výraz. Ak to chcete urobiť, musíte to vziať do zátvoriek

Napríklad „(dieťa | bábätko | deti | bábätko) + (starostlivosť | výchova)“.

Znak "~" (tilda) vám umožňuje nájsť dokumenty s vetou obsahujúcou prvé slovo, ale neobsahujúcou druhé.

Napríklad vyhľadávanie „knihy ~ obchod“ nájde všetky dokumenty obsahujúce slovo „knihy“, ktoré nemajú vedľa seba (v rámci vety) slovo „obchod“.

Ak sa operátor zopakuje raz (napríklad & alebo ~), vyhľadávanie sa vykoná v rámci vety. Operátor double (&&,~~) vyhľadáva v dokumente.

Napríklad pri vyhľadávaní výrazu „rakovina ~~ astrológia“ nájdete dokumenty so slovom „rakovina“, ktoré s astrológiou nesúvisia.

Vráťme sa k príkladu akváriových rýb. Po prečítaní niekoľkých dokumentov, ktoré ponúka vyhľadávač, je jasné, že vyhľadávanie informácií na internete by nemalo začínať výberom akváriových rýb. Akvárium je komplexný biologický systém, ktorého vytvorenie a údržba si vyžaduje špeciálne znalosti, čas a vážne investície.

Na základe získaných informácií môže osoba vykonávajúca vyhľadávanie na internete radikálne zmeniť stratégiu ďalšieho vyhľadávania a rozhodnúť sa pre štúdium odbornej literatúry týkajúcej sa skúmanej problematiky.

Na vyhľadávanie literatúry alebo fulltextových dokumentov je možný nasledujúci dotaz:

"+ (akvárium | akvarista | akvarista) + pre začiatočníkov + (rady | literatúra) + (článok | diplomová práca | fulltext) - (cena | predajňa | rozvoz | katalóg)".

Po spracovaní požiadavky vyhľadávačom bol výsledok veľmi úspešný. Už prvé odkazy vedú k požadovaným dokumentom.

Teraz môžete zhrnúť výsledky vyhľadávania, vyvodiť určité závery a rozhodnúť o možných akciách:

  • Zastavte ďalšie hľadanie, keďže z rôznych dôvodov je údržba akvária nad vaše sily.
  • Prečítajte si navrhované články a pokračujte v usporiadaní akvária.
  • Vyhľadajte materiály o škrečkoch alebo andulkách.
  1. Aký typ vyhľadávania je najrýchlejší a najspoľahlivejší?
  2. Kde môže používateľ nájsť adresy webových stránok?
  3. Aký je hlavný účel vyhľadávača?
  4. Aké sú časti vyhľadávacieho nástroja?
  5. Aké vyhľadávače poznáte?
  6. Aká je technológia vyhľadávania podľa rubrikátora vyhľadávacieho nástroja?
  7. Čo je technológia vyhľadávania kľúčových slov?
  8. Kedy by ste mali v kritériách vyhľadávania použiť + alebo -?
  9. Aké kritériá vyhľadávania v Yandex sú nastavené nasledujúcou frázou:

    (opatrovateľka|vychovávateľka|guvernantka)++(starostlivosť|vzdelávanie|dozor) ?

  10. Čo znamená zdvojnásobenie znamienka (~~ alebo ++) pri vytváraní zložitého dotazu?

Cvičenie.

Úloha 1. Hľadajte v adresároch.

Použite adresár vyhľadávacieho nástroja na vyhľadanie nasledujúcich informácií (podľa pokynov učiteľa):

  1. Text piesne populárnej hudobnej skupiny
  2. Repertoár Mariinského divadla na aktuálny týždeň
  3. Charakteristika najnovší model mobilný telefón známa spoločnosť (podľa vlastného výberu)
  4. Recept na ukrajinský boršč s knedľou
  5. Dlhodobá predpoveď počasia vo vašej oblasti (najmenej 10 dní)
  6. Fotografia vášho obľúbeného interpreta súčasnej piesne
  7. približné náklady multimediálny počítač(cena)
  8. Informácie o voľných pozíciách na pozíciu tajomníka vo Vašom regióne alebo meste
  9. Horoskop vášho znamenia zverokruhu na aktuálny deň

Na základe výsledkov vyhľadávania vytvorte písomnú správu vo Worde: prezentujte nájdený, skopírovaný a naformátovaný materiál v dokumente. Predložte správu učiteľovi.

Úloha 2. Vytvorenie požiadavky na presný názov alebo cenovú ponuku.

Poznáte presný názov dokumentu, napríklad „Hygienické požiadavky na osobné elektronické počítače a organizácia práce“. Sformulujte dotaz na vyhľadanie celého textu dokumentu na internete.

Uložte výsledok vyhľadávania do svojho priečinka. Prezentujte učiteľovi.

Úloha 3. Vytváranie zložitých dopytov.

  • V akomkoľvek vyhľadávači požiadajte o vyhľadanie informácií o ruskom kúpeli. Zlikvidujte ponuky služieb, inzeráty na kúpeľňové doplnky a iné inzeráty. Zamerajte svoje hľadanie na účinok ruského kúpeľa na telo.
  • Zostavte komplexný dotaz na vyhľadanie informácií o starostlivosti o domáce mačky. Vylúčte z vyhľadávania veľké mačky (napríklad levy), ako aj ponuky na nákup, predaj, fotografie na tapety atď.
  • Vyplňte text žiadosti a výsledok vyhľadávania vo Worde a prezentujte ho učiteľovi.
Úloha 4. Tematické vyhľadávanie.

V každom ohľade, ktorý poznáte, hľadajte na internete informácie o histórii výpočtovej techniky. Hľadajte rôznymi smermi: historické prostredie, technika, osobnosti. Prezentujte výsledky vyhľadávania vo forme prezentácie. Použite vo svojej prezentácii viacstupňový obsah vo forme hypertextových odkazov.

Problém hľadania a prostriedky jeho organizácie

Gigantické a stále narastajúce množstvo informácií dostupných na internete, vr. problém nájsť potrebné informácie je veľmi relevantný a zložitý. Rýchlosť vyhľadávania potrebných informácií do značnej miery určuje profesionalitu používateľa internetu. Stojí za to povedať, že na automatizáciu ϶ᴛᴏth úlohy sú rôzne, zahraničné aj domáce systémy vyhľadávanie, čo sú webové stránky špeciálneho druhu. Zároveň, napriek dostupnosti mnohých nástrojov na automatizáciu vyhľadávania, zostáva táto úloha dosť namáhavá, vyžaduje si od používateľa určité skúsenosti, intuíciu a znalosť terminológie používanej v jeho oblasti.

Odhad publikovaný v časopise Nature 8. júla 1999 odhadoval, že počet verejne indexovaných webových stránok bol 800 miliónov.O rok neskôr sa autor štúdie (Steve Lawrence z NEC Research Institute) domnieval, že ich počet sa takmer zdvojnásobil. na 1,5 miliardy. Dokonca aj tie najlepšie vyhľadávače neindexujú viac ako jednu zo šiestich strán. Stojí za to povedať, že s cieľom extrahovať užitočná informácia z internetu, musíte vedieť, kde a ako hľadať.

Vyhľadávací nástroj Internet Explorera zjednodušuje prístup k vyhľadávacím nástrojom, čím eliminuje potrebu poznať adresy vyhľadávacích nástrojov. V tomto prípade je lepšie priamo kontaktovať vyhľadávače načítaním stránky ϲᴏᴏᴛʙᴇᴛϲᴛʙ.

Podľa spôsobu organizácie vyhľadávania a poskytovaných možností možno všetky vyhľadávacie nástroje podmienečne rozdeliť do nasledujúcich skupín:

katalógy a špecializované databázy;

vyhľadávače;

metasearch systémy.

Katalógy a databázy

Katalógy na WWW sú podobné systematickým knižničným katalógom. Vyhľadávanie v adresári pozostáva z postupného pohybu v hierarchickom zozname odkazov nazývaných nadpisy alebo kategórie. Prvá strana adresára obsahuje odkazy na hlavné témy, akými sú kultúra a umenie; Medicína a zdravie; Spoločnosť a politika; Obchod a ekonomika; Zábava atď. Kliknutím na odkaz ϲᴏᴏᴛʙᴇᴛϲᴛʙ (kategória) sa otvorí stránka obsahujúca odkazy s podrobnosťami o vybranej téme (rubrike).Posunutím nadol v kategóriách podrobností môžete nájsť stránku s požadovanými informáciami. Na každej stránke otvorenej pri pohybe v katalógu takým či onakým spôsobom je uvedená postupnosť zobrazených vnorených nadpisov, napríklad Business World: Finance: Analytics atď.

Všetky katalógy vytvárajú a aktualizujú manuálne špecialisti, rovnako ako bibliografi zostavujú a udržiavajú katalógy knižníc. Je vhodné poznamenať, že popis dokumentu robia buď zostavovatelia katalógu, alebo autor. Vďaka ϶ᴛᴏmu je obsah stránok zahrnutých v katalógu najviac adekvátny položke, ku ktorej sú priradené. Ale vzhľadom na rýchlosť doplňovania a zmeny informácií na internete „manuálny“ spôsob udržiavania katalógov neumožňuje rovnako odrážať skutočný stav internetových zdrojov na túto tému.

Vyhľadávače

(vyhľadávače, vyhľadávače, vyhľadávacie roboty)

Existujú desiatky veľkých a tisíce malých a špecializovaných webových stránok venovaných vyhľadávaniu na internete. Vyhľadávacie nástroje skupiny ϶ᴛᴏth umožnia používateľovi podľa určitých pravidiel formulovať požiadavky na informácie, ktoré potrebuje (vytvoriť dopyt pomocou jazyka dopytu). » vyhľadávací nástroj, ϲᴏᴏᴛʙᴇᴛʙᴇᴛϲᴛʙ sledovať užívateľom definované požiadavky (relevantné pre dopyt ) Vyhľadávacie uzly môžu využívať svoje vlastné internetové indexy, neustále aktualizované špeciálnymi programami nazývanými pavúky (pavúky) Pavúčí program skúma web, kontroluje každý odkaz na danej stránke, potom na stránkach adresované odkazy atď., a informuje svojho vlastníka o všetkých stránky na následné indexovanie.

V dôsledku vyhľadávania sa vytvorí jedna alebo viac stránok, ktoré obsahujú odkazy na dokumenty (webové stránky) relevantné pre dopyt.. Stojí za to povedať, že pre každý odkaz je uvedený dátum vytvorenia dokumentu, jeho objem, stupeň relevantnosti k dotazu sa zvyčajne uvádzajú aj textové fragmenty, ktoré charakterizujú obsah dokumentu. Kliknutím na takýto odkaz si môžete stiahnuť stránku, ktorá vás zaujíma. V prípade veľmi veľkého počtu nájdených dokumentov môžete dotaz spresniť a v ϲᴏᴏᴛʙᴇᴛϲᴛʙ a zopakovať vyhľadávanie s ním, ale len medzi vybranými stránkami (takéto vyhľadávanie sa na rôznych strojoch nazýva inak, ale zvyčajne ϶ᴛᴏ - hľadať v nájdenom) Vo viacerých vyhľadávačoch môžete určitým spôsobom zmeniť odkaz na stránku, ktorej obsah najviac vyhovuje vašim potrebám, a zopakovať vyhľadávanie, pričom musíte hľadať podobné.

Výhodou automatického vyhľadávania je v skutočnosti to, že poskytuje pohľad na veľmi veľké množstvo informácií dostupných na internete v tento moment. Zároveň zložitosť presného popisu požiadavky, ktorý adekvátne odráža vaše informačné potreby, ako aj ešte väčšia zložitosť úlohy automatického určovania miery ϲᴏᴏᴛʙᴇᴛϲᴛʙ vašej požiadavky prezeraných stránok, vedie k tomu, že počet strán vybraný „na prvý pokus“ je tradične buď veľmi malý, alebo príliš veľký. Vo všeobecnosti je vyhľadávanie pomocou vyhľadávača iteratívny (viacprechodový) proces, v dôsledku ktorého sa formulár dopytu postupne spresňuje.

Metavyhľadávacie nástroje

Ako je uvedené vyššie, každý vyhľadávací nástroj prezerá určitú skupinu serverov a vyberá dokumenty v jazyku ϲᴏᴏᴛʙᴇᴛϲᴛʙii podľa vlastných kritérií. Výsledkom je, že vyhľadávanie rovnakých kľúčových slov rôznymi systémami poskytuje rôzne výsledky. To viedlo k myšlienke vytvorenia takzvaných metasearch (alebo multisearch) systémov, ktoré sami nič nehľadajú, ale obracajú sa o pomoc na niekoľko vyhľadávačov naraz. Všimnite si, že každý z metavyhľadávačov má ϲʙᴏth jazyk dopytov. Systém preloží dopyt formulovaný v jeho jazyku do jazykov dopytov, ktoré používa každý vyhľadávací nástroj. Okrem toho sú výsledky vyhľadávania podľa všetkých systémov kombinované a prezentované vo forme ϲᴏᴏᴛʙᴇᴛϲᴛʙ. Prirodzene, vyhľadávanie pomocou metavyhľadávačov trvá dlhšie ako bežné vyhľadávače.

Prehľad najpopulárnejších vyhľadávačov

Na internete je veľké množstvo vyhľadávačov a každý užívateľ sa orientuje podľa toho, na ktorý je zvyknutý, alebo ktorý mu poradili kolegovia. Použijeme krátky popis najpopulárnejších vyhľadávačov, ktorý je uvedený na jednej zo stránok.

1. Google (www.google.com) Najrýchlejší a najväčší vyhľadávač. Indexovaných bolo viac ako 1,3 miliardy stránok (z toho niečo vyše 700 miliónov kompletne, o zvyšku je známa len adresa a text odkazu). Môžete zahrnúť/vylúčiť výsledky z konkrétnych stránok a/alebo domén. Na rozdiel od väčšiny vyhľadávačov Google hodnotí obľúbenosť zdroja podľa počtu odkazov, ktoré naň vedú z iných stránok. Existuje tematicky orientované vyhľadávanie - Apple Macintosh, BSD UNIX, Linux, americká vláda a univerzitné vyhľadávanie - vyhľadávanie v zdrojoch popredných vedeckých a vzdelávacích inštitúcií.

2. Yandex (www.yandex.ru) Najlepší domáci vyhľadávací nástroj. Indexuje hlavne zdroje v ruskom jazyku, zatiaľ čo ϶ᴛᴏm nie je z hľadiska schopností horší ako zahraničné systémy. Vyhľadávanie je možné vykonať presne alebo v ľubovoľných tvaroch slov, obmedzených dátumom, s uvedením lokality alebo jej podadresára. Môžete vyhľadávať na základe takzvaného citačného indexu, vyhľadávať obrázky, skripty, applety; nastaviť jazyk dokumentu. Potrebné odkazy sa tradične nachádzajú v prvej desiatke výsledkov. Má „odľahčenú“ verziu (s minimom dizajnových prvkov) na http://www.ya.ru.

3. AltaVista (www.altavista.com) Poskytuje veľké rozšírenie kritérií vyhľadávania: v Pokročilom vyhľadávaní je možnosť výberu časového intervalu, ktorý zahŕňa dátum vytvorenia alebo úpravy zdroja, podpora 25 jazykov; existuje možnosť vydania jedného výsledku na stránku (϶ᴛᴏ zužuje okruh vyhľadávania bez obetovania kvality) Výkonné vyhľadávanie má štandardnú sadu funkcií. AV bol donedávna veľkým portálom, no z finančných (nielen) dôvodov výrazne zredukoval počet služieb.

4 Yahoo! (www.yahoo.com) Je dôležité poznamenať, že jeden z prvých vyhľadávačov na internete. Okrem toho štandardná sada funkcie, umožňuje výber zdrojov podľa dátumu (4 roky, 1, 3, 6 mesiacov, týždeň, 1, 3 dni) Podporuje možnosť zadať znak "*" namiesto ľubovoľnej postupnosti znakov v kľúčových slovách. Na Yahoo! bol zostavený rozsiahly štruktúrovaný katalóg kategórií (kategórií), v ktorých sa najprv vyhľadáva v nich, potom vo vlastnom archíve, potom - pomocou systémy Google. Vyhľadávanie v kategóriách dáva dobré výsledky – je ich málo a sú veľmi dobré.

5. Lycos (www.lycos.com) V poslednej dobe - jeden z najpopulárnejších systémov. S tým všetkým neposkytuje žiadne špeciálne funkcie - "AND" "ALEBO", vyhľadávanie fráz, povinná prítomnosť / absencia slova; v pokročilých funkciách - vyhľadávanie v názve, URL, názve hostiteľa a / alebo názve domény; 25 jazykov vrátane ruštiny - jedným slovom celá "všeobecne akceptovaná" sada. Môžete určiť typ obsahu zdroja - auto, knihy, ftp, sťahovanie, správy atď. Je zrejmé, že popularita Lycos je dôsledkom rozsahu ϶ᴛᴏth veľkého projektu.

6. Rambler (www.rambler.ru) Donedávna najznámejší ruský vyhľadávač. Rozšírené vyhľadávanie vám neumožňuje vyhľadávať frázy a bežné vyhľadávanie do februára 1999 len zriedkavo prinieslo prijateľné výsledky. Od februára systém ϶ᴛᴏ používa vylepšený vyhľadávací nástroj, zmenil sa dizajn, ale kvalita Rambler sa stále nevyrovná Yandex a Aport (podľa autora, ktorý analyzuje vyhľadávače) Stránka má katalóg hodnotení Rambler Top 100 zdrojov, jeden z uznávaných zdrojov štatistických informácií o internetových projektoch.

7. Aport (www.aport.ru) Ďalší dobrý ruský vyhľadávač. Vyhľadávanie sa vykonáva pomocou textu (iba vo všetkých tvaroch slov) a pomocou adresy URL logické operátory a operátor „…“ (zastavovacie slová vo fráze sa však stále ignorujú), podľa dátumu a v samostatných poliach (názov, popis atď.), metaznaky * a! Prezentácia výsledkov vyhľadávania je v porovnaní s inými ruskými vyhľadávačmi najlepšie navrhnutá. Určité pochybnosti spôsobuje dizajn hlavnej stránky, ktorá je zjavne presýtená informáciami. Na stránke http://aport.ru je o niečo „ľahšia“ verzia.

Ako si vybrať vyhľadávač

Pri vyhľadávaní na internete sú dôležité dve zložky – úplnosť (nič sa nestratilo) a presnosť (nenašlo sa nič navyše).

1. Pokrytie a hĺbka

Pokrytie sa vzťahuje na objem databázy vyhľadávacieho nástroja, ktorý sa meria tromi ukazovateľmi - celkovým množstvom indexovaných informácií, počtom jedinečných serverov a počtom jedinečných dokumentov. Hĺbkou sa rozumie, či existuje obmedzenie počtu stránok alebo hĺbky vnorenia adresárov na jednom serveri.

Ako skontrolovať: Niektoré stroje píšu štatistiky robotov na tejto stránke. Môžete si to však skontrolovať sami - musíte sa opýtať niekoľkých vyhľadávacie dopyty, pozostávajúce z jedného slova (ɥᴛᴏ na vylúčenie vplyvu dopytovacieho jazyka vrátane rôznych interpretácií priestoru), a keď sa ϶ᴛᴏm pozriem na štatistiku výsledkov vydaných strojom - zvyčajne je to uvedené na začiatku zoznamu koľko dokumentov sa celkovo našlo. Okrem toho, že slová by mali byť z rôznych oblastí, je dobré zobrať aj slová rôznej váhy – zriedkavé, „stredné“ a „ťažké“ (časté), a porovnávať počet nájdených. Najmä ťažké slová testujú úplný text (indexovanie všetkých slov v dokumente) vyhľadávacieho nástroja.

Náročnejšie je kontrolovať hĺbku chôdze robota – pre ϶ᴛᴏ je potrebné zobrať niektoré stránky napríklad s rozvetvenou štruktúrou archívu a skontrolovať, či sú dokumenty indexované, kam sa dá dostať len napr. za 6 kliknutí na odkazy.

2. Rýchlosť indexového prehľadávania a relevantnosť odkazov

Rýchlosť prechodu webu ukazuje, ako rýchlo sa indexuje novo pridaný zdroj a ako rýchlo sa aktualizujú informácie v databáze. Nezabúdajte, že dôležitým ukazovateľom kvality vyhľadávača (jeho robota) bude nielen zachytenie nových území, ale aj sledovanie stavu tých už pokrytých. Servery zmiznú a zostanú, stránky na nich sa aktualizujú. Odkazy, ktoré vyhľadávač uvádza v zozname nájdených, musia v prvom rade existovať a v druhom rade ich obsah musí zodpovedať požiadavke.

Ako skontrolovať: Objektívne informácie je možné získať analýzou protokolov servera – robot vyhľadávacieho nástroja je zvyčajne reprezentovaný názvom svojho stroja (alebo podobným), takže môžete vidieť, ako často server navštevuje, koľko stránok si prezerá, atď. Bohužiaľ, zvyčajne je k dispozícii na štúdium iba protokol ϲʙᴏ jeho stránky, takže zostáva experimentálna metóda.

Ak chcete určiť rýchlosť prehľadávania, musíte niekde vytvoriť stránku s textom, pridať ju do vyhľadávačov a zistiť, ako rýchlo sa začne zobrazovať. Alebo zmeňte existujúcu stránku. Stojí za to povedať, že na určenie relevantnosti odkazov skontrolujte dokumenty aspoň na prvej stránke nájdeného zoznamu pre niekoľko otázok. Správa nenájdené označuje, že dokument už neexistuje.

3. Kvalita vyhľadávania (subjektívny ukazovateľ)

Stojí za to povedať, že každý vyhľadávací nástroj má ϲʙᴏ a algoritmus na triedenie výsledkov vyhľadávania. Čím bližšie k hornej časti zoznamu je požadovaný dokument, tým lepšie funguje relevantnosť.

Ako skontrolovať: Iba experimentom. Na porovnanie sa odporúča zadať požiadavky rôznych dĺžok. Môžete tiež použiť jazyk dopytu, zatiaľ čo ϶ᴛᴏm tí, ktorí sa zdráhajú čítať popis, môžu použiť stránku s rozšíreným dopytom („rozšírené vyhľadávanie“ v Aport a Yandex, „podrobný dopyt“ v Rambleri – možnosti prekladu do ruštiny „rozšírené vyhľadávanie“ )

Okrem relevantnosti existujú aj dôležité užívateľské charakteristiky.

4. Rýchlosť vyhľadávania

Ak vyhľadávač reaguje pomaly, je neefektívne s ním pracovať. Je potrebné dodať, že rýchlosť, ktorú používateľ vidí, závisí nielen od samotného vyhľadávača, ale aj od internetových kanálov.

Ako skontrolovať: Experimentom - musíte hľadať požiadavky rôznych dĺžok, rôzne<тяжести>slová a v rôznych časoch dňa (zaťaženie servera je počas dňa výrazne nerovnomerné, vrchol je asi o tretej až štvrtej popoludní)

5. Možnosti vyhľadávania (práca s jazykom dokumentu, jazykom dopytu)

Ďalším bodom porovnania je, čo presne a ako vyhľadávač prispieva do indexu. Stojí za to povedať, že fulltextový vyhľadávač indexuje všetky slová textu viditeľné pre používateľa. Prítomnosť morfológie umožňuje nájsť požadované slová vo všetkých deklináciách alebo konjugáciách. Okrem ϶ᴛᴏgo, v jazyk HTML existujú značky, ktoré dokáže spracovať aj vyhľadávač (názvy, odkazy, popisky obrázkov atď.)

Takmer všetky stroje majú dotazovací jazyk vo forme štandardných logických operátorov (AND, OR, NOT). Niektorí sú schopní vyhľadávať frázy alebo slová v danej vzdialenosti – ϶ᴛᴏ je často dôležité na získanie rozumného výsledku. Doplnkovou funkciou bude vyhľadávanie v zónach dokumentu – nadpisy, odkazy, kľúčové slová (META KEYWORDS) atď. Ďalšia funkcia dotazovací jazyk – dopyt v prirodzenom jazyku, ktorý nevyžaduje znalosť operátorov.

Ako skontrolovať: Zvyčajne sú tieto informácie zverejnené na serveri vyhľadávača (v Pomocníkovi "e). Upozorňujeme, že napriek tomu sa odporúča kontrolovať skutočné dopyty, pretože niekedy je za platné to, čo chcete.

6. Dodatočné vybavenie

Toto sú ďalšie funkcie, ktoré vyhľadávač poskytuje používateľom. To zahŕňa všetky druhy možností vyhľadávania (špecializované stránky, vyhľadávanie podobných dokumentov, obmedzenie rozsahu vyhľadávania) a zoznam nájdených serverov a vyhľadávanie podľa dátumov a serverov a užívateľsky prívetivé rozhranie vyhľadávač, a možnosť jeho personalizácie.

Ako skontrolovať: Informácie môžu byť čiastočne zverejnené na serveri vyhľadávača, ale najlepšie je skúsiť s týmito funkciami pracovať sami.

Je jasné, že táto analýza bude nejaký čas trvať. Okrem toho vyhľadávače, rovnako ako zvyšok internetu, nestoja. Zároveň vzhľadom na to, že vyhľadávanie informácií je jednou z dôležitých zložiek počítačová technológia, ϶ᴛᴏ by sa mala venovať dostatočná pozornosť - aspoň nie menšia ako schopnosť pracovať v lokálnej sieti.

Na stránke Yandex.ru sa uskutočnil prieskum: prečo je internet potrebný a čo mu chýba (http://www.yandex.ru/polling/9.html) Údaje z prieskumu boli distribuované v zostupnom poradí takto: Internet je používa sa ako adresár (23, 76 %), výskumný nástroj (15,45 %), zábava (14,15 %) a až na štvrtom mieste - zdroj správ (12,32 %) Znelo optimisticky, že 10 % používateľov vždy a 73 % často sa vám podarí nájsť potrebné informácie. A čo na internete chýba: informácie, dobré vyhľadávanie a poriadok (vrátane: usporiadanosti, štruktúry, štruktúry, štruktúrovanosti, štruktúrovania, ako aj systémov, systematizácie, systematizácie, systematickosti a systematizácie)

ODPOVEDZ NA OTÁZKU:

Aké sú metódy organizácie vyhľadávania na internete?

Ako sa vyhľadávajú informácie v katalógoch a databázach?

Ako sa vkladajú informácie do katalógov a databáz?

Čo sú internetové vyhľadávače?

Ako sa tvorí informačná databáza vo vyhľadávačoch?

Kde začína hľadanie informácií vo vyhľadávačoch?

čo je žiadosť?

Ako sa vyhľadávajú informácie vo vyhľadávačoch?

Čo znamená relevantnosť dopytu?

Čo možno urobiť v prípade veľkého počtu dokumentov nájdených pri ďalšom hľadaní?

Čo sú metavyhľadávače?

Aký je zásadný rozdiel medzi metavyhľadávačkami a konvenčnými vyhľadávačmi?

Ktorý z nasledujúcich systémov bude metavyhľadávačom:

Aké sú najobľúbenejšie domáce vyhľadávače?

Aké sú najobľúbenejšie zahraničné vyhľadávače?

Ktoré dve zložky sú dôležité pri vyhľadávaní informácií na internete?

Aké vlastnosti určujú efektivitu vyhľadávačov pri vyhľadávaní informácií na internete?

Podmienky používania:
Práva duševného vlastníctva k materiálu - Informačné počítačové siete- Borisov N.A., Lukin A.A. patrí jeho autorovi. Táto príručka/kniha je zverejnená len na informačné účely bez zapojenia do komerčného obehu. Všetky informácie (vrátane „Témy 3. Vyhľadávanie informácií na INTERNETE“) sa zhromažďujú z otvorených zdrojov alebo ich pridávajú používatelia bezplatne.
Pre plné využitie zverejnených informácií Správa projektu stránky dôrazne odporúča zakúpiť si knihu / manuál Informačné počítačové siete - Borisov N.A., Lukin A.A. v akomkoľvek internetovom obchode.

Tag-block: Informačné počítačové siete - Borisov N.A., Lukin A.A., 2015. Téma 3. Vyhľadávanie informácií na INTERNETE.

(C) Stránka legálneho archívu 2011-2016

Tri spôsoby vyhľadávania na webe

Internet vo všeobecnosti a najmä World Wide Web poskytuje predplatiteľovi prístup k tisíckam serverov a miliónom webových stránok, ktoré uchovávajú nepredstaviteľné množstvo informácií. Ako sa nestratiť v tomto „informačnom oceáne“? Aby ste to dosiahli, musíte sa naučiť vyhľadávať a nájsť potrebné informácie v sieti.

Ako už bolo spomenuté, existujú tri hlavné spôsoby, ako nájsť informácie na internete.

1. Zadanie adresy stránky. Ide o najrýchlejšiu metódu vyhľadávania, ale možno ju použiť len vtedy, ak je presne známa adresa dokumentu.

2. Navigácia pomocou hypertextových odkazov. Toto je najmenej pohodlná metóda, pretože ju možno použiť na vyhľadávanie dokumentov, ktoré majú iba podobný význam ako aktuálny dokument. Ak je aktuálny dokument venovaný napríklad hudbe, tak sa pomocou hypertextových odkazov tohto dokumentu len ťažko dostanete na stránku venovanú športu.

3. Kontaktovanie vyhľadávacieho servera (vyhľadávač). Používanie vyhľadávačov je najpohodlnejším spôsobom vyhľadávania informácií. V súčasnosti sú v rusky hovoriacej časti internetu populárne nasledujúce vyhľadávacie servery: Yandex; Rambler.

Existujú aj iné vyhľadávače. Napríklad na serveri poštových služieb mail.ru je implementovaný efektívny vyhľadávací systém.

Vyhľadávacie servery

Najdostupnejším a najpohodlnejším spôsobom vyhľadávania informácií na World Wide Web je použitie vyhľadávacích nástrojov. Zároveň je možné informácie vyhľadávať podľa katalógov, ako aj podľa súboru kľúčových slov charakterizujúcich hľadaný textový dokument.

Zvážte použitie vyhľadávacích serverov podrobnejšie. vyhľadávací server obsahuje veľké množstvo odkazov na širokú škálu dokumentov a všetky tieto odkazy sú systematizované v tematických adresároch. Napríklad: šport, filmy, autá, hry, veda atď. Navyše tieto odkazy nastavuje server nezávisle, automaticky pravidelným prezeraním všetkých webových stránok, ktoré sa objavujú na World Wide Web. Okrem toho vyhľadávacie servery poskytujú používateľovi možnosť vyhľadávať informácie podľa kľúčových slov. Po zadaní kľúčových slov začne vyhľadávací server prehľadávať dokumenty na iných webových serveroch a zobrazí odkazy na tie dokumenty, v ktorých sa nachádzajú zadané slová. Výsledky vyhľadávania sú zvyčajne zoradené v zostupnom poradí podľa špeciálneho hodnotenia dokumentu, ktoré udáva, do akej miery daný dokument zodpovedá kritériám vyhľadávania alebo ako často sa požaduje na webe.

Jazyk dopytov vyhľadávacieho nástroja

Skupina kľúčových slov, vytvorená podľa určitých pravidiel - pomocou jazyka dopytu, sa nazýva požiadavka na vyhľadávací server. Jazyky dopytov pre rôzne vyhľadávače sú veľmi podobné. Viac sa o tom môžete dozvedieť v sekcii „Pomocník“ požadovaného vyhľadávacieho servera. Zvážte pravidlá pre generovanie dopytov na príklade vyhľadávacieho nástroja Yandex.

Syntax operátora Čo znamená operátor Žiadosť o príklad
medzera alebo & Logické AND (v rámci vety) Pevné zubné protézy
&& Logické AND (v rámci dokumentu) Typy && (pevné zubné protézy)
| Logické ALEBO foto | fotografovanie | snímka | fotografický obraz
+ Povinná prítomnosť slova v nájdenom dokumente +byť alebo +nebyť
() Zoskupovanie slov (technológia | výroba) (syr | tvaroh)
~ Binárny operátor AND NOT (v rámci vety) banky ~ zákon
~~ alebo _ Binárny operátor AND NOT (v dokumente) Cestovný sprievodca Paríž ~~ (agentúra | zájazd)
/(nm) Vzdialenosť v slovách (mínus (-) - späť, plus (+) - dopredu) dodávatelia /2 káva hudba /(-2 4) vzdelanie voľné miesta ~ /+1 študent
« « Vyhľadávanie fráz "Pevné zubné protézy" Ekvivalent: Pevné /+1 zubné protézy
&&/(nm) Vzdialenosť vo vetách (mínus (-) - späť, plus (+) - dopredu) liek && /1 zubné protézy

Všeobecné informácie.

V súčasnosti internet spája stovky miliónov serverov, ktoré sú hostiteľmi miliárd rôznych stránok a jednotlivých súborov obsahujúcich rôzne druhy informácií. Je to obrovské úložisko informácií. Existujú rôzne spôsoby vyhľadávania informácií na internete.

Vyhľadajte podľa známej adresy. Požadované adresy sú prevzaté z adresárov. Ak poznáte adresu, stačí ju zadať adresný riadok Prehliadač.

www.gov.ru - server ruských štátnych orgánov.

Konštrukcia adresy používateľom. Keď poznáte systém generovania internetových adries, môžete vytvárať adresy pri vyhľadávaní webových stránok.

Ku kľúčovému slovu je potrebné pridať tematickú alebo geografickú doménu (názov firmy, podniku, organizácie alebo jednoduché anglické podstatné meno) a musí sa prepojiť intuícia.

Adresy komerčných webových stránok:

www.cnn.com (CNN World News),

www.sony.com SONY),

www.mtv.com (hudobné správy MTV).

Adresy vzdelávacích inštitúcií:

www.ntu.edu (Národná univerzita USA).

Adresy regionálnych serverov:

www.poland.net (Poľsko),

www.israil.net (Izrael).

Internetové vyhľadávače

Na vyhľadávanie informácií na internete boli vyvinuté špeciálne systémy na vyhľadávanie informácií. Vyhľadávače majú bežnú adresu a zobrazujú sa ako webová stránka obsahujúca špeciálne nástroje na organizáciu vyhľadávania (hľadací reťazec, predmetový katalóg, odkazy). Ak chcete zavolať vyhľadávač, stačí zadať jeho adresu do panela s adresou v prehliadači.

Podľa spôsobu organizácie informácií sa systémy na vyhľadávanie informácií delia na dva typy: klasifikačné (rubrikátory) a slovníky.

Rubrikátory (klasifikátory) sú vyhľadávače, ktoré využívajú hierarchickú (stromovú) organizáciu informácií. Pri vyhľadávaní informácií používateľ prezerá tematické nadpisy a postupne zužuje vyhľadávacie pole (ak napríklad potrebujete nájsť význam slova, musíte najskôr nájsť slovník v klasifikátore a potom ho nájsť v ňom správne slovo).

Slovníkové vyhľadávacie systémy sú výkonné automatické softvérové ​​a hardvérové ​​systémy. S ich pomocou sa prezerajú (skenujú) informácie na internete. Údaje o umiestnení tejto alebo tej informácie sa vkladajú do špeciálnych referenčných kníh-indexov. Ako odpoveď na požiadavku sa vykoná vyhľadávanie v súlade s reťazcom dopytu. V dôsledku toho sa používateľovi ponúknu tie adresy (URL), na ktorých sa v čase skenovania našlo hľadané slovo alebo skupina slov. Výberom ktoréhokoľvek z navrhovaných odkazov môžete prejsť na nájdený dokument. Väčšina moderných vyhľadávačov je zmiešaná.

Najznámejšie a najpopulárnejšie vyhľadávače:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

Existujú systémy, ktoré sa špecializujú na vyhľadávanie informačné zdroje v rôznych smeroch.

Vyhľadajte ľudí na internete:

www.whowhere.ru www. bigfoot.com

Hľadať podľa diskusných skupín (Usenet):

www.dejanews.com

Predmetové vyhľadávače:

Vyhľadávanie softvér:

Hľadať v archívoch súborov:

http://ftpseach.com city.ru, http://ftpsearch. licos.com

Katalógy (tematické zbierky odkazov s anotáciami):

http://www.atrus.ru

Efektívne vyhľadávanie informácií je často možné vykonať pomocou regionálnych katalógov - špecializovaných serverov obsahujúcich údaje o podnikoch alebo webových zdrojoch mesta alebo regiónu. Napríklad pre Petrohrad sa takýto katalóg nachádza na adrese http://www.spb.ru.

Zoznam IPS možno nájsť na www.monk. newmail.ru

Podrobnejší zoznam vyhľadávacích nástrojov a adresárov je uvedený v tabuľke. 3.2.

Pravidlá vykonávania dotazov

V každom vyhľadávači v časti Pomocník môžete získať informácie o tom, ako hľadať, ako zostaviť reťazec dopytu. Nižšie sú uvedené informácie o typickom „priemernom“ jazyku dopytov.

Jednoduchá žiadosť.

Zadajte jedno slovo, ktoré definuje tému vyhľadávania. Napríklad vo vyhľadávači Rambler.ru stačí zadať: automatizácia.

Nájdené sú dokumenty, ktoré obsahujú slová uvedené v žiadosti. Všetky formy ruských slov sú uznávané, spravidla sa ignorujú písmená.

V dotaze môžete použiť znak „*“ alebo „?“. Podpísať "?" v kľúčovom slove sa nahrádza jeden znak, namiesto ktorého je možné nahradiť ľubovoľné písmeno a znak „*“ je postupnosť znakov.

Napríklad dopytovací automat* nájde dokumenty, ktoré obsahujú slová automatický, automatický atď.

Komplexná požiadavka.

Často je potrebné kombinovať kľúčové slová, aby ste získali konkrétnejšie informácie. V tomto prípade sa používajú ďalšie spojovacie slová, funkcie, operátory, symboly, kombinácie operátorov oddelené zátvorkami.

Napríklad dopyt hudba & (beatles | beatles) znamená, že používateľ hľadá dokumenty obsahujúce slová hudba a beatles alebo hudba a beatles.

Tabuľka 3.1 zobrazuje pravidlá pre generovanie požiadaviek prijatých v systéme Aport (http://www.aport.ru).

Tabuľka 3.1

Operátori pre formovanie požiadaviek

Operátor Synonymá Komentujte
A A & Dotaz nájde dokumenty obsahujúce obe kľúčové slová. Môže a nemusí byť napísané. Napríklad dotaz: informatika a učebnica je ekvivalentný s učebnicou informatiky
ALEBO ALEBO | Vyhľadáva tie dokumenty, ktoré používajú jedno zo zadaných slov alebo obe slová súčasne
NIE NIE-~ Vyhľadávanie je obmedzené na dokumenty, ktoré neobsahujú slovo uvedené za operátorom
" " " " Dvojité alebo jednoduché úvodzovky vám umožňujú nájsť frázu
dátum = dátum:dátum= Vyhľadávanie je obmedzené na dokumenty, ktoré spadajú do zadaného intervalu dátumov Príklad 1. mena dátum=01/02/2002-01/03/2002. Táto žiadosť vráti dokumenty obsahujúce slovo "mena" s dátumom medzi 1. februárom 2002 a 1. marcom 2002. Príklad 2. dátum=01/03/2002 mena Príklad 3. dátum:<02/03/2002 валюта

Tabuľka 3.2

Zoznam vyhľadávacích serverov a adresárov

Adresa Popis
www.excite.com Vyhľadávač s recenziami uzlov a sprievodcami
www.alta-vista.com Vyhľadávací server, dostupné možnosti rozšíreného vyhľadávania
www.hotbot.com vyhľadávací server
www.poland.net www.israil.net Regionálne vyhľadávacie servery Poľska, Izraela
www.ifoseek.com Vyhľadávací server (jednoduché použitie)
www.ipl.org Internet Publik library, verejná knižnica fungujúca v rámci projektu World Village
www.wisewire.com WiseWire – organizácia vyhľadávania pomocou umelej inteligencie
www.webcrawler.com WebCrawler - vyhľadávací server, jednoduché použitie
www.yahoo.com Webový katalóg a rozhranie pre prístup k fulltextovému vyhľadávaniu na serveri AltaVista
www.aport.ru Aport - ruský vyhľadávací server
www.yandex.ru Yandex - vyhľadávací server v ruskom jazyku
www.rambler.ru Rambler - vyhľadávací server v ruskom jazyku
Internetové zdroje pomoci
www.yellow.com Zlaté stránky internetu
mních. newmail.ru Vyhľadávače rôznych profilov
www.top200.ru 200 najlepších webových stránok
www.allru.net
www.ru Katalóg ruských internetových zdrojov
www.allru.net/z09. htm Vzdelávacie zdroje
www.students.ru Ruský študentský server
www.cdo.ru/index_new. asp Centrum dištančného vzdelávania
www.open. ac. UK Otvorená univerzita UK
www.ntu.edu Americká národná univerzita
www.translate.ru Elektronický textový prekladač
www.pomorsu.ru/guide. library.html Zoznam odkazov na sieťové knižnice
www.elibrary.ru Vedecká elektronická knižnica
www.citforum.ru E-knižnica
www.infamed.com/psy Psychologické testy
www.pokoleniye.ru Webová stránka Federácie internetového vzdelávania
www.metóda. people.ru Vzdelávacie zdroje
www.spb. www.osi.ru/ic/distant Dištančné vzdelávanie na internete
www.examen.ru Skúšky a testy
www.kbsu.ru/~book/ Učebnica informatiky
Mega. km.ru Encyklopédie a slovníky

Vyhľadávanie informácií na internete: úskalia

Problémy, ktoré neležia na povrchu, sa často prejavia až „spätne“, po ukončení určitého štádia prieskumných prác a možno na základe ich výsledkov už aj nejaké rozhodnutie. Čo bráni tomu, aby bola situácia transparentná už od začiatku fungovania toho či onoho informačného systému (IPS)? Odpoveď je celkom jednoduchá: nedostatok komplexných informácií tohto druhu zo strany vývojára. Priamym dôsledkom toho je nespoľahlivosť prijatých údajov a ich nekontrolovaná strata. Je zriedkavé nájsť na webe vyhľadávací nástroj, ktorý nemá niektoré „nedokumentované“ funkcie. Zdá sa, že používateľ nepotrebuje toľko informácií, konkrétne:

ako sa napĺňa databáza IPS a aký je jej objem;

celý rad možností vyhľadávacieho jazyka systému;

hlavné črty prezentácie výsledkov vyhľadávania, predovšetkým algoritmus na zoraďovanie záznamov zo zoznamu odpovedí na vyhľadávací dopyt.

Žiaľ, zdrojom takýchto informácií zvyčajne nie je dokument dostupný z hlavnej stránky vyhľadávacieho servera, ale publikácie jednotlivých autorov roztrúsené po webe, knihy a počítačové časopisy. Dôvody tohto stavu zjavne zahŕňajú nielen nedbalosť vývojára, ale aj faktor nazývaný marketingová politika. Jednoducho povedané, poskytnutie najkompletnejších informácií o sebe vyhľadávaču nemusí mať vždy pozitívny vplyv na jeho hodnotenie. V niektorých prípadoch je však používateľ celkom schopný vziať situáciu pod kontrolu. Funkcie vybranej vyhľadávacej služby je často možné zistiť pomocou testovania. Vytváranie špeciálnych testovacích dotazov, ktoré rýchlo objasnia presne ten aspekt fungovania systému, ktorý je pre aktuálnu úlohu najdôležitejší, sa v mnohých prípadoch ukazuje ako netriviálne. Ako sa vyhnúť niektorým problémom pri práci s IPS, budeme venovať našu diskusiu. Ako príklady ilustrujúce prezentáciu budú uvažované široko známe internetové vyhľadávače.