Információk keresése az interneten

Az internet nagyon gyors ütemben növekszik, ezért keresse meg szükséges információ a weblapok százmilliárdjai és több százmillió fájl között egyre bonyolultabbá válik. Az információkereséshez speciális keresőmotorokat használnak, amelyek folyamatosan frissített információkat tartalmaznak a több száz millió internetes szerveren lévő weboldalak és fájlok elhelyezkedéséről.

A keresőmotorok tematikusan csoportosított információkat tartalmaznak adatbázisokban a világháló információforrásairól. A speciális robotprogramok időről időre „megkerülik” az internetes webszervereket, elolvassák az összes talált dokumentumot, kulcsszavakat emelnek ki bennük, és beírják a dokumentumok internetcímét egy adatbázisba.

A legtöbb keresőmotor lehetővé teszi egy webhely szerzőjének, hogy egy regisztrációs űrlap kitöltésével információkat vigyen be az adatbázisba. A kérdőív kitöltése során az oldal fejlesztője megadja az oldal címét, nevét, Rövid leírás az oldal tartalma, valamint kulcsszavak, amelyek megkönnyítik az oldal megtalálását.

Keresés kulcsszavak alapján. A keresőrendszer adatbázisában a dokumentumok keresése a lekérdezések beírásával történik keresőmező.

A lekérdezésnek tartalmaznia kell egy vagy több kulcsszót, amelyek központi szerepet játszanak ebben a dokumentumban. Például maguknak az internetes keresőmotoroknak a kereséséhez adja meg a kulcsszavakat " orosz rendszer információk keresése az interneten" (6.21. ábra).

A kérés elküldése után némi idővel a keresőmotor visszaadja azon dokumentumok internetes címeinek listáját, amelyekben a megadott kulcsszavakat megtalálta. A dokumentum böngészőben való megtekintéséhez csak aktiválja a rá mutató hivatkozást (6.22. ábra).

Ha a kulcsszavakat rosszul választották meg, akkor a dokumentumcímek listája túl nagy lehet (tíz vagy akár több százezer hivatkozást is tartalmazhat). A lista szűkítése érdekében további kulcsszavakat írhat be a keresőmezőbe, vagy használhatja a keresőmotor katalógusát.

Az egyik legteljesebb és legerősebb kereső a Google (www.google.ru), amelynek adatbázisa 8 milliárd weblapot tárol, és havonta 5 millió új oldalt adnak hozzá a robotprogramok. A Runeten (az internet orosz része) a Yandex (www.yandex.ru) és a Rambler (www.rambler.ru) keresőmotorok kiterjedt, 200 millió dokumentumot tartalmazó adatbázissal rendelkeznek.

Keresés hierarchikus címtárrendszerben. A keresőmotor adatbázisában a webhelyek csoportokba vannak csoportosítva hierarchikus tematikus katalógusok, amelyek a könyvtári tárgykatalógus analógjai.

Legfelső szintű tematikus szekciók, például: Internet, számítógépek, tudomány és oktatás stb., alkönyvtárakat tartalmaznak. Például az internetes címtár tartalmazhat alkönyvtárakat Keresés, levél stb. (6.23. ábra).

Az információk keresése a katalógusban egy adott katalógus kiválasztására korlátozódik, majd a felhasználónak megjelenik a leglátogatottabb és leginformatívabb webhelyek internetcímére mutató hivatkozások listája. Minden hivatkozás általában megjegyzésekkel ellátott, azaz rövid kommentárt tartalmaz a dokumentum tartalmáról.

Az orosz nyelvű internetes források legteljesebb, többszintű hierarchikus tematikus katalógusa elérhető az Aport keresőrendszerében (www.aport.ru). A katalógus részletes összefoglalót tartalmaz a webhelyek tartalmáról és földrajzi elhelyezkedésükről.

Fájlok keresése. A fájlarchívum-szervereken való fájlok kereséséhez speciális keresőmotorok állnak rendelkezésre, beleértve a FileSearch keresőmotort (www.filesearch.ru). Fájl kereséséhez be kell írni a fájl nevét a keresőmezőbe, és a kereső visszaadja azon fájlarchívum szerverek internetes címét, amelyeken a megadott nevű fájl található.

Az internet orosz nyelvű részével kapcsolatos információk keresése a legtöbb keresővel: Google, Rambler, Aport, Japs1ex és a Research fájlkereső rendszerrel a Gogle.ru integrált kereső segítségével végezhető el (6.24. ábra). Ehhez csak írja be a kulcsszavakat a keresősávba, a kapcsolókkal állítsa be a kívánt információ típusát, majd kattintson a Gogle.ru keresőmotor nevével ellátott gombra (6.24. ábra). Ehhez csak írja be a kulcsszavakat a keresősávba, a kapcsolókkal állítsa be a kívánt információ típusát, majd kattintson a keresőmotor nevével ellátott gombra.


Rizs. 6.24. Integrált keresőmotor Gogle.ru

Az interneten való keresés módjai

Az interneten való keresés három módja

Az internet általában, és különösen a világháló hozzáférést biztosít az előfizető számára több ezer szerverhez és több millió weboldalhoz, amelyek elképzelhetetlen mennyiségű információt tárolnak. Hogyan ne vessz el ebben az „információs óceánban”? Ehhez meg kell tanulnia keresni és megtalálni a szükséges információkat az interneten.

Mint már említettük, három fő módja van az információkeresésnek az interneten.

1. Az oldal címének megadása. Ez a legtöbb gyors út keresés, de csak akkor használható, ha a dokumentum pontos címe ismert.

2. Navigáció hiperhivatkozásokon keresztül. Ez a legkevésbé kényelmes módszer, hiszen segítségével olyan dokumentumokat kereshet, amelyek jelentésükben csak közel állnak az aktuális dokumentumhoz. Ha az aktuális dokumentum például a zenének van szentelve, akkor a dokumentumban található hiperhivatkozások használatával nem valószínű, hogy el tud jutni egy sporttal foglalkozó webhelyre.

3. Kapcsolatfelvétel a kereső szerverrel ( keresőmotor) . A keresőszerverek használata a legkényelmesebb módja az információkeresésnek. Jelenleg a következő keresőmotorok népszerűek az internet orosz nyelvű részén:

    Yandex;
    Turista;
    Aport.

Vannak más keresők is. Például, hatékony rendszer keresés a szerveren megvalósítva postai szolgáltatás mail.ru.

Szerverek keresése

A legkönnyebben elérhető és legkényelmesebb módja az információkeresésnek Világháló a keresőmotorok használata. Ebben az esetben az információk kereshetők katalógusokon keresztül, valamint a keresett szöveges dokumentumot jellemző kulcsszavak halmazán keresztül.

Nézzük meg részletesebben a keresőszerverek használatát. Keresési szerver nagyszámú hivatkozást tartalmaz a legtöbbre különféle dokumentumokat, és mindezek a hivatkozások tematikus katalógusokba vannak rendszerezve. Például: sport, mozi, autók, játékok, tudomány stb. Sőt, ezeket a hivatkozásokat a szerver önállóan telepíti, automatikus üzemmód a világhálón megjelenő összes weboldal rendszeres megtekintésével. Ezenkívül a keresőmotorok lehetőséget biztosítanak a felhasználónak arra, hogy kulcsszavak segítségével keressen információkat. A kulcsszavak megadása után a keresőszerver elkezdi megtekinteni a többi webszerveren lévő dokumentumokat, és megjeleníti azokra a dokumentumokra mutató hivatkozásokat, amelyekben a megadott szavak szerepelnek. A keresési eredményeket általában csökkenő sorrendbe rendezik egy speciális dokumentumminősítés szerint, amely megmutatja, hogy egy adott dokumentum mennyire felel meg a keresési feltételeknek, vagy milyen gyakran kérik online.

Keresőmotor lekérdezési nyelve

A kulcsszavak meghatározott szabályok szerint kialakított csoportját - lekérdezési nyelv segítségével - kérésnek nevezzük a keresőkiszolgálóhoz. A különböző keresőszerverek lekérdezési nyelvei nagyon hasonlóak. Erről többet megtudhat a kívánt keresőszerver "Súgó" részében. Nézzük meg a lekérdezések létrehozásának szabályait a Yandex keresőmotor segítségével.

Operátori szintaxis Mit jelent az operátor? Példa kérés
szóköz vagy & Logikai ÉS (egy mondaton belül) fizikoterápia
&& Logikai ÉS (a dokumentumon belül) receptek && (ömlesztett sajt)
| Logikus VAGY fotó | fotózás | pillanatfelvétel | fényképes kép
+ A szó kötelező jelenléte a talált dokumentumban + lenni vagy +nem lenni
() Szavak csoportosítása (technológia | gyártás) (sajt | túró)
~ Bináris operátorÉS NEM (egy mondaton belül) bankok ~ jog
~~
vagy
_
Bináris ÉS NEM operátor (a dokumentumon belül) Párizsi útmutató ~~ (ügynökség | túra)
/(n m) Távolság szavakban (mínusz (-) - hátra, plusz (+) - előre) beszállítók /2 kávézene /(-2 4) oktatás üresedés ~ /+1 tanuló
" " Keressen rá egy kifejezésre "little riding hood" Egyenértékű: piros /+1 lovaglóka
&&/(n m) Távolság mondatokban (mínusz (-) - hátra, plusz (+) - előre) bank && /1 adók

Megszerezni legjobb pontszámok keresés, emlékeznie kell néhányra egyszerű szabályok:

    1. Ne keressen információt egyetlen kulcsszó használatával.

    2. Jobb, ha nem nagybetűvel írjuk be a kulcsszavakat, mert ez oda vezethet, hogy a kisbetűvel írt szavak nem találhatók meg.

    3. Ha a keresés eredményeként nem kap eredményt, ellenőrizze, hogy vannak-e olyanok kulcsszavakat x helyesírási hiba.

A modern keresőmotorok lehetőséget biztosítanak szemantikai elemző csatlakoztatására egy generált lekérdezéshez. Segítségével beírhat egy szót, és kiválaszthat olyan dokumentumokat, amelyekben ennek a szónak a származékai találhatók különféle esetekben, igeidőkben stb.

Ellenőrző kérdések

1. Hogyan történik a dokumentumok keresése kulcsszavak használatával? Címtárrendszerben?

Feladatok az önálló teljesítéshez

6.8 Gyakorlati feladat. Hasonlítsa össze a dokumentumok keresési eredményeit kulcsszó szerint különböző keresőmotorok segítségével (használja a Gogle integrált keresőt).

6.9 Gyakorlati feladat. Keresse meg a WinAmp médialejátszó fájlt a fájlarchívum-kiszolgálókon.

Azt mondják, hogy az interneten minden megtalálható. Valójában ez nem így van. Az internetes közzétételhez szükséges anyagokat valódi emberek készítik, ezért ott csak azt találhatja meg, amit szükségesnek tartott közzétenni. A folyót azonban patakok táplálják, és kreativitásuknak köszönhetően mára mintegy kétmilliárd weblap alakult ki az interneten. Ennek eredményeként az interneten elérhető források katalogizálása komoly kihívássá vált. Annak ellenére, hogy szervezetek ezrei dolgoznak a problémán, a probléma nemcsak hogy nem közeledik a megoldáshoz, hanem egyre akutabbá válik. A katalogizált erőforrások százalékos aránya folyamatosan csökken. BAN BEN utóbbi évek ez az ősz katasztrofális volt. Így ha 1999-ben a katalogizált források aránya megközelítette a 40%-ot, akkor mindössze egy év alatt 25%-ra csökkent.

A következtetés egyszerű: a webtér gyorsabban megtelik, mint ahogy rendszeresítik.

Sajnos nincs okunk azt hinni, hogy a közeljövőben bármi is jó irányba változna. Ebből kifolyólag az interneten történő információkeresés tekinthető az egyik legnehezebb feladatnak.

Az Önt érdeklő információk kereséséhez a böngészőjét annak a weboldalnak a címére kell irányítania, amelyen az található. Ez a leggyorsabb és legmegbízhatóbb keresési típus. Mert gyors hozzáférés Az erőforrás eléréséhez egyszerűen indítsa el a böngészőt, és írja be az oldal címét a címsorba.

A weboldalak címeit speciális kézikönyvekben, nyomtatott kiadványokban adják meg, és hallják a népszerű rádióállomásokon és a tévéképernyőkön.

Ha nem ismeri a címet, többféleképpen találhat információt az interneten: kereső motorok, amelyek információkat tartalmaznak az internetes forrásokról.

Minden keresőmotor egy nagy adatbázis azokhoz a weboldalakhoz kapcsolódó kulcsszavakból, amelyeken megtalálták. Az Önt érdeklő információkkal rendelkező szervercím kereséséhez be kell írnia egy kulcsszót, több szót vagy kifejezést a keresőmezőbe. Így kérést küld a keresőnek. A keresési eredmények azon weblapcímek listájaként jelennek meg, ahol ezeket a szavakat találták.

A keresőmotorok általában három részből állnak: robot, index és lekérdezés feldolgozó program.

A robot (Spider, Robot vagy Bot) olyan program, amely felkeresi a weboldalakat és elolvassa (részben vagy egészben) azok tartalmát.

A keresőrobotok a weboldal tartalmának elemzésére szolgáló egyéni sémájukban különböznek.

Az index olyan adattár, amely a robotok által meglátogatott összes oldal másolatát tartalmazza.

Az egyes keresőmotorokban található indexek a tárolt információk mennyiségében és rendszerezési módjában különböznek. A vezető keresők adatbázisai több tízmillió dokumentumról tárolnak információkat, indexük pedig több száz gigabájtot tesz ki. Az indexek rendszeres időközönként frissítésre és kiegészítésre kerülnek, így az azonos lekérdezéssel rendelkező keresőmotorok eredményei eltérhetnek, ha a keresés különböző időpontokban történt.

A lekérdezésfeldolgozó program olyan program, amely a felhasználó kérésének megfelelően az indexen keresztül „keresi” a szükséges információk meglétét, és visszaküldi a talált dokumentumokra mutató hivatkozásokat.

A rendszer kimenetén lévő hivatkozások halmazát a program csökkenő sorrendben osztja fel, a hivatkozás legnagyobb megfelelési fokától a legkevesebbig.

Oroszországban a leggyakoribb keresőmotorok:

  • Rambler (www.rambler.ru);
  • Yandex (www.yandex.ru);
  • Mail (www.mail.ru).

Sokkal több kereső van külföldön. A legnépszerűbbek a következők:

  • Alta Vista (www.altavista.com);
  • Gyorskeresés (www.alltheweb.com);
  • Northern Light (www.northernlight.com).

A Yandex talán a legjobb keresőmotor az orosz interneten. Ez az adatbázis megközelítőleg 200 000 szervert és akár 30 millió dokumentumot tartalmaz, amelyeket a rendszer másodperceken belül átvizsgál. Ezt a rendszert példaként használva bemutatjuk, hogyan történik az információkeresés.

Az információkeresést úgy határozhatja meg, hogy beír egy kulcsszót egy speciális keretbe, és kattintson a keret jobb oldalán található „Keresés” gombra.

A keresési eredmények másodperceken belül megjelennek, fontosság szerint rangsorolva – a legfontosabb dokumentumok a lista elejére kerülnek. Ebben az esetben a talált dokumentum rangját az határozza meg, hogy a dokumentumban hol található a kulcsszó (a dokumentum címében fontosabb, mint bármely más helyen), valamint a kulcsszó említésének száma (minél több említés , minél magasabb a rang).

A lista elején található oldalak tehát nem tartalmilag, hanem gyakorlatilag a kulcsszó említési gyakorisága tekintetében vezetnek. Ebben a tekintetben nem szabad a keresőmotor által javasolt első tíz webhely megtekintésére korlátozódnia.

Az oldal tartalma közvetetten a Keresőrendszer által a Webhely címe alatt elhelyezett rövid leírása alapján értékelhető. Egyes gátlástalan weboldal-készítők annak érdekében, hogy növeljék annak valószínűségét, hogy weboldalaik a Keresőmotor első helyein jelenjenek meg, szándékosan egy kulcsszó értelmetlen ismétlését helyezik el a dokumentumban. Ám amint a kereső egy ilyen „szemetes” dokumentumot észlel, automatikusan kizárja azt az adatbázisából.

Még a keresőmotor által válaszul kínált dokumentumok rangsorolt ​​listája is kulcsmondat vagy egy szó gyakorlatilag határtalannak bizonyulhat. Ebben a tekintetben a Yandex (valamint más nagy teljesítményű keresőmotorok) lehetőséget ad arra, hogy az első listán belül olyan dokumentumokat válasszon ki, amelyek pontosabban tükrözik a keresés célját, vagyis a keresési eredmények pontosítását vagy javítását. Például egy kulcsszóhoz van egy 34 899 weboldalt tartalmazó lista. Miután beírt egy minősítő kulcsszót a „Keresés megtalálva” parancsba, a lista 750 oldalra csökken, és egy újabb minősítő szó ebbe a parancsba történő beírása után ez a lista 130 weboldalra csökken.

A keresési könyvtárak más internetes forrásokra mutató hivatkozások szisztematikus gyűjteménye (kijelölése). A linkek a következőképpen vannak rendezve tematikus rubrikátor, amely egy hierarchikus struktúrát képvisel, amelyen keresztül haladva megtalálhatja a szükséges információkat.

Példaként hozzuk fel a Yandex internetes keresési katalógusának szerkezetét.

Ez egy általános célú könyvtár, mivel szinte minden lehetséges területen tartalmaz hivatkozásokat az internetes forrásokhoz. Ez a katalógus a következőket emeli ki Témák:

  • Üzleti és Gazdasági;
  • Társadalom és politika;
  • Tudomány és oktatás;
  • Számítógépek és kommunikáció;
  • Könyvtárak és hivatkozások;
  • Otthon és család;
  • Szórakozás és pihenés;
  • Kultúra és művészet.

Minden egyes tantárgy sokakat tartalmaz alszakaszok , és ezek viszont tartalmazzák címsorok stb.

Tegyük fel, hogy a Győzelem Napjára készül egy eseményre, és meg akarja találni az interneten Bulat Okudzhava híres katonadalának „Hallod a csizmák csörgését” szavait. A keresés a következőképpen szervezhető:

Yandex > Katalógus > Kultúra és művészet > Zene > Szerző dala

Ez a keresési módszer meglehetősen gyors és hatékony. A végén csak néhány hivatkozást kínálunk, amelyek között vannak linkek híres bárdok dalait tartalmazó oldalakra. Nincs más hátra, mint megkeresni a honlapon az archívumot B. Okudzhava dalainak szövegeivel, és kiválasztani belőle a kívánt szöveget.

Egy másik példa. Tegyük fel, hogy mobiltelefont fog vásárolni, és szeretné összehasonlítani a különböző cégek eszközeinek jellemzőit. A keresés a következő katalóguscímek szerint végezhető el:.

Yandex > Katalógus > Számítógépek és kommunikáció > mobil kapcsolat> Mobiltelefonok

Miután megkapta korlátozott mennyiség hivatkozásokat, a cégek jellemzőit és a készülékek módosításait megvizsgálva gyorsan megtekintheti és kiválaszthatja a telefont.

A legtöbb keresőmotor képes kulcsszó alapján keresni. Ez az egyik leggyakoribb keresési típus.

A kulcsszavak szerinti kereséshez be kell írnia a keresett szót vagy több szót egy speciális ablakban, majd kattintson a Keresés gombra.

A keresőmotor megtalálja és megjeleníti ezeket a szavakat tartalmazó dokumentumokat az adatbázisában. Lehet, hogy sok ilyen dokumentum van, de a sok ebben az esetben nem feltétlenül jelent jót.

Végezzünk el néhány kísérletet bármelyik keresőmotorral. Tételezzük fel, hogy úgy döntünk, hogy akváriumot indítunk, és minden információ érdekel minket ebben a témában. Első pillantásra a legegyszerűbb az „akvárium” szóra keresni. Ellenőrizzük ezt például a Yandex keresőjében. A keresés eredménye az lesz nagy mennyiség oldalak - hatalmas számú link. Sőt, ha jobban megnézzük, közöttük lesznek olyan oldalak, amelyek megemlítik B. Grebenscsikov „Akvárium” csoportját, bevásárlóközpontokat és azonos nevű informális egyesületeket, és még sok mást, aminek semmi köze az akváriumi halakhoz.

Nem nehéz kitalálni, hogy egy ilyen keresés még a legigénytelenebb felhasználót sem tudja kielégíteni. Túl sok időt kell majd fordítani arra, hogy a javasolt dokumentumok közül kiválasztjuk azokat, amelyek a számunkra szükséges témához kapcsolódnak, és még inkább a tartalmuk megismerésére.

Rögtön megállapíthatjuk, hogy az egy szóval való keresés általában nem praktikus, mert egy szó használatával nagyon nehéz meghatározni, hogy egy dokumentum, weboldal vagy webhely melyik témának szól. Kivételt képeznek a ritka szavak és kifejezések, amelyeket szinte soha nem használnak a tematikus területükön kívül.

Ha a kívánt területen a leggyakoribb kifejezések egy bizonyos halmaza van, használhatja a speciális keresést. ábrán. a speciális keresés ablakát mutatja a Yandex keresőben. Ebben a módban a lekérdezési nyelv képességei űrlap formájában valósulnak meg. Hasonló szolgáltatást, beleértve a szótárszűrőket is, szinte minden keresőmotor kínálja.

Próbáljuk meg tisztázni a keresési feltételeket, és írjuk be az „akváriumi halak” kifejezést. A linkek száma több mint 20-szorosára csökken. Ez az eredmény jobban megfelel nekünk, de a javasolt linkek között továbbra is lehetnek például halak képével ellátott gyufacímkék orosz szuvenír készletei, képernyővédők gyűjteményei a számítógép asztalára, valamint akváriumi halak katalógusai fényképekkel és akváriumi kiegészítők üzletek. Nyilvánvaló, hogy tovább kell haladnunk a keresési feltételek tisztázása felé.

Annak érdekében, hogy a keresés hatékonyabb legyen, minden keresőmotor rendelkezik egy speciális lekérdezési nyelv saját szintaxisával. Ezek a nyelvek sok tekintetben hasonlóak. Elég nehéz mindegyiket tanulmányozni, de minden keresőmotor rendelkezik egy súgórendszerrel, amely lehetővé teszi a kívánt nyelv elsajátítását.

Íme néhány egyszerű szabály a lekérdezés létrehozásához a Yandex keresőmotorban.

A lekérdezésben szereplő kulcsszavakat kisbetűvel (kis) kell írni.

Ez biztosítja, hogy minden kulcsszóra keressen, ne csak a nagybetűvel kezdődőkre.

A keresés során a szó minden formáját figyelembe veszik az orosz nyelv szabályai szerint, függetlenül a lekérdezésben szereplő szó formájától.

Például, ha a „tudom” szó szerepel a lekérdezésben, akkor a „tudjuk”, „tudod” stb. szavak is kielégítik a keresési feltételt.

Ha stabil kifejezést szeretne találni, tegye idézőjelbe a szavakat.

Például „porcelán edények”.

A pontos szóforma szerinti kereséshez felkiáltójelet kell tenni a szó elé.

Például, ha a „szeptember” szóra keresi a származási kisbetűt, a „!Szeptember” kifejezést kell írnia.

Ha ugyanazon a mondaton belül szeretne keresni, a lekérdezésben szereplő szavak szóközzel vagy & jellel vannak elválasztva.

Például „kalandregény” vagy „kaland és romantika”. A lekérdezésben több szóközzel elválasztott szó azt jelenti, hogy mindegyiknek szerepelnie kell a keresett dokumentum egy mondatában.

Ha csak azokat a dokumentumokat szeretné kijelölni, amelyek a lekérdezésben megadott szavakat tartalmazzák, tegyen mindegyik elé egy plusz jelet. Ha éppen ellenkezőleg, bármilyen szót ki szeretne zárni a keresési eredményből, tegyen mínusz „-” jelet a szó elé. A „+” és „-” jeleket az előzőtől szóközzel elválasztva és a következő szóval együtt kell írni.

Például a „Volga-car” lekérdezés olyan dokumentumokat talál, amelyek a „Volga” szót tartalmazzák, és nem az „autó”.

Ha szinonimákat vagy hasonló jelentésű szavakat keres, függőleges sávot helyezhet el a szavak közé.

Például a „gyermek | baba | baba" dokumentumokat, amelyek ezen szavak bármelyikét tartalmazzák.

Egy lekérdezésben egy szó helyett egy teljes kifejezést is helyettesíthet. Ehhez zárójelbe kell tenni

Például: "(gyermek | kisgyermek | gyerekek | csecsemő) + (gondozás | szülői nevelés)."

A "~" (tilde) jel lehetővé teszi, hogy olyan dokumentumokat keressen, amelyekben az első szót tartalmazza, de a másodikat nem.

Például a „books ~ store” lekérdezés minden olyan dokumentumot megtalál, amely a „books” szót tartalmazza, amely mellett (a mondaton belül) nincs „áruház” szó.

Ha az operátor egyszer megismétlődik (például & vagy ~), a keresés a mondaton belül történik. A kettős operátor (&&,~~) a dokumentumon belüli keresést határozza meg.

Például a „cancer ~~ astrology” lekérdezés olyan „rák” szót tartalmazó dokumentumokat talál, amelyek nem kapcsolódnak az asztrológiához.

Térjünk vissza az akváriumi halakkal kapcsolatos példához. A keresőmotor által kínált számos dokumentum elolvasása után világossá válik, hogy az internetes információkeresést nem szabad az akváriumi halak kiválasztásával kezdeni. Az akvárium egy összetett biológiai rendszer, melynek létrehozása és karbantartása speciális tudást, időt és komoly befektetést igényel.

A kapott információk alapján az interneten kereső személy gyökeresen megváltoztathatja a további keresés stratégiáját, ha úgy dönt, hogy tanulmányozza a vizsgált témához kapcsolódó szakirodalmat.

Irodalom vagy teljes szövegű dokumentumok kereséséhez a következő lekérdezés lehetséges:

"+(akvárium | akvarista | akváriumi hobbi) + kezdőknek + (tanácsok | irodalom) + (cikk | szakdolgozat | teljes szöveg) - (ár | bolt | szállítás | katalógus)."

A kérés keresőmotor általi feldolgozását követően az eredmény nagyon sikeres volt. Már az első linkek a szükséges dokumentumokhoz vezetnek.

Most összefoglalhatja a keresési eredményeket, levonhat bizonyos következtetéseket, és dönthet a lehetséges intézkedésekről:

  • Hagyja abba a további keresést, mert különböző okok miatt nem tudja fenntartani az akváriumot.
  • Olvassa el a javasolt cikkeket, és kezdje el az akvárium felállítását.
  • Keressen anyagokat hörcsögökről vagy törpepapagájokról.
  1. Milyen típusú keresés a leggyorsabb és legmegbízhatóbb?
  2. Hol találhatja meg a felhasználó a weboldal címét?
  3. Mi a keresőmotor fő célja?
  4. Milyen részekből áll a kereső?
  5. Milyen keresőket ismer?
  6. Mi a technológia a keresőmotor rubrikátorával történő kereséshez?
  7. Mi a kulcsszavas keresés technológiája?
  8. Mikor kell megadni a + vagy a - keresési feltételeket?
  9. Milyen keresési feltételeket határoz meg a Yandexben a következő kifejezés:

    (dada|nevelő|kormányzat)++(gondozás|nevelés|felügyelet) ?

  10. Mit jelent az előjel megduplázása (~~ vagy ++) összetett lekérdezés létrehozásakor?

Gyakorlat.

Feladat 1. Keresés a katalógusokban.

A keresőmotor katalógusában keresse meg a következő információkat (tanára utasítása szerint):

  1. Egy népszerű zenei együttes dalának szövege
  2. A Mariinsky Színház repertoárja az aktuális hétre
  3. Jellemzők a legújabb modell mobiltelefon jól ismert cég (az Ön által választott)
  4. Ukrán borscs galuskával receptje
  5. Hosszú távú időjárás előrejelzés az Ön régiójában (legalább 10 nap)
  6. Fénykép kedvenc kortárs énekesedről
  7. hozzávetőleges költség multimédiás számítógép(ár)
  8. Információ az Ön régiójában vagy városában megüresedett titkári állásokról
  9. Horoszkóp a horoszkóp az aktuális napra

A keresési eredmények alapján készítsen írásos jelentést Wordben: mutassa be a talált, másolt és formázott anyagot a dokumentumban. Nyújtsa be jelentését tanárának.

Feladat 2. Kérelem megformálása a pontos cím vagy idézet felhasználásával.

Ismeri a dokumentum pontos címét, például: „A személyi elektronikus számítógépekre és a munkaszervezésre vonatkozó higiéniai követelmények”. Fogalmazzon meg egy lekérdezést egy dokumentum teljes szövegének megkereséséhez az interneten.

Mentse el a keresési eredményt a mappájába. Mutasd meg a tanárodnak.

3. feladat Összetett lekérdezések kialakítása.

  • Bármely keresőben hozzon létre egy lekérdezést az orosz fürdővel kapcsolatos információk kereséséhez. Távolítsa el a szolgáltatásajánlatokat, a fürdőszobai kiegészítők reklámozását és az egyéb reklámokat. Fókuszálja a keresést az orosz fürdő testre gyakorolt ​​hatására.
  • Hozzon létre egy összetett lekérdezést, hogy információkat találjon a benti macskák gondozásáról. Zárja ki a keresésből a nagy macskákat (például az oroszlánokat), valamint a vételi, eladási ajánlatokat, a háttérképnek szánt fényképeket stb.
  • Fogalmazza meg Wordben a kérés szövegét és a keresési eredményt, és mutassa be a tanárnak.
4. feladat Tematikus keresés.

Minden Ön által ismert módon keressen információkat az interneten a számítástechnika fejlődésének történetéről. Végezze el a keresést különböző területeken: történelmi helyzet, technológia, személyiségek. Mutassa be a keresési eredményeket prezentáció formájában. Prezentációjában használjon többlépcsős tartalomjegyzéket hiperhivatkozások formájában.

A keresés problémája és szervezésének eszközei

Hatalmas és folyamatosan növekvő mennyiségű információ érhető el az interneten, pl. működőképes, nagyon relevánssá és összetetté teszi a szükséges információk megtalálásának problémáját. A szükséges információk keresésének sebessége nagymértékben meghatározza az internethasználó professzionalizmusát. Érdemes elmondani, hogy ennek a feladatnak az automatizálásához különféle, mind a külföldi, mind a hazai rendszerek keresés, amelyek a weboldalak speciális típusai. Ugyanakkor a számos keresés-automatizálási eszköz elérhetősége ellenére ez a feladat továbbra is meglehetősen munkaigényes, ami megköveteli a felhasználótól, hogy rendelkezzen bizonyos tapasztalattal, intuícióval és ismerje a tárgykörében használt terminológiát.

A Nature-ben 1999. július 8-án közzétett becslés 800 millióra tette a nyilvánosan indexelt weboldalak számát. Egy évvel később a tanulmány szerzője (Steve Lawrence, a NEC Research Institute munkatársa) úgy vélte, hogy ez a szám csaknem megduplázódott, 1,5 milliárdra. a legjobb keresőmotorok hatból legfeljebb egy oldalt indexelnek. Érdemes elmondani, hogy kivonjuk hasznos információ az internetről, tudnia kell, hol és hogyan kereshet.

Az Internet Explorer keresőeszköze megkönnyíti a keresőeszközök elérését anélkül, hogy ismernie kellene a keresőmotorok címét. Ebben az esetben jobb, ha közvetlenül kapcsolatba lép a keresőmotorokkal a megfelelő oldal betöltésével.

A keresés szervezési módja és a biztosított lehetőségek alapján minden keresőeszköz a következő csoportokba sorolható:

katalógusok és speciális adatbázisok;

kereső motorok;

metakereső motorok.

Katalógusok és adatbázisok

A WWW-en található katalógusok hasonlóak a rendszeres könyvtári katalógusokhoz. A címtárkeresés a hivatkozások hierarchikus listáján, címsoroknak vagy kategóriáknak nevezett szekvenciális mozgásból áll. A katalógus első oldala linkeket tartalmaz a főbb témákhoz, mint például a kultúra és a művészet; Orvostudomány és egészségügy; Társadalom és politika; Üzleti és Gazdasági; Szórakozás, stb. Egy adott hivatkozásra (kategória) rákattintva az egérrel megnyílik a kiválasztott témát (kategóriát) részletező linkeket tartalmazó oldal, a részletező kategóriák között lefelé haladva megtalálhatja a szükséges információkat tartalmazó oldalt. A katalógusban ilyen vagy olyan módon történő mozgáskor megnyíló minden oldalon megjelenik a megtekintett alkategóriák sorrendje, például Business World: Pénzügy: Analytics stb.

Minden katalógust manuálisan készítenek és tartanak naprakészen a szakemberek, hasonlóan ahhoz, ahogyan a bibliográfusok összeállítják és karbantartják a könyvtári katalógusokat. Érdemes megjegyezni, hogy a dokumentum leírását vagy a katalógus összeállítói vagy a szerző végzi. Ennek köszönhetően a katalógusban szereplő oldalak tartalma a legmegfelelőbb annak a kategóriának, amelybe besorolják. De tekintettel az információk feltöltésének és változásának sebességére az interneten, a katalógusok karbantartásának „kézi” módszere nem teszi lehetővé, hogy megfelelően tükrözzük az internetes erőforrások valós állapotát ebben a témában.

Kereső motorok

(kereső motorok, keresőszerverek, keresőrobotok)

Több tucat nagy és több ezer kicsi és speciális webhely létezik az internetes keresésekhez. A ϶ᴛᴏ-edik csoport keresőeszközei lehetővé teszik a felhasználó számára, hogy bizonyos szabályok szerint megfogalmazza a szükséges információkra vonatkozó követelményeket (lekérdezési nyelv segítségével a lekérdezés létrehozásához), majd a kereső automatikusan átnézi az oldalakon található dokumentumokat. vezérli (indexeli) és kiválasztja közülük azokat, amelyek „vélemény szerint » keresőszerver, ϲᴏᴏᴛʙᴇᴛϲᴛʙfelhasználó által megfogalmazott követelmények (a kéréshez kapcsolódóan) A keresési csomópontok saját internetes indexeiket használhatják, amelyeket a spider nevű speciális programok folyamatosan frissítenek. A pókprogram megvizsgálja a webet, ellenőrizve minden hivatkozást egy adott oldalon, majd az oldalakon a címzett hivatkozásokat stb., és tájékoztatja tulajdonosát az összes oldalról a későbbi indexelés érdekében.

A keresés eredményeként egy vagy több olyan oldal jön létre, amelyek a kérés szempontjából releváns dokumentumokra (Web oldalak) mutató hivatkozásokat tartalmaznak. a kérésre, és általában feltüntetik a dokumentum tartalmát jellemző szövegtöredékeket is. Egy ilyen hivatkozásra kattintva betöltheti az Önt érdeklő oldalt. Nagyon sok talált dokumentum esetén pontosíthatja a kérést és megismételheti vele a keresést, de csak a kiválasztott oldalak között (egy ilyen keresést a különböző gépekben másképp hívják, de általában ϶ᴛᴏ - keresés a találtban) Számos keresőmotorban egy bizonyos módszerrel módosíthatja a hivatkozást arra az oldalra, amelynek tartalma leginkább megfelel az Ön igényeinek, és megismételheti a keresést, kérve, hogy keressenek hasonlókat.

Az automatizált keresés előnye alapvetően az, hogy nagyon nagy mennyiségű, az interneten elérhető információ megtekintését teszi lehetővé. Ebben a pillanatban. Ugyanakkor a kérés pontos leírásának összetettsége, amely megfelelően tükrözi az Ön információs igényeit, valamint a kérés alapján megtekintett oldalak automatikus meghatározásának feladatának még nagyobb bonyolultsága ahhoz vezet, hogy a szám az „első látogatáskor” kiválasztott oldalak közül hagyományosan nagyon kicsi vagy túl nagy . Általánosságban elmondható, hogy a keresőmotor segítségével végzett keresés egy iteratív (többmenetes) folyamat, melynek eredményeként a kérés formája fokozatosan finomodik.

Metakereső motorok

Mint fentebb említettük, bármely keresőmotor átvizsgál egy bizonyos szervercsoportot, és saját kritériumai szerint választja ki a dokumentumokat. Ennek eredményeként a különböző rendszerekkel, ugyanazokkal a kulcsszavakkal végzett keresés eltérő eredményeket ad. Ebből született meg az úgynevezett metakereső (vagy multisearch) rendszerek létrehozásának gondolata, amelyek maguk nem keresnek semmit, hanem egyszerre több keresőmotorhoz fordulnak segítségért. Vegye figyelembe, hogy mindegyik metakeresőnek saját lekérdezési nyelve van. A rendszer a saját nyelvén megfogalmazott lekérdezést lefordítja az egyes keresőmotorok által használt lekérdezési nyelvekre. Ezután az összes rendszer keresési eredményeit egyesítik és áttekinthető formában jelenítik meg. Természetesen a metakereső motorokkal történő keresés hosszabb időt vesz igénybe a hagyományos keresőmotorokhoz képest.

A legnépszerűbb keresőmotorok áttekintése

Az interneten nagyon sok kereső található, és minden felhasználó arra összpontosít, amelyikhez szokott, vagy amelyet kollégái tanácsoltak neki. Használjuk a legnépszerűbb keresők rövid leírását, amely az egyik oldalon található.

1. Google (www.google.com) A leggyorsabb és legnagyobb kereső. Több mint 1,3 milliárd oldalt indexeltek (ebből valamivel több mint 700 millió teljesen indexelt, a többiről csak a cím és a linkszöveg ismert) Orosz nyelvű forrásokat használva normálisan keres (természetesen szóalakok nélkül) , lehetőség van a felület nyelvének kiválasztására. Adott webhelyekről és/vagy domainekről származó eredményeket is felvehet/kizárhat. A legtöbb keresőmotortól eltérően a Google egy erőforrás népszerűségét a más oldalakról hozzá vezető linkek száma alapján értékeli. Létezik témaorientált keresés – Apple Macintosh, BSD UNIX, Linux, amerikai kormányzat és egyetemi keresés – vezető tudományos és oktatási intézmények forrásaiban.

2. Yandex (www.yandex.ru) A legjobb hazai keresők. Főleg az orosz nyelvű forrásokat indexeli, miközben képességei nem alacsonyabbak a külföldi rendszereknél. A keresés történhet pontosan vagy bármilyen szóalakban, dátumkorlátozással, az oldal vagy annak alkönyvtárának megjelölésével. Kereshet az úgynevezett idézési index alapján, kereshet képeket, szkripteket, kisalkalmazásokat; állítsa be a dokumentum nyelvét. A szükséges hivatkozások hagyományosan az első tíz találatban találhatók. Van egy „könnyű” verziója (minimális dizájnelemekkel) a http://www.ya.ru oldalon.

3. AltaVista (www.altavista.com) A keresési feltételek nagymértékben kibővítését biztosítja: a Speciális keresésben választható az időszak, amely magában foglalja az erőforrás létrehozásának vagy módosításának dátumát, 25 nyelv támogatását; lehetőség van webhelyenként egy találat visszaadására (szűkíti a keresést a minőség feláldozása nélkül) A Power Search szabványos funkciókkal rendelkezik. Az AV egészen a közelmúltig nagy portál volt, de anyagi (és egyéb) okokból jelentősen csökkentette a szolgáltatások számát.

4. Yahoo! (www.yahoo.com) Fontos megjegyezni, hogy az egyik első keresőmotor az interneten. kívül standard készlet függvények, lehetővé teszi az erőforrások dátum szerinti kiválasztását (4 év, 1, 3, 6 hónap, hét, 1, 3 nap) Támogatja a „*” jel megadását a kulcsszavak karaktersorozata helyett. A Yahoo! kategóriákból egy nagy strukturált katalógus készült, először ezekben, majd saját archívumában történik a keresés, majd a Google rendszerek. A kategóriák szerinti keresés jó eredményeket ad – kevés van belőlük, és nagyon jók.

5. Lycos (www.lycos.com) Mostanában - az egyik legnépszerűbb rendszer. Ugyanakkor nem biztosít különleges képességeket - „ÉS” „VAGY”, kifejezések keresése, egy szó kötelező jelenléte/hiánya; speciális funkciókban - keresés címben, URL-ben, gazdagépnévben és/vagy domain névben; 25 nyelv, köztük orosz - egyszóval a teljes „általánosan elfogadott” készlet. Megadhatja az erőforrás-tartalom típusát - auto, könyvek, ftp, letöltés, hírek stb. Nyilvánvaló, hogy a Lycos népszerűsége ennek a nagy projektnek a léptékének a következménye.

6. Rambler (www.rambler.ru) Egészen a közelmúltig a leghíresebb orosz kereső. Az összetett keresés nem teszi lehetővé a kifejezések keresését, és a 2010 februárjáig tartó szokásos keresés ritkán hozott elfogadható eredményeket. Február óta a rendszer továbbfejlesztett keresőmechanizmust használ, a dizájn változott, de minőségi szempontból a Rambler továbbra sem egyenlő a Yandex-szel és az Aporttal (a keresőmotorokat elemző szerző szerint). források Rambler Top 100, az egyik elismert statisztikai információforrás az internetes projektekről.

7. Aport (www.aport.ru) Egy másik jó orosz keresőszerver. A keresés szöveg (csak minden szóalakban) és URL alapján történik, a használatával logikai operátorokés a „…” operátor (a kifejezésben azonban a stop szavakat továbbra is figyelmen kívül hagyjuk), dátum szerint és az egyes mezőkben (cím, leírás stb.), metakarakterek * és! A keresési eredmények megjelenítése a legjobban megtervezett a többi orosz keresőmotorhoz képest. A főoldal egyértelműen információval túlterhelt kialakítása kétségeket vet fel. Van egy kicsit „egyszerűbb” verzió a http://aport.ru oldalon.

Hogyan válasszunk keresőt

Az interneten való keresés során két összetevő fontos - a teljesség (semmi nem veszett el) és a pontosság (semmi feleslegeset nem találtak). Általában mindent egy szóval neveznek - relevancia, vagyis a kérdésre adott válasz.

1. Fedettség és mélység

A lefedettség alatt a keresőmotor adatbázisának mennyiségét értjük, amelyet három mutatóval mérnek - az indexelt információk teljes mennyiségével, az egyedi szerverek számával és az egyedi dokumentumok számával. Mélység alatt azt értjük, hogy van-e korlátozás az oldalak számára vagy a könyvtárak egymásba ágyazásának mélységére egy szerveren.

Az ellenőrzés módja: Egyes gépek robotstatisztikát írnak egy webhelyre. De ezt magad is ellenőrizheted – meg kell kérdezned néhányat keresési lekérdezések, amely egy szóból áll (hogy kizárjuk a lekérdező nyelv befolyását, beleértve a tér különböző értelmezéseit is), és ha megnézzük a gép által előállított eredmények statisztikáit - általában a lista elején szerepel, hogy hány dokumentumokat találtak. Amellett, hogy a szavaknak különböző területekről kell származniuk, érdemes figyelembe venni a különböző súlyú szavakat - ritka, „közepes” és „nehéz” (gyakoriság), és összehasonlítani a talált mennyiséget. A nehéz szavak különösen a keresőmotor teljes szövegét (a dokumentumban szereplő összes szó indexelését) tesztelik.

Nehezebb ellenőrizni a robot bejárásának mélységét - ehhez el kell venni néhány webhelyet, például elágazó archív szerkezettel, és ellenőrizni kell, hogy a dokumentumok indexelve vannak-e, amelyek például csak 6 kattintással érhetők el. a linkeken.

2. A linkek feltérképezési sebessége és relevanciája

A web feltérképezésének sebessége megmutatja, hogy az újonnan hozzáadott erőforrás milyen gyorsan indexelődik, és milyen gyorsan frissülnek az adatbázisban lévő információk. Ne felejtsük el, hogy a keresőmotor (robotja) minőségének fontos mutatója nemcsak az új területek elfoglalása, hanem a már lefedett területek állapotának figyelemmel kísérése is. A szerverek eltűnnek és maradnak, a rajtuk lévő oldalak frissülnek. A keresőmotor által a találtak listájában előállított linkeknek egyrészt létezniük kell, másrészt tartalmuknak meg kell felelniük a kérésnek.

Az ellenőrzés módja: Objektív információhoz juthatunk a szervernaplók elemzésével – a keresőrobotot általában a gépe neve (vagy valami hasonló) jelöli, így láthatja, hogy milyen gyakran látogatja a szervert, hány oldalt néz meg. stb. Sajnos általában csak a lelőhelyének naplója érhető el tanulmányozásra, így marad a kísérleti módszer.

A feltérképezési sebesség meghatározásához valahol létre kell hoznia egy szöveges oldalt, hozzá kell adnia a keresőmotorokhoz, és meg kell néznie, milyen gyorsan kezd el megjelenni. Vagy módosítson egy meglévő oldalt. Érdemes elmondani, hogy a hivatkozások relevanciájának megállapításához ellenőrizze a dokumentumokat legalább a lista első oldalán, több lekérdezés esetén. Üzenet Nem található azt jelzi, hogy a dokumentum már nem létezik.

3. Keresés minősége (szubjektív mutató)

Érdemes elmondani, hogy minden keresőmotor rendelkezik egy algoritmussal a keresési eredmények rendezésére. Minél közelebb van a lista tetejéhez a szükséges dokumentum, annál jobban működik a relevancia.

Hogyan ellenőrizhető: Csak kísérlettel. Összehasonlítás céljából ajánlatos különböző hosszúságú lekérdezéseket készíteni. Használhatja a lekérdező nyelvet is, míg aki nem szívesen olvassa el a leírást, az használhatja a kibővített lekérdező oldalt ("speciális keresés" az Aportban és a Yandexben, "részletes lekérdezés" a Ramblerben - fordítási lehetőségek oroszra "bővített keresés").

A relevancia mellett fontos felhasználói jellemzők is vannak.

4. Keresési sebesség

Ha egy keresőmotor lassan reagál, akkor a vele való munka nem hatékony. Érdemes hozzátenni, hogy a felhasználó számára látható sebesség nemcsak magától a keresőtől, hanem az internetes csatornáktól is függ.

Hogyan ellenőrizhető: Kísérlet útján - különböző hosszúságú, különböző lekérdezéseket kell keresnie<тяжести>szavakkal és a nap különböző szakaszaiban (a szerver terhelése jelentősen egyenetlen a nap folyamán, a csúcs délután három-négy óra körül van)

5. Keresési lehetőségek (dokumentumnyelvvel való munka, lekérdezési nyelv)

További összehasonlítási szempont, hogy mit és hogyan ír be a kereső az indexbe. Érdemes elmondani, hogy a teljes szövegű keresőmotor a felhasználó számára látható szöveg összes szavát indexeli. A morfológia jelenléte lehetővé teszi, hogy a keresett szavakat minden deklinációban vagy ragozásban megtaláljuk. Ezen kívül be HTML nyelv vannak olyan címkék, amelyeket keresőmotor is feldolgozhat (címek, linkek, képfeliratok stb.)

Szinte minden gép rendelkezik lekérdezési nyelvvel szabványos logikai operátorok formájában (ÉS, VAGY, NEM). Vannak, akik tudják, hogyan keressenek kifejezéseket vagy szavakat adott távolságból – ez gyakran fontos az ésszerű eredmény eléréséhez. További lehetőség lesz a dokumentumterületeken történő keresés – címsorok, hivatkozások, kulcsszavak (META KULCSSZAVAK) stb. Kiegészítő funkció lekérdezési nyelv - természetes nyelvű lekérdezés, amely nem igényli az operátorok ismeretét.

Ellenőrzés módja: Általában ezeket az információkat a kereső szerverén teszik közzé (a Súgóban), ennek ellenére ajánlatos a valós kéréseket ellenőrizni, mert néha a kívánt valóságként jelenik meg.

6. Kiegészítő szolgáltatások

Ezek olyan kiegészítő szolgáltatások, amelyeket a keresőmotor biztosít a felhasználóknak. Ez magában foglal mindenféle keresési lehetőséget (speciális oldalak, hasonló dokumentumok keresése, a keresési terület korlátozása), a talált szerverek listáját, valamint dátum és szerver szerinti keresést, ill. felhasználóbarát felület keresőmotor, és személyre szabható.

Az ellenőrzés módja: Előfordulhat, hogy az információkat részben közzéteszik a keresőmotor szerverén, de a legjobb, ha megpróbálja saját maga is használni ezeket a funkciókat.

Nyilvánvaló, hogy ez az elemzés eltart egy ideig. Ezenkívül a keresőmotorok, mint az egész internet, nem állnak meg. Ugyanakkor, tekintettel arra, hogy az információkeresés az egyik fontos összetevő számítógépes technológia, érdemes erre kellő figyelmet fordítani - legalábbis nem kevesebbet, mint a helyi hálózatban való munkavégzés képességét.

A Yandex.ru oldalon felmérés készült: miért van szükség az internetre, és mi hiányzik belőle (http://www.yandex.ru/polling/9.html) A felmérés adatait csökkenő sorrendben a következőképpen osztották meg: Az internetet referenciakönyvként (23, 76%), kutatási eszközként (15,45%), szórakoztatásként (14,15%) használják, és csak a negyedik helyen áll hírforrás (12,32%) Optimistán hangzott, hogy a felhasználók 10%-a mindig sikerül, és 73%-uk gyakran sikerül megtalálnia a szükséges információkat. Az internetről pedig hiányzik: az információ, a jó keresés és a rend (beleértve: rendezettség, struktúra, szerkezet, szerkezet, szerkezet, valamint rendszerezés, rendszerezés, rendszeresség, rendszerezettség és rendszerezettség)

VÁLASZOLJ A KÉRDÉSEKRE:

Nevezze meg, milyen keresésszervezési módszerek léteznek az interneten?

Hogyan történik az információkeresés a katalógusokban és adatbázisokban?

Hogyan kerülnek be az információk a katalógusokba és adatbázisokba?

Mik azok a keresőmotorok az interneten?

Hogyan jön létre egy információs adatbázis a keresőmotorokban?

Hol kezdődik az információkeresés a keresőmotorokban?

Mi az a kérés?

Hogyan történik az információkeresés a keresőmotorokban?

Mit értesz egy lekérdezés relevanciáján?

Mit lehet tenni, ha a további keresés során nagyon sok dokumentumot találnak?

Mik azok a metakereső motorok?

Mi az alapvető különbség a metakeresők és a hagyományos keresők között?

Az alábbi rendszerek közül melyik lesz metakereső:

Melyek a legnépszerűbb hazai keresők?

Melyek a legnépszerűbb külföldi keresők?

Melyik két összetevő fontos az interneten történő információkeresés során?

Milyen jellemzők határozzák meg a keresőmotorok hatékonyságát az interneten történő információkeresés során?

Használati feltételek:
Szellemi jogok az anyaghoz - Információ számítógépes hálózatok- Boriszov N.A., Lukin A.A. szerzőjéhez tartozik. Ez a kézikönyv/könyv kizárólag tájékoztatási célokat szolgál, kereskedelmi forgalomba hozatal nélkül. Minden információt (beleértve a „Téma 3. Információkeresés az INTERNETEN”) nyílt forrásokból gyűjtöttünk össze, vagy a felhasználók ingyenesen adnak hozzá.
A közzétett információk teljes körű felhasználása érdekében a webhely projektadminisztrációja nyomatékosan javasolja az Információs számítógépes hálózatok - Borisov N.A., Lukin A.A. könyv / kézikönyv megvásárlását. bármelyik webáruházban.

Címkeblokk: Információs számítógépes hálózatok - Borisov N.A., Lukin A.A., 2015. 3. témakör Információ keresése az INTERNETEN.

(C) Jogi adattár honlapja 2011-2016

Az interneten való keresés három módja

Az internet általában, és különösen a világháló hozzáférést biztosít az előfizető számára több ezer szerverhez és több millió weboldalhoz, amelyek elképzelhetetlen mennyiségű információt tárolnak. Hogyan ne vessz el ebben az „információs óceánban”? Ehhez meg kell tanulnia keresni és megtalálni a szükséges információkat az interneten.

Mint már említettük, három fő módja van az információkeresésnek az interneten.

1. Az oldal címének megadása. Ez a leggyorsabb keresési mód, de csak akkor használható, ha a dokumentum pontos címe ismert.

2. Navigáció hiperhivatkozásokon keresztül. Ez a legkevésbé kényelmes módszer, mivel olyan dokumentumokat lehet vele keresni, amelyek jelentésükben csak közel állnak az aktuális dokumentumhoz. Ha az aktuális dokumentum például a zenének van szentelve, akkor a dokumentumban található hiperhivatkozások használatával nem valószínű, hogy el tud jutni egy sporttal foglalkozó webhelyre.

3. Kapcsolatfelvétel egy keresőkiszolgálóval (keresőmotor). A keresőszerverek használata a legkényelmesebb módja az információkeresésnek. Jelenleg a következő keresőszerverek népszerűek az internet orosz nyelvű részén: Yandex; Turista.

Vannak más keresők is. Például egy hatékony keresőrendszer van megvalósítva a mail.ru levelezőszolgáltatás szerverén.

Szerverek keresése

A világhálón történő információkeresés legkönnyebben elérhető és legkényelmesebb módja a keresőmotorok használata. Ebben az esetben az információk kereshetők katalógusokon keresztül, valamint a keresett szöveges dokumentumot jellemző kulcsszavak halmazán keresztül.

Nézzük meg részletesebben a keresőszerverek használatát. Keresési szerver nagyszámú hivatkozást tartalmaz a legkülönfélébb dokumentumokra, és mindezek a hivatkozások tematikus katalógusokba vannak rendszerezve. Például: sport, mozi, autók, játékok, tudomány stb. Sőt, ezeket a hivatkozásokat a szerver önállóan telepíti, automatikusan, a világhálón megjelenő összes weboldal rendszeres megtekintésével. Ezenkívül a keresőmotorok lehetőséget biztosítanak a felhasználónak arra, hogy kulcsszavak segítségével keressen információkat. A kulcsszavak megadása után a keresőszerver elkezdi megtekinteni a többi webszerveren lévő dokumentumokat, és megjeleníti azokra a dokumentumokra mutató hivatkozásokat, amelyekben a megadott szavak szerepelnek. A keresési eredményeket általában csökkenő sorrendbe rendezik egy speciális dokumentumminősítés szerint, amely megmutatja, hogy egy adott dokumentum mennyire felel meg a keresési feltételeknek, vagy milyen gyakran kérik online.

Keresőmotor lekérdezési nyelve

A kulcsszavak meghatározott szabályok szerint kialakított csoportját - lekérdezési nyelv segítségével - kérésnek nevezzük a keresőkiszolgálóhoz. A különböző keresőszerverek lekérdezési nyelvei nagyon hasonlóak. Erről többet megtudhat a kívánt keresőszerver „Súgó” részében. Nézzük meg a lekérdezések létrehozásának szabályait a Yandex keresőmotor segítségével.

Operátori szintaxis Mit jelent az operátor? Példa kérés
szóköz vagy & Logikai ÉS (egy mondaton belül) Rögzített fogsor
&& Logikai ÉS (a dokumentumon belül) Típusok && (rögzített fogsorok)
| Logikus VAGY fotó | fotózás | pillanatfelvétel | fényképes kép
+ A szó kötelező jelenléte a talált dokumentumban + lenni vagy +nem lenni
() Szavak csoportosítása (technológia | gyártás) (sajt | túró)
~ Bináris operátor AND NOT (egy mondaton belül) bankok ~ jog
~~ vagy _ Bináris ÉS NEM operátor (a dokumentumon belül) Párizsi útmutató ~~ (ügynökség | túra)
/(n m) Távolság szavakban (mínusz (-) – hátra, plusz (+) – előre) beszállítók /2 kávézene /(-2 4) oktatás üresedés ~ /+1 tanuló
« « Keressen rá egy kifejezésre „Rögzített fogsorok” Egyenértékű: Rögzített /+1 fogsor
&&/(n m) Távolság mondatokban (mínusz (-) – hátra, plusz (+) – előre) orvostudomány && /1 protézis

Általános információ.

Jelenleg az internet több száz millió szervert egyesít, amelyek több milliárd különböző webhelyet és különféle információkat tartalmazó egyedi fájlokat tárolnak. Ez egy óriási információs tárház. Számos módszer létezik az információkeresésre az interneten.

Keresés ismert cím alapján. A szükséges címeket könyvtárakból veszik. A cím ismeretében csak írja be címsor Böngésző.

www.gov.ru - az orosz kormányzati hatóságok szervere.

Cím létrehozása a felhasználó által. Az internetes címképzési rendszer ismeretében webhelyek keresésekor is létrehozhat címeket.

A kulcsszóhoz (egy cég, vállalkozás, szervezet neve vagy egyszerű angol főnév) hozzá kell adni egy tematikus vagy földrajzi tartományt, és össze kell kapcsolnia az intuícióját.

Kereskedelmi weboldalak címei:

www.cnn.com (CNN World News),

www.sony.com ( SONY cég),

www.mtv.com (MTV zenei hírek).

Az oktatási intézmények címei:

www.ntu.edu (US National University).

Regionális szervercímek:

www.poland.net (Lengyelország),

www.israil.net (Izrael).

Internetes keresők

Speciális információkereső rendszereket fejlesztettek ki az internetes információk keresésére. A keresőmotorok rendes címmel rendelkeznek, és olyan weboldalként jelennek meg, amely speciális eszközöket tartalmaz a keresések szervezéséhez (keresési karakterlánc, tárgykönyvtár, hivatkozások). Keresőmotor hívásához egyszerűen írja be a címét a böngésző címsorába.

Az információszervezés módszere szerint az információkereső rendszereket két típusra osztják: osztályozóra (rubrikátorra) és szótárra.

A kategóriák (osztályozók) olyan keresőmotorok, amelyek az információk hierarchikus (fa) szerveződését használják. Információkereséskor a felhasználó a tematikus címsorokon keresztül néz, fokozatosan szűkítve a keresési mezőt (például ha meg kell találni egy szó jelentését, akkor először meg kell találnia egy szótárt az osztályozóban, majd meg kell találnia benne a megfelelő szó).

A szótárkereső rendszerek erőteljes automatikus szoftver- és hardverrendszerek. Segítségükkel az interneten megtekinthetők (beszkennelhetők) az információk. Az adott információ helyére vonatkozó adatok speciális indexkönyvtárakba kerülnek. Kérésre válaszul a keresés a lekérdezési karakterlánc szerint történik. Ennek eredményeként a felhasználó felkínálja azokat a címeket (URL-eket), ahol a keresett szó vagy szócsoport megtalálható volt a szkenneléskor. A javasolt hivatkozási címek bármelyikének kiválasztásával a talált dokumentumhoz léphet. A legtöbb modern keresőmotor vegyes.

A leghíresebb és legnépszerűbb keresők:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

Vannak keresésre szakosodott rendszerek információs források különböző irányokba.

Emberek keresése az interneten:

www.whowhere.ru www. bigfoot.com

Hírcsoportok keresése (Usenet):

www.dejanews.com

Tárgykeresők:

Keresés szoftver:

Keresés a fájlarchívumokban:

http://ftpseach. city.ru, http://ftpsearch. licos.com

Katalógusok (tematikus linkgyűjtemények megjegyzésekkel):

http://www.atrus.ru

Az információ hatékony keresése gyakran regionális címtárak segítségével végezhető el - speciális szerverek, amelyek egy város vagy régió vállalatairól vagy webes erőforrásairól tartalmaznak adatokat. Például Szentpétervár esetében egy ilyen címtár a http://www.spb.ru címen található.

Az IPS listája a www.monk weboldalon található. newmail.ru

A keresőmotorok és a címtárak részletesebb listája a táblázatban található. 3.2.

A kérések teljesítésének szabályai

Minden keresőmotor Súgó szakasza információkat tartalmaz a keresésről és a lekérdezési karakterlánc létrehozásáról. Az alábbiakban egy tipikus, „átlagos” lekérdezési nyelvről olvashat.

Egyszerű kérés.

Írjon be egy szót, amely meghatározza a keresési témát. Például a Rambler.ru keresőben elegendő beírni: automatizálás.

A rendszer olyan dokumentumokat talál, amelyek a kérésben megadott szavakat tartalmazzák. Az orosz szavak minden formáját felismeri, a kis- és nagybetűket általában figyelmen kívül hagyja.

A lekérdezésben használhatja a "*" vagy "?" karaktert. Jelölje: "?" egy kulcsszóban egy karaktert helyettesítünk, amely helyére tetszőleges betű cserélhető, a „*” jel pedig egy karaktersorozat.

Például az automatikus* lekérdezés lehetővé teszi olyan dokumentumok keresését, amelyek tartalmazzák az automatikus, automatizálás stb. szavakat.

Összetett kérés.

Gyakran szükség van a kulcsszavak kombinálására, hogy pontosabb információkat kapjunk. Ebben az esetben további, zárójelekkel elválasztott összekötő szavakat, függvényeket, operátorokat, szimbólumokat, operátorkombinációkat használnak.

Például a zene & (beatles | beatles) lekérdezés azt jelenti, hogy a felhasználó a music and beatles vagy a music and beatles szavakat tartalmazó dokumentumokat keresi.

A 3.1. táblázat az Aport rendszerben (http://www.aport.ru) elfogadott kérések generálási szabályait mutatja be.

3.1. táblázat

Operátorok a lekérdezések kialakításához

Operátor Szinonimák Egy komment
ÉS ÉS& A lekérdezés mindkét kulcsszót tartalmazó dokumentumokat megtalálja. Nem kell leírnod. Például a számítástechnika és tankönyv lekérdezés egyenértékű a számítástechnikai tankönyvvel
VAGY VAGY | A keresés azokra a dokumentumokra történik, amelyek a megadott szavak valamelyikét vagy mindkét szót egyidejűleg használják.
NEM NEM - ~ A keresés azokra a dokumentumokra korlátozódik, amelyek nem tartalmazzák az operátor után megadott szót
" " " " A dupla vagy szimpla idézőjelek lehetővé teszik egy kifejezés megtalálását
Dátum= dátum:dátum= A keresés a megadott dátumtartományba eső dokumentumokra korlátozódik Példa 1. pénznem dátum=2002.01.02.-2002.01.03. Ez a kérelem a "valuta" szót tartalmazó dokumentumokat állítja elő, amelyek dátuma 2002. február 1. és 2002. március 1. között van. 2. példa: dátum = 2002.03.01. pénznem 3. példa: dátum:<02/03/2002 валюта

3.2. táblázat

Keresőmotorok és könyvtárak listája

Cím Leírás
www.excite.com Keresőmotor webhelyértékelésekkel és útmutatókkal
www.alta-vista.com Keresőszerver, fejlett keresési lehetőségek állnak rendelkezésre
www.hotbot.com Keresési szerver
www.poland.net www.israil.net Lengyelország, Izrael regionális keresőszerverei
www.ifoseek.com Keresőszerver (könnyen használható)
www.ipl.org Internet Publik könyvtár, a Világfalu projekt keretében működő nyilvános könyvtár
www.wisewire.com WiseWire - mesterséges intelligenciát használó keresési szervezet
www.webcrawler.com WebCrawler - keresőszerver, könnyen használható
www.yahoo.com CatalogWeb és interfész a teljes szöveges keresés eléréséhez az AltaVista szerveren
www.aport.ru Aport - orosz nyelvű keresőszerver
www.yandex.ru Yandex - orosz nyelvű keresőszerver
www.rambler.ru Rambler - orosz nyelvű keresőszerver
Internetes súgóforrások
www.yellow.com Yellow Pages Internet
szerzetes newmail.ru Különféle profilú keresők
www.top200.ru Top 200 webhely
www.allru.net
www.ru Az orosz internetes források katalógusa
www.allru.net/z09. htm Oktatási források
www.students.ru Orosz diákszerver
www.cdo.ru/index_new. áspiskígyó Távoktatási Központ
www.open. ac. uk UK Open University
www.ntu.edu Amerikai Nemzeti Egyetem
www.translate.ru Elektronikus szövegfordító
www.pomorsu.ru/guide. könyvtár.html A hálózati könyvtárakra mutató hivatkozások listája
www.elibrary.ru Tudományos elektronikus könyvtár
www.citforum.ru Digitális könyvtár
www.infamed.com/psy Pszichológiai tesztek
www.pokoleniye.ru Az Internet Education Federation honlapja
www.method. narod.ru Oktatási források
www.spb. osi.ru/ic/distant Távoktatás az interneten
www.examen.ru Vizsgák és tesztek
www.kbsu.ru/~book/ Számítástechnika tankönyv
Mega. km.ru Enciklopédiák és szótárak

Információkeresés az interneten: buktatók

A felszínen nem látható problémák sokszor csak „utólag”, a keresési munka egy bizonyos szakaszának befejezése után, és esetleg annak eredményei alapján már megszületett a döntés. Mi akadályozza meg abban, hogy a helyzetet már a kezdetektől átláthatóvá tegye egy-egy információkereső rendszer (IRS) működése során? A válasz nagyon egyszerű: a fejlesztő részéről hiányzik az ilyen átfogó információ. Ennek egyenes következménye a kapott adatok megbízhatatlansága és ellenőrizetlen elvesztése. Ritkán találni olyan keresőt az interneten, amely ne rendelkezik néhány „dokumentálatlan” funkcióval. Úgy tűnik, hogy a felhasználónak nincs szüksége sok információra, nevezetesen:

hogyan van feltöltve az IPS adatbázis és mekkora a térfogata;

a rendszerkeresési nyelvi lehetőségek teljes skálája;

a keresési eredmények megjelenítésének főbb jellemzői, elsősorban a keresési lekérdezések válaszlistájából a rekordok rangsorolására szolgáló algoritmus.

Sajnos az ilyen információk forrása általában nem egy keresőszerver főoldaláról elérhető dokumentum, hanem az egyes szerzők interneten szétszórt kiadványai, könyvek és számítógépes magazinok. Ennek az állapotnak az okai nyilvánvalóan nemcsak a fejlesztő hanyagsága, hanem a marketingpolitika nevű tényező is. Egyszerűen fogalmazva, ha a keresőmotort a legteljesebb információkkal látja el magáról, az nem mindig befolyásolja pozitívan a helyezést. Bizonyos esetekben azonban a felhasználó képes átvenni az irányítást a helyzet felett. A kiválasztott keresőszolgáltatás működési jellemzőit gyakran teszteléssel lehet kideríteni. Sok esetben nem triviálisnak bizonyul olyan speciális tesztlekérdezések összeállítása, amelyek gyorsan tisztázzák a rendszer működésének az aktuális feladat szempontjából legfontosabb szempontját. Beszélgetésünket annak szenteljük, hogyan lehet elkerülni bizonyos problémákat az IPS-sel való munka során. Az előadás illusztrálására példaként a jól ismert internetes keresőmotorokat vesszük figyelembe.