Információk keresése az interneten

Az internet nagyon gyors ütemben növekszik, ezért keresse meg szükséges információ Weboldalak százmilliárdjai és több százmillió fájl között ez egyre nehezebbé válik. Az információk kereséséhez speciális keresőmotorokat használnak, amelyek folyamatosan frissített információkat tartalmaznak a több száz millió internetes szerveren lévő weboldalak és fájlok elhelyezkedéséről.

A keresőmotorok tematikusan csoportosított információkat tartalmaznak adatbázisokban a világháló információforrásairól. A speciális programok-robotok időről időre „megkerülik” az internetes webszervereket, elolvassák az összes talált dokumentumot, kiemelik a kulcsszavakat bennük, és beírják a dokumentumok internetcímét az adatbázisba.

A legtöbb keresőmotor lehetővé teszi a webhely szerzőjének, hogy egy regisztrációs űrlap kitöltésével információkat vigyen be az adatbázisba. A kérdőív kitöltése során az oldal fejlesztője megadja az oldal címét, nevét, Rövid leírás az oldal tartalmát, valamint azokat a kulcsszavakat, amelyek alapján az oldalt a legegyszerűbb megtalálni.

Kulcsszavas keresés. A dokumentum keresése a kereső adatbázisában lekérdezések beírásával történik keresőmezőbe.

A kérésnek tartalmaznia kell egy vagy több kulcsszót, amelyek a fő kulcsszavak ehhez a dokumentumhoz. Például maguknak az internetes keresőmotoroknak a kereséséhez adja meg a kulcsszavakat " orosz rendszer keressen információt az interneten "(6.21. ábra).

A kérés elküldése után némi idővel a keresőmotor visszaadja azon dokumentumok internetes címeinek listáját, amelyekben a megadott kulcsszavakat megtalálta. Ennek a dokumentumnak a böngészőben való megtekintéséhez elegendő a rá mutató hivatkozást aktiválni (6.22. ábra).

Ha a kulcsszavakat sikertelenül választotta ki, akkor a dokumentumcímek listája túl nagy lehet (tíz vagy akár több százezer hivatkozást is tartalmazhat). A lista szűkítéséhez további kulcsszavakat írhat be a keresőmezőbe, vagy használhatja a keresőmotor könyvtárát.

Az egyik legteljesebb és legerősebb kereső a Google (www.google.ru), amely 8 milliárd weblapot tárol adatbázisában, és havonta 5 millió új oldalt írnak be a robotok. A Runetben (az internet orosz része) a kiterjedt, egyenként 200 millió dokumentumot tartalmazó adatbázisok Yandex (www.yandex.ru) és Rambler (www.rambler.ru) keresőmotorokkal rendelkeznek.

Keresés hierarchikus címtárrendszerben. A keresőmotor adatbázisában a webhelyek csoportokba vannak csoportosítva hierarchikus tárgykönyvtárak, amelyek a könyvtári tárgykatalógushoz hasonlóak.

Legfelső szintű tematikus szekciók, például: Internet, számítógépek, tudomány és oktatásés így tovább, beágyazott könyvtárakat tartalmaznak. Például az internetes címtár tartalmazhat alkönyvtárakat Keresés, levélés mások (6.23. ábra).

Az információk keresése egy címtárban egy adott címtár kiválasztására korlátozódik, majd a felhasználónak megjelenik a leglátogatottabb és legjelentősebb webhelyek internetcímére mutató hivatkozások listája. Minden hivatkozás általában megjegyzésekkel ellátott, azaz rövid kommentárt tartalmaz a dokumentum tartalmáról.

Az Aport keresőmotor (www.aport.ru) az orosz nyelvű internetes források legteljesebb, többszintű hierarchikus tematikus katalógusával rendelkezik. A katalógus részletes megjegyzéseket tartalmaz a webhelyek tartalmáról és földrajzi elhelyezkedésükről.

Fájlkeresés. A fájlarchívum-szervereken való fájlok kereséséhez speciális keresőmotorok állnak rendelkezésre, beleértve a FileSearch keresőmotort (www.filesearch.ru). Fájl kereséséhez be kell írni a fájl nevét a keresőmezőbe, és a kereső visszaadja azon fájlarchívum szerverek internetes címét, amelyek a megadott néven tárolják a fájlt.

Információkeresés az internet orosz nyelvű részén a legtöbb kereső segítségével: Google, Rambler, Aport, Applex és a Research fájlkereső a Gogle.ru integrált kereső segítségével (6.24. ábra). Ehhez csak írja be a kulcsszavakat a keresősávba, a kapcsolókkal állítsa be a kívánt információ típusát, majd kattintson a Gogle.ru keresőmotor nevével ellátott gombra (6.24. ábra). Ehhez csak írja be a kulcsszavakat a keresősávba, a kapcsolókkal állítsa be a kívánt információ típusát, majd kattintson a keresőmotor nevével ellátott gombra.


Rizs. 6.24. Integrált keresőmotor Google.ru

Internetes keresési módszerek

A weben való keresés három módja

Az internet általában, és különösen a világháló több ezer szerverhez és több millió weboldalhoz biztosít hozzáférést az előfizető számára, amelyek elképzelhetetlen mennyiségű információt tárolnak. Hogyan ne vessz el ebben az "információs óceánban"? Ehhez meg kell tanulnia keresni és megtalálni a szükséges információkat a hálózaton.

Amint már említettük, három fő módja van az információkeresésnek az interneten.

1. Az oldal címének megadása. Ez a legtöbb gyors út keresés, de csak akkor használható, ha a dokumentum pontos címe ismert.

2. Navigáció hiperhivatkozásokon keresztül. Ez a legkevésbé kényelmes módszer, mivel olyan dokumentumokat lehet vele keresni, amelyek jelentésükben csak közel állnak az aktuális dokumentumhoz. Ha a jelenlegi dokumentum például a zenének szól, akkor ennek a dokumentumnak a hivatkozásait használva aligha lehet eljutni egy sporttal foglalkozó oldalra.

3. A keresőszerver felhívása keresőmotor) . A keresőmotorok használata a legkényelmesebb módja az információkeresésnek. Jelenleg a következő keresőszerverek népszerűek az internet orosz nyelvű részén:

    Yandex;
    Turista;
    Aport.

Vannak más keresők is. Például, hatékony rendszer keresés a szerveren megvalósítva postai szolgáltatás mail.ru.

Szerverek keresése

A legkönnyebben elérhető és legkényelmesebb módja az információkeresésnek világháló a keresőmotorok használata. Ugyanakkor az információk kereshetők katalógusok, valamint a keresett szöveges dokumentumot jellemző kulcsszavak alapján.

Fontolja meg részletesebben a keresőszerverek használatát. kereső szerver nagyszámú hivatkozást tartalmaz a legtöbbre különféle dokumentumokat, és mindezek a hivatkozások tematikus könyvtárakba vannak rendezve. Például: sport, mozi, autók, játékok, tudomány stb. Sőt, ezeket a linkeket a szerver önállóan állítja be, automatikus üzemmód a világhálón megjelenő összes weboldal rendszeres megtekintésével. Ezen túlmenően a keresőszerverek lehetővé teszik a felhasználó számára, hogy kulcsszavak alapján keressen információkat. A kulcsszavak megadása után a keresőszerver elkezdi böngészni a dokumentumokat más webszervereken, és megjeleníti azokra a dokumentumokra mutató hivatkozásokat, amelyekben a megadott szavak megtalálhatók. A keresési eredményeket általában csökkenő sorrendbe rendezik egy speciális dokumentumminősítés szerint, amely azt jelzi, hogy egy adott dokumentum mennyire felel meg a keresési feltételeknek, vagy milyen gyakran kérik a weben.

Keresőmotor lekérdezési nyelve

A kulcsszavak egy csoportját, amely bizonyos szabályok szerint - a lekérdezési nyelv használatával - alakul ki, kérésnek nevezzük a keresőkiszolgálóhoz. A különböző keresőmotorok lekérdezési nyelvei nagyon hasonlóak. Erről többet megtudhat a kívánt keresőszerver "Súgó" részében. Tekintsük a lekérdezések generálására vonatkozó szabályokat a Yandex keresőmotor használatával példaként.

Operátori szintaxis Mit jelent az operátor Példa kérése
szóköz vagy & Logikai ÉS (mondaton belül) fizikoterápia
&& Logikai ÉS (a dokumentumon belül) receptek && (ömlesztett sajt)
| Logikus VAGY fotó | fotózás | pillanatfelvétel | fényképes kép
+ A szó kötelező jelenléte a talált dokumentumban + lenni vagy +nem lenni
() Szavak csoportosítása (technológia | gyártás) (sajt | túró)
~ bináris operátorÉS NEM (mondaton belül) bankok ~ jog
~~
vagy
_
Bináris ÉS NEM operátor (a dokumentumon belül) Párizsi útikalauz ~~ (ügynökség | túra)
/(nm) Távolság szavakban (mínusz (-) - hátra, plusz (+) - előre) beszállítók /2 kávézene /(-2 4) oktatás üresedés ~ /+1 tanuló
" " Kifejezés keresés "piroska" Egyenértékű: piros / +1 lovaglás
&&/(nm) Távolság mondatokban (mínusz (-) - hátra, plusz (+) - előre) bank && /1 adók

Megszerezni legjobb pontszámok keresés során emlékeznie kell néhány egyszerű szabályra:

    1. Ne csak egy kulcsszóra keressen információt.

    2. A legjobb, ha nem nagybetűvel írja be a kulcsszavakat, mert előfordulhat, hogy a kisbetűvel írt szavak nem találhatók meg.

    3. Ha a keresés nem hozott eredményt, ellenőrizze, hogy vannak-e kulcsszavakat x helyesírási hiba.

A modern keresőmotorok lehetőséget biztosítanak a szemantikai elemző generált kérésére való csatlakozásra. Segítségével egy szó beírásával olyan dokumentumokat választhat ki, amelyekben ennek a szónak a származékai vannak különböző esetekben, igeidőkben stb.

tesztkérdések

1. Hogyan történik a dokumentumok keresése kulcsszavak alapján? Címtárrendszerben?

Önmegvalósítási feladatok

6.8 Gyakorlati feladat. Hasonlítsa össze a dokumentumok keresési eredményeit kulcsszó szerint különböző keresőmotorok segítségével (használja az integrált Google keresőt).

6.9 Gyakorlati feladat. Keresse meg a fájlarchívum szervereken a WinAmp médialejátszó fájlt.

Mi az

A DuckDuckGo egy meglehetősen jól ismert nyílt forráskódú keresőmotor. forráskód. A szerverek az Egyesült Államokban találhatók. A kereső a saját robotja mellett más források eredményeit is felhasználja: Yahoo, Bing, Wikipedia.

A jobb

A DuckDuckGo a végső adatvédelmi és adatvédelmi keresőként pozicionálja magát. A rendszer nem gyűjt adatot a felhasználóról, nem tárol naplókat (nincs keresési előzmény), használat sütiket maximálisan korlátozott.

A DuckDuckGo nem gyűjt és nem oszt meg személyes adatokat a felhasználóktól. Ez az adatvédelmi szabályzatunk.

Gabriel Weinberg, a DuckDuckGo alapítója

Miért van szüksége erre

Minden nagyobb keresőmotor megpróbálja személyre szabni a keresési eredményeket a monitor előtt álló személy adatai alapján. Ezt a jelenséget "szűrőbuboréknak" nevezik: a felhasználó csak azokat az eredményeket látja, amelyek összhangban vannak a preferenciáival, vagy amelyeket a rendszer annak tekint.

Objektív képet alkot, amely nem függ az Ön korábbi internetes viselkedésétől, és kiküszöböli a tematikát google hirdetésekés a "Yandex", az Ön kérései alapján. A DuckDuckGo segítségével könnyen lehet idegen nyelvű információkat keresni, míg a Google és a Yandex alapértelmezés szerint az orosz nyelvű oldalakat részesíti előnyben, még akkor is, ha a lekérdezést más nyelven írják be.


Mi az

A not Evil egy olyan rendszer, amely a névtelen Tor hálózatot keresi. A használatához ehhez a hálózathoz kell lépnie, például egy speciális .

A not Evil nem az egyetlen keresőmotor a maga nemében. Van egy LOOK (alapértelmezett keresés a Tor böngészőben, elérhető a rendszeres internet) vagy a TORCH (az egyik legrégebbi keresőmotor a Tor hálózaton) és mások. A Google-re való félreismerhetetlen utalás miatt döntöttünk a not Evil mellett (nézd csak meg a kezdőlapot).

A jobb

Azt keresi, ahol elvileg megtagadják a hozzáférést a Google, a Yandex és más keresők számára.

Miért van szüksége erre

A Tor hálózaton számos olyan forrás található, amelyek nem találhatók meg a törvénytisztelő interneten. Számuk pedig növekedni fog, ahogy a hatóságok ellenőrzése szigorodik a web tartalmai felett. A Tor egyfajta hálózat a weben, közösségi hálózataival, torrentkövetőivel, médiájával, kereskedési platformok, blogok, könyvtárak és így tovább.

3. YaCy

Mi az

A YaCy egy decentralizált keresőmotor, amely a P2P hálózatok elvén működik. Minden számítógépnek van elsődleges szoftver modul, önmagában szkenneli az internetet, vagyis egy keresőrobot analógja. A kapott eredményeket egy közös adatbázisba gyűjtik, amelyet a YaCy összes résztvevője használ.

A jobb

Itt nehéz megmondani, hogy ez jobb vagy rosszabb, mivel a YaCy teljesen más megközelítés a keresés megszervezéséhez. Az egyetlen szerver és tulajdonos cég hiánya az eredményeket teljesen függetlenné teszi bárki preferenciáitól. Az egyes csomópontok autonómiája kizárja a cenzúrát. A YaCy képes keresni a mélyweben és a nem indexelt nyilvános hálózatokon.

Miért van szüksége erre

Ha nyílt forráskódú támogató és ingyenes internet, amelyet nem befolyásolnak a kormányzati szervek és a nagyvállalatok, akkor a YaCy az Ön választása. Használható vállalati vagy más autonóm hálózaton belüli keresések szervezésére is. És bár a YaCy nem túl hasznos a mindennapokban, a keresési folyamat szempontjából méltó alternatívája a Google-nek.

4. Pipl

Mi az

A Pipl egy olyan rendszer, amelyet arra terveztek, hogy információkat keressen egy adott személyről.

A jobb

A Pipl szerzői azt állítják, hogy speciális algoritmusaik hatékonyabban keresnek, mint a "szokásos" keresők. Különösen a profilok kapnak prioritást közösségi hálózatok, megjegyzések, résztvevők listái és különféle adatbázisok, ahol emberekről információkat tesznek közzé, például bírósági határozatok adatbázisai. Pipl vezető szerepét ezen a területen a Lifehacker.com, a TechCrunch és más kiadványok is megerősítik.

Miért van szüksége erre

Ha információt kell találnia egy USA-ban élő személyről, akkor a Pipl sokkal hatékonyabb lesz, mint a Google. Az orosz bíróságok adatbázisai nyilvánvalóan nem érhetők el a kereső számára. Ezért nem birkózik meg olyan jól Oroszország polgáraival.

Mi az

A FindSounds egy másik speciális keresőmotor. Nyílt forrásokban keres különféle hangokat: ház, természet, autók, emberek stb. A szolgáltatás nem támogatja az orosz nyelvű kéréseket, de van egy lenyűgöző lista az orosz nyelvű címkékről, amelyeket kereshet.

A jobb

Csak hangok kiadásában, semmi több. A beállításokban beállíthatja a kívánt formátumot és hangminőséget. Minden talált hang letölthető. Van mintakeresés.

Miért van szüksége erre

Ha gyorsan meg kell találnia egy muskétalövés hangját, egy szívó harkály ütését vagy Homer Simpson kiáltását, akkor ez a szolgáltatás az Ön számára készült. És ezt csak a rendelkezésre álló orosz nyelvű lekérdezések közül választottuk. A angol nyelv a spektrum még szélesebb.

Komolyan, egy speciális szolgáltatás speciális közönséget jelent. De neked is jól jön?

Mi az

A Wolfram|Alpha egy számítástechnikai keresőmotor. A kulcsszavakat tartalmazó cikkekre mutató hivatkozások helyett kész választ ad a felhasználó kérésére. Például, ha angolul beírja a „hasonlítsa össze New York és San Francisco lakosságát” kifejezést a keresőmezőbe, akkor a Wolfram|Alpha azonnal megjeleníti az összehasonlítást tartalmazó táblázatokat és grafikonokat.

A jobb

Ez a szolgáltatás jobb, mint mások a tények megtalálásához és az adatok kiszámításához. A Wolfram|Alpha felhalmozza és rendszerezi a weben elérhető tudást különböző területeken beleértve a tudományt, a kultúrát és a szórakozást. Ha ez az adatbázis kész választ tartalmaz arra keresési lekérdezés, a rendszer megmutatja, ha nem, akkor kiszámítja és megjeleníti az eredményt. Ebben az esetben a felhasználó csak és semmi többet lát.

Miért van szüksége erre

Ha Ön például diák, elemző, újságíró vagy kutató, a Wolfram|Alpha segítségével megkeresheti és kiszámíthatja a tevékenységeivel kapcsolatos adatokat. A szolgáltatás nem ért minden kérést, de folyamatosan fejlődik és okosabbá válik.

Mi az

A Dogpile metakereső motor a keresőmotorok eredményeinek kombinált listáját jeleníti meg. Google SERPs, Yahoo és más népszerű rendszerek.

A jobb

Először is, a Dogpile kevesebb hirdetést jelenít meg. Másodszor, a szolgáltatás egy speciális algoritmust használ a különböző keresőmotorok legjobb találatainak megtalálására és megjelenítésére. A Dogpile fejlesztői szerint az ő rendszerük generálja a legteljesebb problémát az egész Interneten.

Miért van szüksége erre

Ha nem talál információt a Google-ban vagy más szabványos keresőben, keresse meg egyszerre több keresőben a Dogpile segítségével.

Mi az

A BoardReader egy szöveges keresőrendszer fórumok, kérdezz-felelek szolgáltatások és más közösségek számára.

A jobb

A szolgáltatás lehetővé teszi a keresési mező szűkítését a közösségi oldalakra. A speciális szűrőknek köszönhetően gyorsan megtalálhatja a kritériumainak megfelelő bejegyzéseket és megjegyzéseket: nyelv, közzététel dátuma és webhely neve.

Miért van szüksége erre

A BoardReader hasznos lehet PR-szakemberek és más médiaszakemberek számára, akik érdeklődnek a tömegmédia véleményére bizonyos kérdésekben.

Végül

Az alternatív keresőmotorok élete gyakran röpke. A Lifehacker a Yandex cég ukrán fióktelepének korábbi vezérigazgatóját, Sergey Petrenko-t kérdezte az ilyen projektek hosszú távú kilátásairól.


Szergej Petrenko

A Yandex.Ukrajna korábbi vezérigazgatója.

Ami az alternatív keresőmotorok sorsát illeti, egyszerű: nagyon niche-projekteknek lenni kis közönséggel, tehát egyértelmű kereskedelmi kilátások nélkül, vagy éppen ellenkezőleg, hiányuk teljes egyértelműségével.

Ha megnézi a cikkben szereplő példákat, láthatja, hogy az ilyen keresők vagy egy szűk, de keresett résre specializálódtak, ami talán csak eddig nem nőtt annyira, hogy észrevehető legyen a Google vagy a Yandex radarjain, vagy egy eredeti hipotézist tesztelnek a rangsorolás során, amely a hagyományos keresésben még nem alkalmazható.

Például, ha egy Tor-keresés hirtelen keresettnek bizonyul, vagyis a Google közönségének legalább egy százalékának szüksége lesz az eredményekre onnan, akkor természetesen a hétköznapi keresőmotorok elkezdik megoldani azt a problémát, hogy hogyan megtalálni és megmutatni a felhasználónak. Ha a közönség viselkedése azt mutatja, hogy a felhasználók jelentős része jelentős számú lekérdezésben relevánsabb eredményeknek, adatoknak tűnik a felhasználótól függő tényezők figyelembevétele nélkül, akkor a Yandex vagy a Google elkezd ilyen eredményeket adni.

A „jobbnak lenni” e cikkben nem azt jelenti, hogy „mindenben jobbnak lenni”. Igen, hőseink sok szempontból távol állnak a Yandextől (még a Bingtől is). De ezek a szolgáltatások mindegyike olyasmit ad a felhasználónak, amit a keresőipar óriásai nem tudnak kínálni. Biztosan Ön is ismer hasonló projekteket. Oszd meg velünk – beszéljük meg.

Információk keresése az interneten

Információk keresése az interneten

Információk kereséséhezáltalánosan használtban három módon(Lásd az 1. ábrát). Az első közülük - cím szerinti keresés. Akkor használatos, ha a felhasználó ismeri a számára szükséges információkat tartalmazó információs erőforrás címét. Az információkeresés cím szerinti szervezésekor (a cím formája - IP, domain vagy URL - ebben az esetben nem számít), a felhasználónak egyszerűen be kell írnia az erőforrás címét a böngésző megfelelő mezőjébe - egy program célja, hogy hozzáférést biztosítson a hálózati erőforrásokhoz.

Rizs. 1. Információkeresés módjai hipertext adatbázisokban

Második- keresés hiperhivatkozás-navigációval. Az ilyen típusú keresés során a felhasználónak először hozzá kell férnie a megfelelő adatbázishoz társított szerverhez. Ezután hiperhivatkozások segítségével megtalálhatja a dokumentumot. Nyilvánvalóan ez a módszer kényelmes, ha az erőforrás címe ismeretlen a felhasználó számára. Ennek a módszernek a megvalósítása során a keresés kiindulópontjaként a webportálok célja – olyan szerverek, amelyek közvetlen hozzáférést biztosítanak egy bizonyos kiszolgálókészlethez, beleértve a rájuk telepített információs erőforrásokat, valamint a webes szolgáltatásokat megvalósító webalkalmazásokat. a portál célja. A portálon keresztül elérhető szerverek egy adott rendszerhez (például vállalati) ill különféle rendszerekés kifejezetten a webhelyeiken található dokumentumok és adatok sajátos, tematikus vagy egyéb jellemzői alapján kell kiválasztani. A portálok jellemzően számos funkciót kombinálnak annak érdekében, hogy az ügyfél a lehető leghosszabb ideig megmaradjon. A portál domináns szolgáltatása a szolgáltatás ügyfélszolgálat: keresés, rubrikátorok, pénzügyi indexek, időjárási információk stb. Míg a webhelyek többnyire statikus weboldalak gyűjteményei, a portálok ezek gyűjteményei szoftver eszközökés előre strukturálatlan információk, amelyeket ezek az eszközök konkrét felhasználók kérésére strukturált adatokká alakítanak át.

Harmadik a keresési módszer magában foglalja az internetes keresőszerverek használatát. A keresőkiszolgálók dedikált gazdagépek – olyan számítógépek, amelyek az internetes erőforrások adatbázisait tárolják. Felhasználói felület egy ilyen szerveren van egy mező a kulcsszavak megadására, amelyek leírják a felhasználót érdeklő témát (lásd 2. ábra).

2. ábra. A Yandex keresőkiszolgáló ablakának nézete

A szerver ezeket a szavakat információkérésnek tekinti, amelynek megfelelően erőforrásokat keres, és a talált dokumentumok listáját mutatja be a felhasználónak. Nyilvánvaló, hogy ennek a módszernek a megvalósítása során mind az 1. (a cél hiánya), mind a 2. típusú (információs zaj) hibák lehetségesek. Meg kell említeni, hogy a keresőszervereknek két csoportját különböztetjük meg: a keresőmotorokat és a tárgykönyvtárakat. Különbségük az internetes források adatbázisának létrehozásának és utólagos feltöltésének módszeréből adódik, amely adott szerver végrehajtani információszerzés. Így a keresőmotorok speciális program- keresőrobot. Folyamatosan figyeli a hálózatot, információkat gyűjt weboldalak, indexeli őket, és kijavítja a keresési képüket az adatbázisában. A tárgykatalógusokban az internetes dokumentumok adatbázisát a szakszerkesztők "manuálisan" alakítják ki. Mivel az interneten nincs egységes adminisztráció, információforrásai folyamatosan változnak. Új dokumentumok jelenhetnek meg benne, és a meglévő dokumentumok eltűnhetnek. A különböző webhelyek dokumentumaiban lévő információk frissítésének gyakorisága eltérő: van, aki óránként többször, mások esetében naponta, napon, hónapban stb. Ezért nagyon fontos megérteni, hogy amikor információkereső rendszereket használunk információkeresésre az interneten, a keresés nem a webdokumentumok valós terében történik, hanem valamilyen modellben, amelynek tartalma jelentősen eltérhet a webes dokumentumoktól. az internet tényleges tartalma a keresés időpontjában. Az indexelt erőforrások lefedettségének mértéke szerint a keresőmotorok két csoportra oszthatók: nemzetközi és orosz nyelvű. Az előbbi az összes interneten megjelent dokumentumot sorban indexeli. A második a benne található erőforrásokat indexeli domain zónák az orosz nyelv túlsúlyával. A legnépszerűbb rendszerek listája a táblázatban található. egy.

Tab. 1. Legnépszerűbb keresőmotorok

Nemzetközi oroszul beszélők
Google Yandex (a Runet 44,4%-a)
Jehu! Rambler (a Runet 10,6%-a)
bing Mail.ru (a Runet 7,3%-a)
msn Nigma (0,5% Runet)
AltaVista Gogo.ru (0,3% Runet)
Kérdez Aport (0,2% Runet)

Megjegyzés: A Runet az internet oroszul beszélő része, amely névvel rendelkező domaineket alkot ru és rf.

Meg kell említeni, hogy a keresőmotoroknak van egy speciális kategóriája - a metakeresők. Alapvető különbségük a kereső motorok A tárgykatalógusok pedig az, hogy nem rendelkeznek saját index adatbázissal, ezért a felhasználói kérés fogadásakor azt egyszerre több keresőszerverre irányítják át (lásd 3. ábra).

Rizs. 3. A metakereső rendszer sémája

A metakeresők nyilvánvaló előnye, hogy egyetlen kérelemhez egyszerre több keresőt is használhatunk. Jelenleg a Metabot.ru rendszer széleskörű alkalmazásra talált, melynek interfésze a 2. ábrán látható. 4. Ez a rendszer lehetővé teszi nemzetközi és orosz nyelvű keresőszerverek használatát is az erőforrások kereséséhez.

Küldje el a jó munkát a tudásbázis egyszerű. Használja az alábbi űrlapot

Diákok, végzős hallgatók, fiatal tudósok, akik a tudásbázist tanulmányaikban és munkájukban használják, nagyon hálásak lesznek Önnek.

Hasonló dokumentumok

    Információkeresés eszközei az interneten. Az információkeresés alapvető követelményei és módszerei. A keresőszolgáltatások felépítése és jellemzői. Globális keresőmotorok WWW (World Wide Web). Internetes keresés és információgyűjtés tervezése.

    absztrakt, hozzáadva 2010.11.02

    Az interneten történő információkeresés módszereinek jellemzői, nevezetesen hipertext hivatkozások, keresőmotorok és speciális eszközök használata. Új internetes források elemzése. A nyugati és orosz nyelvű keresőmotorok megjelenésének és leírásának története.

    absztrakt, hozzáadva: 2010.05.12

    A modern információkereső rendszerek leírása és osztályozása. hipertext dokumentumok. A világ legnagyobb keresőmotorjainak áttekintése és értékelései. Információkereső rendszer fejlesztése, amely bemutatja az információkeresés mechanizmusát az interneten.

    szakdolgozat, hozzáadva: 2015.06.16

    A Yandex és a Google keresőmotorok képességeinek elemzése, összehasonlításuk hasznosság szempontjából. A keresőmotorok létrejöttének története, felületük jellemzői, keresőeszközök és algoritmusok. A kérdés kialakítása és a rá adott válasz kritériuma.

    absztrakt, hozzáadva: 2011.07.05

    Az internetes keresőmotorok szoftver- és hardverkomplexumként való figyelembe vétele webes felülettel, amely információkeresési lehetőséget biztosít. Keresőmotorok típusai: Archie, Wandex, Aliweb, WebCrawler, AltaVista, Yahoo!, Google, Yandex, Bing és Rambler.

    absztrakt, hozzáadva: 2013.10.05

    Az internet felépítése, elvei, információk keresése és mentése benne. Az információkereső rendszerek kialakulásának és osztályozásának története. A Google, Yandex, Rambler, Yahoo keresőmotorok működési elve és jellemzői. Keresés URL-ek alapján.

    szakdolgozat, hozzáadva 2013.03.29

    A globális internet lényege és működési elve. Keressen információkat a paraméterek szerint Google rendszer. Speciális információkereső rendszerek: "KtoTam", "Tagoo", "Truveo", "Kinopoisk", "Catch-Umov". A keresőmotorok megfelelő használata.

    bemutató, hozzáadva 2015.02.16

    Adatok tárolása az interneten. Hiperszöveg dokumentumok, fájltípusok. Grafikus fájlok, típusuk és jellemzőik. Keresőmotorok és információkeresési szabályok. Internetes keresők felmérése. Minden a Yandex, Google, Rambler keresőmotorokról.

    szakdolgozat, hozzáadva 2011.03.26

Általános információ.

Jelenleg az internet több száz millió szervert egyesít, amelyek több milliárd különböző webhelyet és különféle információkat tartalmazó egyedi fájlokat tárolnak. Ez egy óriási információs tárház. Az interneten többféle információkeresési módszer létezik.

Keresés ismert cím alapján. A szükséges címek könyvtárakból származnak. A cím ismeretében csak írja be címsor Böngésző.

www.gov.ru - az orosz állami hatóságok szervere.

Cím létrehozása a felhasználó által. Az internetes címgeneráló rendszer ismeretében webhelyek keresésekor címeket hozhat létre.

Egy kulcsszóhoz tematikus vagy földrajzi tartományt kell hozzáadni (cég, vállalkozás, szervezet neve vagy egyszerű angol főnév), és az intuíciót kell összekapcsolni.

Kereskedelmi webhelyek címei:

www.cnn.com (CNN World News),

www.sony.com SONY),

www.mtv.com (MTV zenei hírek).

Az oktatási intézmények címei:

www.ntu.edu (US National University).

Regionális szervercímek:

www.poland.net (Lengyelország),

www.israil.net (Izrael).

Internetes keresők

Az interneten történő információkereséshez speciális információkereső rendszereket fejlesztettek ki. A keresőmotorok normál címmel rendelkeznek, és speciális keresési rendszerező eszközöket (keresőkarakterlánc, tárgykatalógus, hivatkozások) tartalmazó weboldalként jelennek meg. Keresőmotor hívásához írja be a címét a böngésző címsorába.

Az információszervezés módszere szerint az információkereső rendszereket két típusra osztják: osztályozóra (rubrikátorra) és szótárra.

A rubrikátorok (osztályozók) olyan keresőmotorok, amelyek az információk hierarchikus (faszerű) szerveződését használják. Információkereséskor a felhasználó a tematikus címsorokon keresztül néz, fokozatosan szűkítve a keresési mezőt (például ha meg kell találni egy szó jelentését, akkor először meg kell találnia egy szótárt az osztályozóban, majd meg kell találnia benne helyes szó).

A szótárkereső rendszerek erőteljes automatikus szoftver- és hardverrendszerek. Segítségükkel az interneten található információk megtekintésére (szkennelésére) kerül sor. Az adott információ helyére vonatkozó információk speciális könyvtárak-indexekbe kerülnek. A kérésre válaszul a keresés a lekérdezési karakterláncnak megfelelően történik. Ennek eredményeként a felhasználó felkínálja azokat a címeket (URL-eket), ahol a keresett szó vagy szócsoport a kereséskor megtalálható volt. A javasolt hivatkozások bármelyikének kiválasztásával a talált dokumentumhoz léphet. A legtöbb modern keresőmotor vegyes.

A leghíresebb és legnépszerűbb keresők:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

Vannak keresésre szakosodott rendszerek információs források különböző irányokba.

Emberek keresése az interneten:

www.whowhere.ru www. bigfoot.com

Keresés hírcsoportok szerint (Usenet):

www.dejanews.com

Tárgykeresők:

Keresés szoftver:

Keresés az archívumban:

http://ftpseach.com city.ru, http://ftpsearch. licos.com

Katalógusok (tematikus linkgyűjtemények megjegyzésekkel):

http://www.atrus.ru

Gyakran az információ hatékony keresését regionális katalógusok segítségével lehet végrehajtani - speciális szerverek, amelyek egy város vagy régió vállalatairól vagy webes erőforrásairól tartalmaznak adatokat. Például Szentpétervár esetében egy ilyen katalógus a http://www.spb.ru címen található.

Az IPS listája a www.monk oldalon található. newmail.ru

A keresőmotorok és a címtárak részletesebb listája a táblázatban található. 3.2.

Lekérdezés végrehajtási szabályok

Minden keresőben a Súgó részben tájékozódhat a keresésről, a lekérdezési karakterlánc összeállításáról. Az alábbiakban egy tipikus, "átlagos" lekérdezési nyelvről olvashat.

Egyszerű kérés.

Írjon be egy szót, amely meghatározza a keresési témát. Például a Rambler.ru keresőben elég beírni: automatizálás.

A rendszer olyan dokumentumokat talál, amelyek a kérésben megadott szavakat tartalmazzák. Az orosz szavak minden formáját felismeri, a betűk esetét általában figyelmen kívül hagyják.

A lekérdezésben használhatja a „*” vagy „?” karaktert. Jelölje: "?" a kulcsszóban egy karaktert helyettesítünk, amely bármely betűvel helyettesíthető, a „*” karakter pedig egy karaktersorozat.

Például az automatikus* lekérdezés megkeresi az automatikus, automatikus és így tovább szavakat tartalmazó dokumentumokat.

Összetett kérés.

Gyakran szükség van a kulcsszavak kombinálására, hogy pontosabb információkat kapjunk. Ebben az esetben további összekötő szavakat, függvényeket, operátorokat, szimbólumokat, zárójelekkel elválasztott operátorkombinációkat használnak.

Például a zene & (beatles | beatles) lekérdezés azt jelenti, hogy a felhasználó a music and beatles vagy a music and beatles szavakat tartalmazó dokumentumokat keresi.

A 3.1. táblázat az Aport rendszerben (http://www.aport.ru) elfogadott kérések generálási szabályait mutatja be.

3.1. táblázat

Operátorok kérések kialakításához

Operátor Szinonimák Megjegyzés
És ÉS & A lekérdezés mindkét kulcsszót tartalmazó dokumentumokat megtalálja. Lehet, hogy meg van írva, vagy nem. Például a számítástechnika és tankönyv lekérdezés egyenértékű a számítástechnikai tankönyvvel
VAGY VAGY | Azokat a dokumentumokat keresi, amelyek a megadott szavak valamelyikét vagy mindkét szót egyidejűleg használják
NEM NEM-~ A keresés azokra a dokumentumokra korlátozódik, amelyek nem tartalmazzák az operátor után megadott szót
" " " " A dupla vagy szimpla idézőjelek lehetővé teszik egy kifejezés megtalálását
Dátum= dátum:dátum= A keresés azokra a dokumentumokra korlátozódik, amelyek a megadott dátumintervallumba esnek Példa 1. pénznem dátum=2002.01.02.-2002.01.03. Ez a kérelem a "valuta" szót tartalmazó dokumentumokat küldi vissza, és amelyek dátuma 2002. február 1. és 2002. március 1. között van. 2. példa dátum=2002.03.01. pénznem 3. példa dátum:<02/03/2002 валюта

3.2. táblázat

A keresőkiszolgálók és könyvtárak listája

Cím Leírás
www.excite.com Keresőmotor csomópont-értékelésekkel és útmutatókkal
www.alta-vista.com Keresőszerver, fejlett keresési lehetőségek állnak rendelkezésre
www.hotbot.com kereső szerver
www.poland.net www.israil.net Lengyelország, Izrael regionális keresőszerverei
www.ifoseek.com Keresőszerver (könnyen használható)
www.ipl.org Internet Publik könyvtár, a Világfalu projekt részeként működő nyilvános könyvtár
www.wisewire.com WiseWire - keresés szervezése mesterséges intelligencia segítségével
www.webcrawler.com WebCrawler - keresőszerver, könnyen használható
www.yahoo.com Webkatalógus és felület az AltaVista szerveren a teljes szöveges keresés eléréséhez
www.aport.ru Aport - orosz nyelvű keresőszerver
www.yandex.ru Yandex - orosz nyelvű keresőszerver
www.rambler.ru Rambler - orosz nyelvű keresőszerver
Internetes súgóforrások
www.yellow.com Internet Yellow Pages
szerzetes. newmail.ru Különféle profilú keresők
www.top200.ru Top 200 webhely
www.allru.net
www.ru Az orosz internetes források katalógusa
www.allru.net/z09. htm Oktatási források
www.students.ru Orosz diákszerver
www.cdo.ru/index_new. áspiskígyó Távoktatási Központ
www.open. ac. Egyesült Királyság Open University UK
www.ntu.edu Amerikai Nemzeti Egyetem
www.translate.ru Elektronikus szövegfordító
www.pomorsu.ru/guide. könyvtár.html A netes könyvtárakra mutató hivatkozások listája
www.elibrary.ru Tudományos elektronikus könyvtár
www.citforum.ru E-könyvtár
www.infamed.com/psy Pszichológiai tesztek
www.pokoleniye.ru Internet Oktatási Szövetség honlapja
www.method. people.ru Oktatási források
www.spb. www.osi.ru/ic/distant Távoktatás az interneten
www.examen.ru Vizsgák és tesztek
www.kbsu.ru/~book/ Számítástechnika tankönyv
Mega. km.ru Enciklopédiák és szótárak

Információkeresés az interneten: buktatók

A felszínen nem rejlő problémák sokszor csak "utólag" éreztetik magukat, miután a kutatási munka egy bizonyos szakasza lezajlott, és annak eredményei alapján talán már megszületett valamilyen döntés. Mi akadályozza meg, hogy egy-egy információkereső rendszer (IPS) működésének kezdetétől kezdve átlátható legyen a helyzet? A válasz nagyon egyszerű: a fejlesztő részéről hiányzik az ilyen átfogó információ. Ennek egyenes következménye a kapott adatok megbízhatatlansága és ellenőrizetlen elvesztése. Ritkán találni olyan keresőt a weben, amely ne rendelkezik néhány "nem dokumentált" funkcióval. Úgy tűnik, hogy a felhasználónak nincs szüksége annyi információra, nevezetesen:

hogyan van feltöltve az IPS adatbázis és mekkora a térfogata;

a rendszer keresési nyelvének teljes körű lehetőségei;

a keresési eredmények megjelenítésének főbb jellemzői, elsősorban a keresési lekérdezésre adott válaszok listájából a rekordok rangsorolására szolgáló algoritmus.

Sajnos az ilyen információk forrása általában nem a keresőszerver főoldaláról elérhető dokumentum, hanem egyes szerzők neten szétszórt kiadványai, könyvek és számítógépes magazinok. Ennek az állapotnak az okai nyilvánvalóan nemcsak a fejlesztő hanyagsága, hanem a marketingpolitika nevű tényező is. Egyszerűen fogalmazva, ha a keresőmotort a legteljesebb információkkal látja el önmagáról, az nem mindig befolyásolja pozitívan a helyezést. Ennek ellenére bizonyos esetekben a felhasználó képes kézben tartani a helyzetet. A kiválasztott keresőszolgáltatás jellemzőit gyakran tesztelés segítségével lehet kideríteni. Speciális tesztlekérdezések készítése, amelyek gyorsan tisztázzák a rendszer működésének az aktuális feladat szempontjából legfontosabb szempontját, sok esetben nem triviálisnak bizonyul. Hogyan kerüljük el az IPS-sel végzett munka során felmerülő problémákat, megvitatjuk. Az előadást illusztráló példaként a széles körben ismert internetes keresőmotorokat vesszük figyelembe.