Mi az

A DuckDuckGo egy meglehetősen jól ismert nyílt forráskódú keresőmotor. forráskód. A szerverek az Egyesült Államokban találhatók. A kereső a saját robotja mellett más források eredményeit is felhasználja: Yahoo, Bing, Wikipedia.

A jobb

A DuckDuckGo a végső adatvédelmi és adatvédelmi keresőként pozicionálja magát. A rendszer nem gyűjt adatot a felhasználóról, nem tárol naplókat (nincs keresési előzmény), használat sütiket maximálisan korlátozott.

A DuckDuckGo nem gyűjt és nem oszt meg személyes adatokat a felhasználóktól. Ez az adatvédelmi szabályzatunk.

Gabriel Weinberg, a DuckDuckGo alapítója

Miért van szüksége erre

Minden nagyobb keresőmotor megpróbálja személyre szabni a keresési eredményeket a monitor előtt álló személy adatai alapján. Ezt a jelenséget "szűrőbuboréknak" nevezik: a felhasználó csak azokat az eredményeket látja, amelyek összhangban vannak a preferenciáival, vagy amelyeket a rendszer annak tekint.

Objektív képet alkot, amely nem függ az Ön korábbi internetes viselkedésétől, és kiküszöböli a tematikát google hirdetésekés a "Yandex", az Ön kérései alapján. A DuckDuckGo segítségével könnyen lehet idegen nyelvű információkat keresni, míg a Google és a Yandex alapértelmezés szerint az orosz nyelvű oldalakat részesíti előnyben, még akkor is, ha a lekérdezést más nyelven adják meg.


Mi az

A not Evil egy olyan rendszer, amely a névtelen Tor hálózatot keresi. A használatához ehhez a hálózathoz kell lépnie, például egy speciális .

A not Evil nem az egyetlen keresőmotor a maga nemében. Van LOOK (alapértelmezett keresés a Tor böngészőben, elérhető a normál internetről) vagy TORCH (az egyik legrégebbi kereső a Tor hálózaton) és mások. A Google-re való félreismerhetetlen utalás miatt döntöttünk a not Evil mellett (nézd csak meg a kezdőlapot).

A jobb

Azt keresi, ahol elvileg megtagadják a hozzáférést a Google, a Yandex és más keresők számára.

Miért van szüksége erre

A Tor hálózaton számos olyan forrás található, amelyek nem találhatók meg a törvénytisztelő interneten. Számuk pedig növekedni fog, ahogy a hatóságok ellenőrzése szigorodik a web tartalmai felett. A Tor egyfajta hálózat a weben, közösségi hálózataival, torrentkövetőivel, médiájával, kereskedési platformok, blogok, könyvtárak és így tovább.

3. YaCy

Mi az

A YaCy egy decentralizált keresőmotor, amely a P2P hálózatok elvén működik. Minden számítógépnek van elsődleges szoftver modul, önmagában szkenneli az internetet, vagyis egy keresőrobot analógja. A kapott eredményeket egy közös adatbázisba gyűjtik, amelyet a YaCy összes résztvevője használ.

A jobb

Itt nehéz megmondani, hogy ez jobb vagy rosszabb, mivel a YaCy teljesen más megközelítés a keresés megszervezéséhez. Az egyetlen szerver és tulajdonos cég hiánya az eredményeket teljesen függetlenné teszi bárki preferenciáitól. Az egyes csomópontok autonómiája kizárja a cenzúrát. A YaCy képes keresni a mélyweben és a nem indexelt nyilvános hálózatokon.

Miért van szüksége erre

Ha nyílt forráskódú támogató és ingyenes internet, amelyet nem befolyásolnak a kormányzati szervek és a nagyvállalatok, akkor a YaCy az Ön választása. Használható vállalati vagy más autonóm hálózaton belüli keresések szervezésére is. És bár a YaCy nem túl hasznos a mindennapokban, a keresési folyamat szempontjából méltó alternatívája a Google-nek.

4. Pipl

Mi az

A Pipl egy olyan rendszer, amelyet arra terveztek, hogy információkat keressen egy adott személyről.

A jobb

A Pipl szerzői azt állítják, hogy speciális algoritmusaik hatékonyabban keresnek, mint a "szokásos" keresők. Különösen a profilok kapnak prioritást közösségi hálózatok, megjegyzések, résztvevők listái és különféle adatbázisok, ahol emberekről információkat tesznek közzé, például bírósági határozatok adatbázisai. Pipl vezető szerepét ezen a területen a Lifehacker.com, a TechCrunch és más kiadványok is megerősítik.

Miért van szüksége erre

Ha információt kell találnia egy USA-ban élő személyről, akkor a Pipl sokkal hatékonyabb lesz, mint a Google. Az orosz bíróságok adatbázisai nyilvánvalóan nem érhetők el a kereső számára. Ezért nem birkózik meg olyan jól Oroszország polgáraival.

Mi az

A FindSounds egy másik speciális keresőmotor. Nyílt forrásokban keres különféle hangokat: ház, természet, autók, emberek stb. A szolgáltatás nem támogatja az orosz nyelvű kéréseket, de van egy lenyűgöző lista az orosz nyelvű címkékről, amelyeket kereshet.

A jobb

Csak hangok kiadásában, semmi több. A beállításokban beállíthatja a kívánt formátumot és hangminőséget. Minden talált hang letölthető. Van mintakeresés.

Miért van szüksége erre

Ha gyorsan meg kell találnia egy muskétalövés hangját, egy szívó harkály ütését vagy Homer Simpson kiáltását, akkor ez a szolgáltatás az Ön számára készült. És ezt csak a rendelkezésre álló orosz nyelvű lekérdezések közül választottuk. A angol nyelv a spektrum még szélesebb.

Komolyan, egy speciális szolgáltatás speciális közönséget jelent. De neked is jól jön?

Mi az

A Wolfram|Alpha egy számítástechnikai keresőmotor. A kulcsszavakat tartalmazó cikkekre mutató hivatkozások helyett kész választ ad a felhasználó kérdésére. Ha például beírja a keresőmezőbe, hogy "hasonlítsa össze New York és San Francisco lakosságát" angolul, akkor a Wolfram|Alpha azonnal megjeleníti az összehasonlítást tartalmazó táblázatokat és grafikonokat.

A jobb

Ez a szolgáltatás jobb, mint mások a tények megtalálásához és az adatok kiszámításához. A Wolfram|Alpha felhalmozza és rendszerezi a weben elérhető tudást különböző területeken beleértve a tudományt, a kultúrát és a szórakozást. Ha ez az adatbázis kész választ tartalmaz egy keresési lekérdezésre, akkor a rendszer megmutatja, ha nem, akkor kiszámítja és megjeleníti az eredményt. Ebben az esetben a felhasználó csak és semmi többet lát.

Miért van szüksége erre

Ha Ön például diák, elemző, újságíró vagy kutató, a Wolfram|Alpha segítségével megkeresheti és kiszámíthatja a tevékenységeivel kapcsolatos adatokat. A szolgáltatás nem ért minden kérést, de folyamatosan fejlődik és okosabbá válik.

Mi az

A Dogpile metakereső motor a keresőmotorok eredményeinek kombinált listáját jeleníti meg. Google SERPs, Yahoo és más népszerű rendszerek.

A jobb

Először is, a Dogpile kevesebb hirdetést jelenít meg. Másodszor, a szolgáltatás egy speciális algoritmust használ a kereséshez és megjelenítéshez legjobb pontszámok különböző keresőmotorokból. A Dogpile fejlesztői szerint az ő rendszerük generálja a legteljesebb problémát az egész Interneten.

Miért van szüksége erre

Ha nem talál információt a Google-ban vagy más szabványos keresőben, keresse meg egyszerre több keresőben a Dogpile segítségével.

Mi az

A BoardReader egy szöveges keresőrendszer fórumok, kérdezz-felelek szolgáltatások és más közösségek számára.

A jobb

A szolgáltatás lehetővé teszi a keresési mező szűkítését a közösségi oldalakra. A speciális szűrőknek köszönhetően gyorsan megtalálhatja a kritériumainak megfelelő bejegyzéseket és megjegyzéseket: nyelv, közzététel dátuma és webhely neve.

Miért van szüksége erre

A BoardReader hasznos lehet PR-szakemberek és más médiaszakemberek számára, akik érdeklődnek a tömegmédia véleményére bizonyos kérdésekben.

Végül

Az alternatív keresőmotorok élete gyakran röpke. A Lifehacker a Yandex cég ukrán fióktelepének korábbi vezérigazgatóját, Sergey Petrenko-t kérdezte az ilyen projektek hosszú távú kilátásairól.


Szergej Petrenko

A Yandex.Ukrajna korábbi vezérigazgatója.

Ami az alternatív keresőmotorok sorsát illeti, egyszerű: nagyon niche-projekteknek lenni kis közönséggel, tehát egyértelmű kereskedelmi kilátások nélkül, vagy éppen ellenkezőleg, hiányuk teljes egyértelműségével.

Ha megnézzük a cikkben szereplő példákat, láthatjuk, hogy az ilyen keresők vagy egy szűk, de keresett résre specializálódtak, ami talán csak eddig nem nőtt annyira, hogy észrevehető legyen a Google vagy a Yandex radarjain, vagy egy eredeti hipotézist tesztelnek a rangsorolás során, amely a hagyományos keresésben még nem alkalmazható.

Például, ha egy Tor-keresés hirtelen keresettnek bizonyul, vagyis a Google-közönség legalább egy százalékának szüksége lesz az eredményekre onnan, akkor természetesen a hétköznapi keresőmotorok elkezdik megoldani azt a problémát, hogy hogyan megtalálni és megmutatni a felhasználónak. Ha a közönség viselkedése azt mutatja, hogy a felhasználók jelentős része jelentős számú lekérdezésben relevánsabb eredményeket, adatokat kap a felhasználótól függő tényezők figyelembevétele nélkül, akkor a Yandex vagy a Google elkezd ilyen eredményeket adni.

A „jobbnak lenni” e cikkben nem azt jelenti, hogy „mindenben jobbnak lenni”. Igen, hőseink sok szempontból távol állnak a Yandextől (még a Bingtől is). De ezek a szolgáltatások mindegyike olyasmit ad a felhasználónak, amit a keresőipar óriásai nem tudnak kínálni. Biztosan Ön is ismer hasonló projekteket. Oszd meg velünk – beszéljük meg.

SZAKMAI INFORMÁCIÓKERESÉS AZ INTERNETEN

Az internetes keresés az internetes munka fontos eleme. A modern internet webes forrásainak pontos számát aligha tudja biztosan valaki. A számla mindenesetre milliárdokba rúg. Ahhoz, hogy az adott pillanatban szükséges információkat fel tudd használni, akár üzleti, akár szórakozási célból, először meg kell találnod az erőforrások e folyamatosan feltöltődő óceánjában.

A sikeres internetes kereséshez két feltételnek kell teljesülnie: a lekérdezéseket jól kell megfogalmazni, és megfelelő helyeken kell rákérdezni. Más szóval, a felhasználónak egyrészt meg kell tudnia fordítani a keresési érdeklődését a nyelvre keresési lekérdezés, másrészt a keresők, a rendelkezésre álló keresőeszközök, azok előnyeinek és hátrányainak alapos ismerete, amely lehetővé teszi, hogy minden konkrét esetben a legmegfelelőbb keresőeszközöket válassza ki.

Jelenleg nincs egyetlen olyan erőforrás, amely megfelelne az internetes keresés minden követelményének. Ezért a keresés komoly megközelítésével elkerülhetetlenül különböző eszközöket kell használnia, mindegyiket a legmegfelelőbb esetben használja.

internetes keresőeszközöka következő fő csoportokra osztható:

kereső motorok;

Web-könyvtárak;

Referencia források;

Helyi programok az interneten való kereséshez.

A legnépszerűbb kereső azkereső motorok- az úgynevezett internetes keresőmotorok (Search Engines). Világviszonylatban az első három vezető pozíció meglehetősen stabil – ezek a Google, a Yahoo! és Bing. Sok ország felveszi saját, helyi tartalomra optimalizált keresőmotorját erre a listára. Segítségükkel elméletileg sok millió oldal oldalain találhat bármilyen konkrét szót. A felhasználó szempontjából a keresők legfőbb hátránya az elkerülhetetlen jelenlétinformációs zajaz eredményekben. Így szokás hívni azokat a találatokat, amelyek ilyen vagy olyan okból bekerülnek a lekérdezésnek nem megfelelő találatok listájába.

A sok különbség ellenére minden internetes kereső hasonló elven működik, és műszaki szempontból hasonló alrendszerekből áll. A keresőmotor első szerkezeti része - speciális programok, az automatikus kereséshez és a weboldalak későbbi indexeléséhez használatos. Az ilyen programokat általában pókoknak vagy botoknak nevezik. Megnézik a weboldalak kódját, megtalálják a rajtuk található hivatkozásokat, és ezáltal új weboldalakat fedeznek fel. Vannak még alternatív módon az oldal felvétele az indexbe. Sok keresőmotor kínál lehetőséget az erőforrás-tulajdonosoknak, hogy önállóan vegyenek fel egy webhelyet az adatbázisukhoz. Bárhogy is legyen, a weboldalak letöltése, elemzése és indexelése megtörténik. Ezekben kiemelik a szerkezeti elemeket, megkeresik a kulcsszavakat, meghatározzák azok kapcsolatát más oldalakkal, weboldalakkal. Más műveleteket is végrehajtanak, amelyek eredménye a keresőmotor indexbázisának kialakítása. Ez az alap minden keresőmotor második fő eleme. Jelenleg nincs olyan abszolút teljes index adatbázis, amely az Internet minden tartalmáról információt tartalmazna. Mivel a különböző keresőmotorok különböző weblapkereső programokat használnak, és más-más algoritmusok segítségével építik fel indexüket, a keresőmotorok indexbázisa jelentősen eltérhet. Egyes webhelyeket több kereső is indexel, de mindig csak egy keresőmotor adatbázisában szerepel bizonyos százalékos erőforrás. Az a tény, hogy minden keresőmotornak van egy ilyen eredeti és nem átfedő része az indexnek, lehetővé teszi egy fontos gyakorlati következtetés levonását: ha csak egy keresőmotort használ, még a legnagyobbat is, akkor biztosan elveszíti a hasznos hivatkozások bizonyos százalékát. .

Az internetes kereső következő része a tényleges kereső és válogató program. Ezek a programok két fő feladatot oldanak meg: először megkeresik az adatbázisban a bejövő kérésnek megfelelő oldalakat és fájlokat, majd a kapott adattömböt különböző szempontok szerint rendezik. A keresési célok elérésének sikere nagymértékben függ a munkájuk eredményességétől.

Az internetes kereső utolsó eleme a felhasználói felület. A keresőfelületeknek a minden oldalra jellemző esztétikai és kényelmi követelmény mellett van még egy fontos követelménye: különféle eszközöket kell kínálniuk a lekérdezések összeállításához, finomításához, valamint a találatok rendezéséhez és szűréséhez. A keresők előnyei a kiváló forráslefedettség, az adatbázis tartalmának viszonylag gyors frissítése és egy jó választás további jellemzők.

A keresőmotorokkal való munka fő eszköze a lekérdezés.

Az internetes kereséshez a helyi számítógépre telepített speciális alkalmazásokat is használják. Ezek lehetnek egyszerű programok és meglehetősen összetett adatkereső és -elemző komplexumok is. A legelterjedtebb böngészőbővítmények a böngészőbővítmények, az adott keresőszolgáltatással való együttműködésre tervezett böngészőpanelek és az eredményelemzési képességekkel rendelkező metakereső csomagok.

Webes könyvtárak - ezek olyan források, amelyekben az oldalak tematikus kategóriák szerint vannak elosztva. Ha a felhasználó csak lekérdezéseken keresztül dolgozik a keresőmotorokkal, akkor a katalógus képes a teljes tematikus rész megtekintésére. A második alapvető különbség a katalógusok és az automatikus keresők között az, hogy általában az emberek közvetlenül részt vesznek a tartalomban, akik megtekintik az erőforrásokat, és az oldalt egyik vagy másik kategóriába sorolják. A webes könyvtárakat általában univerzálisra és tematikusra osztják. Univerzális igyekezzen a lehető legtöbb témát lefedni. Bármit megtalálhat bennük: a költészettel foglalkozó oldalaktól a számítógépes forrásokig. Más szóval, náluk van a maximális keresési szélesség. A tematikus címtárak viszont egy bizonyos témára specializálódtak, és az erőforrások lefedettségének csökkentésével a maximális keresési mélységet biztosítják.

A címtárak előnye az erőforrások viszonylag magas minősége, mivel minden egyes webhelyet egy személy néz meg és választ ki. A webhelyek tematikus csoportosítása lehetővé teszi a hasonló témájú webhelyek kényelmes megtalálását. Ez a működési mód arra jó, hogy új oldalakat fedezzen fel Ön számára egy érdekes témában – pontosabb, mint egy kereső használata. Javasoljuk, hogy webes címtárakat használjon bármely témakörrel való első megismerkedéshez, valamint homályos lekérdezések kereséséhez - lehetősége lesz „vándorolni” a címtár szakaszaiban, és pontosabban meghatározni, mire van szüksége.

A webes könyvtárak hátrányai ismertek. Először is, ez az adatbázis lassú feltöltése, mivel egy webhely katalógusba való felvételéhez egy személy részvétele szükséges. Hatékonyság szempontjából a webcímtár nem vetélytársa a keresőmotoroknak. Ráadásul a webes könyvtárak adatbázisméretüket tekintve lényegesen alulmúlják a keresőmotorokat.

Amikor az internetes keresésről beszélünk, nem szabad figyelmen kívül hagyni számos olyan kifejezést, amelyek szorosan kapcsolódnak ehhez a területhez, és gyakran használják a keresőmotorok leírására és értékelésére. Például: szélesség és mélység internetes keresés. A széles körű keresés olyan keresés, amely a lehető legtöbb információforrást rögzíti. Ugyanakkor elegendőnek tekinthető egy adott webhely megemlítése, amely megfelel a lekérdezésnek. A keresési mélység az egyes erőforrások indexelésének és azt követő keresésének részleteire vonatkozik. Például sok keresőmotor különböző megközelítéseket alkalmaz a különböző webhelyek indexelésére. A nagy és népszerű webhelyek maximálisan indexelve vannak, a robotok igyekeznek egyetlen oldalt sem kihagyni egy ilyen erőforrásból. Ugyanakkor más oldalakon csak a főoldal és néhány oldalnyi tartalom indexelhető. Ezek a körülmények természetesen befolyásolják a későbbi keresést. A mélykeresés azon az elven működik, hogy "jobb, ha redundáns információkat tartalmaznak a találatok között, mint kihagyni a keresési témával kapcsolatos adatokat."

Elég gyakran találkozni olyan fogalmakkal, mint pl globális és lokális internetes keresés. A helyi internetes keresés figyelembe veszi a felhasználó földrajzi elhelyezkedését, és előnyben részesíti azokat a találatokat, amelyek valamilyen módon kapcsolódnak egy adott országhoz vagy településhez. A globális keresés figyelmen kívül hagyja ezeket az információkat, és az összes elérhető forrásban keres.

Amikor internetes keresőmotorokban lekérdezést állít össze, különféle módok keresés. A legtöbb internetes gépen megtalálható tipikus keresési módok közé tartozik egyszerű és haladó Keresés. Az egyszerű keresés lehetővé teszi, hogy egy lekérdezésben csak egy keresési funkciót adjon meg. A részletes keresés lehetővé teszi több feltételből lekérdezés létrehozását, logikai operátorokkal összekapcsolva.

Különféle módszereket használnak a keresési lekérdezések finomításához. szűrők . Szűrőknek nevezzük azokat vagy a lekérdezés összeállításának egyéb segédeszközeit, amelyek nem kapcsolódnak a lekérdezési feltételek tartalmi oldalához, hanem valamilyen formális jelre korlátozzák a keresési eredményeket. Így például egy fájltípus-szűrő alkalmazásakor a keresés során a felhasználó nem a kérésének tárgyához kapcsolódó információkat ad meg a rendszernek, hanem egyszerűen a kérésének feltételében meghatározott fájltípusra korlátozza a kapott eredményeket.

A legtöbb felhasználó számára az univerzális keresőmotorok jelentik az internetes keresés fő és gyakran egyetlen eszközét. Jó lefedettséget kínálnak a forrásokról, valamint az alapvető keresési feladatokhoz elegendő eszközkészletet.

Az univerzális keresőmotorok piaca meglehetősen nagy. Megpróbáltuk elemezni a leghíresebb keresőket, az eredményeket az 1. táblázat formájában mutatjuk be.

Az univerzális kereső kiválasztásakor fontos szerepet játszik a segítségével megtalált források minősége. A „jelölő módszer” segítségével meghatározhatja az előnyben részesített keresőmotort bizonyos feladatokhoz. Lényege abban rejlik, hogy először egy bizonyos tematikus keresési lekérdezést állítanak össze, majd egy csoportot - ezen a területen szakértőket - megkérdeznek, hogy megtalálják a véleményük szerint legjobb internetes forrásokat a kiválasztott témában. A felmérés adatai alapján összeáll azon jelölőhelyek listája, amelyek garantáltan relevánsak a lekérdezés szempontjából, és jó minőségű információkat tartalmaznak. Ezután a kérés elküldésre kerül a tesztelt keresőmotoroknak. Az értékelési logika egyszerű: minél magasabban helyezkednek el a jelölőhelyek a keresési eredmények között, annál jobban alkalmas egy adott erőforrás egy teszttémával kapcsolatos információ megtalálására.



Beszéljünk arról, ami a mi időnkben van információs technológiák valamint az egyén és a társadalom számára elérhető adatmennyiség végtelen növekedése, sok probléma van az információk feldolgozásával és keresésével – ez már istenkáromlás. Aki csak nem veti fel ezt a témát. És hogy ne terheljem Önt a különböző információforrásokból szubjektív és részben objektív ítéletekkel a problémával kapcsolatban, közvetlenül a megoldására fogok rátérni. Beszéljünk ma a keresésről. Vagyis olyan programokról, komoly információs rendszerekről, amelyek a számunkra szükséges dokumentumokat, adatokat keresik.

Frissítse a "közvetlen keresést"

Nem is olyan régen, amikor még nagyok voltak a fák, és még az információ is benne volt helyi hálózat nem volt olyan sok vállalkozás, minden keresést néhány elérhető fájl banális felsorolásával, nevük és tartalmuk következetes ellenőrzésével végeztek. Az ilyen keresést direktnek nevezzük, és a közvetlen keresési technológiát használó programok (segédprogramok) hagyományosan mindenben jelen vannak operációs rendszerés szerszámcsomagokat. De még a modern számítógépek ereje sem elegendő a gigantikus adatmennyiségben történő gyors és megfelelő kereséshez a közvetlen keresés során. A lemezen lévő párszáz dokumentumban és egy hatalmas könyvtárban és több tucat postafiókban két különböző dolog. Ezért a közvetlen keresőprogramok ma egyértelműen háttérbe szorulnak – ha már univerzális eszközökről beszélünk.

Természetesen a vállalati szektorban az ilyen típusú keresésekre már régóta nem volt kereslet. A kötetek nem egyformák. Ezért hosszú évek óta, és mostanában egyértelműen olyan technológiák, amelyek képesek a dokumentumok gyors és pontos keresését végrehajtani. különféle formátumokés különböző forrásokból, több mint releváns. Nem is olyan régen a Microsoft „atyja”, Bill Gates, láthatóan irigyelve a Google internetes keresőmotor fenomenális sikerét, az egyik sajtótájékoztatón bejelentette, hogy a szoftver (már és nem csak) minden lehetséges módon népszerűsíteni kívánja. , keresőmotorok és technológiák létrehozásának fejlesztése és elmélyítése. De még túl korai, hogy bármilyen fenomenálisan működő Microsoft programot vagy egy versenyképes internetes szervert létrehozzanak (az MSN még mindig elmarad a Google-tól). Ezért a meglévő fejlesztések felé fordulunk. Index, lekérdezés, relevancia

A magban modern technológiák két alapvető folyamat van. Először is a rendelkezésre álló információk indexelése és a kérés feldolgozása, majd az eredmények kiadása. Ami az elsőt illeti, minden program (legyen az asztali kereső, vállalati információs rendszer vagy internetes kereső) létrehozza a saját keresőterületét. Vagyis dokumentumokat dolgoz fel, és ezekből indexet képez (egy szervezett struktúra, amely a feldolgozott adatokról tartalmaz információkat). A jövőben a létrehozott indexet használják a munkához - gyorsan megszerezve a szükséges dokumentumok listáját a kérésnek megfelelően. Továbbá, bár technológiailag korántsem egyszerű, de teljesen érthető hétköznapi felhasználó. A program feldolgozza a kérést (kulcsszó-kifejezés szerint), és megjeleníti azon dokumentumok listáját, amelyek ezt a kulcsszókifejezést tartalmazzák. Mivel az információt egy strukturált index tartalmazza, a lekérdezés feldolgozása sokkal (tízszer és százszor!) gyorsabb, mint a közvetlen keresésnél (a dokumentumkiválasztás nem fájlok felsorolásával, hanem szöveges információk elemzésével történik a index).

A program a talált dokumentumokat a kapott listában jeleníti meg a relevancia szerint - a dokumentum és a lekérdezés szövegének megfelelősége szerint. A különféle technológiákban természetesen vannak különféle módszerek a dokumentum relevanciájának keresése és meghatározása (a szó "előfordulásának" száma és említésének gyakorisága a dokumentumban, ezen paraméterek aránya a dokumentumban lévő szavak teljes számához, a lekérdezés szavai közötti távolság kifejezést a keresett fájlokban, és így tovább). Ezen paraméterek alapján kerül meghatározásra a dokumentum "súlya", és ettől függően egy vagy másik fájl megjelenik a találati listában egy bizonyos helyen. Az internetes keresés esetében még bonyolultabb a helyzet. Valóban, ebben az esetben sok más tényezőt is figyelembe kell venni (erre a Page Rank Google példa). De ez egy külön cikk témája, ezért nem fogunk hozzányúlni az Internethez.. A keresőmotorok áttekintése

Ez a cikk több lehetőségét tárgyalja népszerű programok keresés, amely tisztességes sebességgel és jó funkcionalitással büszkélkedhet. De egy szórólapon mutatkozni, egy szakértő tekintetével szemben állni, egészen más. És nem volt se sok, se nem kevés szakértő, szerelmesek teli iroda, akik a szoftvereken bütykölték a használhatóságát. A teszt számítógépen (Athlon 2,2 MHz, a véletlen hozzáférésű memória 1 GB, 160 GB Seagate 7200 rpm IDE merevlemez és Windows rendszer XP) egy sor program lett telepítve: dtSearch Desktop, Snoop Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. A tesztekhez a dokumentumok szöveges bázisát doc, txt és html formátumban állították össze, összesen nem több, nem kevesebb, hanem 20 gigabájt. Elvtársak egy csoportja, az Ön alázatos szolgájának irányítása alatt, tesztelte, összehasonlította és megosztotta szubjektív benyomásait az egyes szoftverekkel kapcsolatban. Olvassa el az alábbiakban az eredmények összefoglalását. dtSearchDesktop

Egy program, amely a fejlesztők szerint a leggyorsabb, legkényelmesebb és legjobb keresőmotornak vallja magát. Mint általában, és ennek az áttekintésnek a többi része is. A dtSearch felülete meglehetősen egyszerű, de egyes ablakok vagy lapok túlterheltek elemekkel, ami azt a benyomást kelti, hogy nehezen használható. De valójában nincsenek különösebb nehézségek. Az egyetlen igazán kellemetlen pillanat az orosz nyelvű szoftver támogatásának hiánya (annak ellenére, hogy a program több nyelven is képes dokumentumokat keresni, felülete kizárólag angol).

A dtSearch azonban azon kevés programok egyike, amely képes a weboldalakat a felhasználó által megadott "mélységig" indexelni (a dtSearch Spider kiegészítő készletben található "további vásárlást" figyelembe véve azonban). Ez amellett, hogy támogatja a fájlokat a különböző lemezeken szöveges formátumokés e-mailjeit postafiók kilátások. Ugyanakkor a program nem tudja, hogyan kell dolgozni az adatbázisokkal, amelyek a bennük található nagy mennyiségű információ, valamint a vállalatokon belüli, így a vállalati hálózatokban való széleskörű elterjedtségük miatt olyan ízletes falat a keresőknek. A dtSearch dokumentumok indexelési sebessége megfelelő volt. A jövőre nézve azt mondom, hogy ez a program megbirkózott azzal, hogy egy adott mennyiségű információt indexelt egy másik versenyzővel - az iSYS-sel -, és megosztotta vele a második helyet a legjobbak listáján. gyors rendszerek. Teszteljen 20 gigabájtnyi információt a dtSearch indexelve 6 óra 13 perc alatt, létrehozva egy 7,9 GB-os indexet a későbbi keresések igényeihez.

Ami a keresési lehetőségeket illeti, itt a célnak megfelelnek. Először is, a dtSearch rendelkezik morfológiai kereséssel (egy szó keresése annak minden morfológiai alakjában). Ezzel a lehetőséggel felszabadulsz mondjuk az olyan gondolatoktól, hogy "milyen esetben használtak egy bizonyos szót abban a dokumentumban, amelyre szükségem van?". A morfológiai keresés alkalmazása szinte mindig indokolt, ezért minden professzionális keresőben jelen kell lennie.

A hangkeresés nem szabványos funkció még a professzionális keresők számára is. Lényege abban rejlik, hogy a program olyan szavakat keres, amelyek hangzása megegyezik a beírt szóval. És a legjobb az egészben, hogy ez a funkció az orosz nyelven is működik! Például, ha beírja a „fül” szót egy keresési lekérdezésbe, akkor nem csak a „fül”, hanem a „fül” szó is megjelenik.

A hibajavító keresés nagyon fontos funkció. Szintaktikai hibákat tartalmazó szavak keresésére szolgál - ezek lehetnek például elírások vagy hibák a karakterfelismerő rendszerekkel nyert dokumentumokban. Egy egyszerű példa, hogy a billentyűzet szót keresed. Néhány dokumentum tartalmazza a "billentyűzet" szót, nyilvánvaló, hogy ez a szó "billentyűzet", csak egy személy gépel gépelés közben. Most, a hibajavító kereséssel, ez észleli és az eredménybe belefoglalja a „billentyűzet” szót tartalmazó dokumentumot. A dtSearch-ben is van egy beállítás, amely lehetővé teszi a lehetséges hibás karakterek mértékének meghatározását.

Keresés szinonimák használatával. Ez a funkció a különböző szavak szinonimák listáját használja. Így például a „gyors” szó beírásával a program megtalálja a „nagysebességű” szavakat és a „gyors” szó szinonimáját is, ha vannak ilyenek a szinonimák listájában. . A dtSearch program nem tartalmazza a kész szinonimák listáját, de lehetőség van a listák internetes használatára (ennek megfelelően kapcsolat szükséges, ami nem mindig kényelmes), vagy létrehozhat saját listát szinonimák.

A felsorolt ​​szolgáltatások mellett a dtSearch logikai műveletekkel összekapcsolt szavakból álló kifejezésekkel is kereshet. A lekérdezésben minden szóhoz hozzá lehet rendelni a saját "súlyát", vagyis a jelentőségét. Hasznos lehetőség egy jelentéktelen szavakból álló szótár használata, hogy ne vegyük figyelembe őket a keresés során, de ez a szótár is üres, és Önnek kell kitöltenie.

Ezután vegye figyelembe a program lehetőségeit, amikor a hálózaton dolgozik. Valójában a dtSearch nem kínál semmilyen konkrét hálózati lehetőséget. A hálózaton azonban teljesen lehetséges. Alternatív megoldásként létrehozhat néhány indexet, és elhelyezheti egy nyilvános (megosztott) mappába. Maga a program minden felhasználó számára telepíthető a számítógépre, vagy elhelyezhető egy erre nyitott mappába is nyilvános hozzáférés, és minden felhasználó számára külön-külön, parancssori paraméterek segítségével hozzon létre parancsikonokat, amelyek célját a programhoz mellékelt súgófájl írja le. Emellett van lehetőség automatikus telepítés programokat a hálózatra egy MSI fájl segítségével. Ez figyelembe veszi az egyes csatlakoztatott felhasználók beállításait.

Általában - egy jó program a professzionális keresőmotorok kategóriájából. Jó minősítést kaphat, azonban a felhasználók bizalmának és tiszteletének elnyerése több tényező miatt is nehéz lehet a dtSearch számára (nem minden zökkenőmentes a felülettel, az orosz felhasználók meg vannak fosztva, nincsenek fényes funkciók a hálózattal való együttműködéshez) . Ami a dokumentumok közvetlen keresését illeti, a programnak nem volt orosz szövegű átfedése. Ahogy a deklarált morfológiával vagy fuzzy kereséssel sem volt ilyen. A rendszer eléggé megtalálta a szükséges dokumentumokat mind egy szóban megfogalmazott egyszerű kéréssel, mind néhány bekezdéssel vagy bármilyen dokumentummal kulcsmondatként.

Hivatalos oldal:
Terjesztési méret: 23 MbSnoop Prof Deluxe

A név alapján sejtheti, hogy ebben a programban van támogatás az orosz nyelvhez. Ez már szép. Ami a felületet illeti, általában kissé szokatlan, de nagyon vonzó megjelenésű. A másik dolog a kényelem. Nagyon vitatott kritérium, de valószínűleg a többablakos megoldás nem a legjobb megoldás (a kérést az egyik ablakban írják be, az eredményt egy másikban jelenítik meg stb.).

A Bloodhound továbbra is ugyanazokat az indexeket használja a gyors keresésekhez, de az indexelés sokkal lassabb, mint más programok. Ez nagyon furcsa, különösen, ha figyelembe vesszük, hogy a keresési lekérdezések feldolgozási képessége nagyon gyenge, ami azt jelenti, hogy az index szerkezete nem bonyolult. Valószínűleg itt a nem optimalizált algoritmusokban van a lényeg. Ez a program egyértelműen kívülállónak bizonyult az indexelés és a keresési sebesség terén: az index létrehozására fordított idő hatszor hosszabb, mint ugyanazon dtSearch és iSYS esetében. 20 gigabájtnyi szöveg indexelése egy vérebre 38 óra 46 percnyi munkát eredményezett. És a létrehozott "keresési terület" ugyanolyan méretet foglalt el a merevlemezen, mint az eredeti adatok, kis mínusz - 19 gigabájttal.

Alternatívaként a Bloodhound is bemutatható szabványos keresés Windowson ennél többet aligha tud. Azt a tényt, hogy a Bloodhound elsődleges feladata a fájlok legegyszerűbb keresése, nemcsak a keresési lekérdezések szövegét elemző kis számú funkció és a fájlattribútumok szerinti részletes keresés jelzi, hanem még egy eredményablak is, amely közvetlen hivatkozásokat ad a talált fájlokat, valamint az ezeket a fájlokat tartalmazó mappákat. A találati ablak abból a szempontból nem túl informatív, hogy a teljes talált fájlt csak futtatásával tudja elolvasni, vagyis nincs beépített fájlnézegetője. De adunk egy kivonatot a fájlból, ahol a keresett szót megtalálták, általában egy ilyen megjelenítési séma nagyon emlékeztet az internetes keresőmotorokra.

A keresési lekérdezések feldolgozásának konkrét lehetőségeiről szólva érdemes megjegyezni, hogy nincs olyan, hogy "szöveg keresése", maximum egy kifejezés kereshető, már csak azért is, mert nincs többsoros szövegbeviteli mező. A beírt kifejezést azonban elemezheti is, és a Bloodhound itt kínál egy szabványos keresési készletet: logikai műveletek, keresés maszk és idézet keresés ... nem sok. A morfológiai keresésnek van néhány alapeleme a programban, de valószínűleg annyira nyers, hogy inkább zavarja a helyes munkát (a tesztek során nagyon sok átfedés volt észrevehető a hibás morfológia használatával).

De a program lehetővé teszi, hogy kereséskor fájlattribútumokat (dokumentum dátum, fájlnév, mappanév) adjunk meg, és ezekben a lekérdezésekben is használhatjuk ugyanazt a keresőkészletet. Emellett a paraméterek megadásával is kereshet üzeneteket (Feladó, Tárgy... stb.).

Szóval, kitaláltuk magát a keresést, mi érdekes még a programban, amiért a hivatalos honlap információi szerint annyi díjat kapott? Nehéz megmondani, mi olyan különleges benne, nagy valószínűséggel a Bloodhound felülete önmagának kedvez (csak külsőleg, a használhatóságról nem is beszélve).

Az indexekkel végzett műveletek nagyon szabványosak, a szép dolog az indexek ütemezett frissítése. Ezenkívül az indexek online is használhatók. Mostantól konkrétabbnak kell lennünk.

A keresési lekérdezések primitívsége ellenére a programmal fájlok keresésére is lehetőség nyílik, így használata hálózatokban is indokolható. Bár nagy húzással, hiszen egy nagy hálózatban a nagy információmennyiség miatt az összetett keresési lekérdezések segítségével a gyors adatkeresés a prioritás - és egyértelműen a keresés és a program sebességével vannak gondok. Azt kell mondanom, hogy a Bloodhound hálózatával végzett munka úgy van átgondolva, ahogy kell. Egy külön alkalmazás kifejezetten erre készült - Bloodhound Server. Ugyanúgy működik, mint a Bloodhound (egy keresőmotorjuk van), csak a központi szerveren vagy a megosztott erőforrásokon tárolt dokumentumoknál. vállalati hálózat. A Bloodhound Server új indexeket hoz létre a megosztott erőforrásokon, vagy használja a korábban létrehozott indexeket. A vállalati hálózat bármely felhasználója csatlakozhat a Bloodhound szerverhez, és bármely (az aktuális indexben található) dokumentumhoz hozzáférhet egy internetböngésző segítségével. Egyetért, egy ilyen séma rendkívül kényelmes: kiderül, hogy a saját hálózatán lévő fájlok ugyanúgy kereshetők, mint az interneten található információk, például a Google-on keresztül.

A program összes előnyét és hátrányát értékelve a következtetés azt sugallja, hogy a vállalati hálózatok számára a képességei valószínűleg nem lesznek elegendőek (a hálózattal végzett munka jó megszervezése ellenére), hanem otthoni számítógéphez vagy akár otthoni hálózathoz, elvileg belefér. Bár sem a munka sebessége, sem a keresési lehetőségek nem keltenek optimizmust...

Hivatalos oldal oroszul:
Terjesztési mérete: 6 Mb Google Desktop Search + GDS Enterprise

Természetesen egy ilyen kiváló fejlesztőt sem hagyhattunk figyelmen kívül. A Google név már sokat beszél. Azok az emberek, akik évek óta használják a legerősebb internetes keresőt, valószínűleg minden kétség nélkül úgy döntenek, hogy ezt a keresőt telepítik számítógépükre. Mintha azt gondolná: Google az otthoni számítógépén! Azonban anélkül, hogy engednénk egy széles körben népszerűsített márka provokációinak, próbáljuk meg józanul, és ami a legfontosabb objektíven mérlegelni a Google „asztali” keresőjének lehetőségeit.

Az első dolog, ami felkelti a szemét, az a saját shell hiánya a programhoz. A Google Desktop Search továbbra is a böngészőablakban van, illetve az asztali verzió teljes felülete a régebbi internetes testvér szoftveréhez került. Hogy ez jó vagy rossz, az egy vitatható kérdés: valaki szereti a keresőmotor minimalizmusát, valaki pedig egy teljes értékű alkalmazást szeretne látni, tele mindenféle gombbal és így tovább.

Mi vonzza meg a szemet közvetlenül a tervezés után? És az a tény, hogy ez a Google Desktop Search mindent elkezd indexelni a számítógépen, anélkül, hogy erre bármiféle igény lenne! És ami a legérdekesebb, lehetetlen indexelési útvonalakat választani a Google Desktop Search segítségével. Le kell töltenie egy külön programot (TweakGDS), amely lehetővé teszi a kis bővítést google beállítások Asztal, beleértve az indexeléshez szükséges helyek megadását. Bár, amíg kitalálja az egészet, már a szabványos merevlemezt indexeli, így erre a beállításra nagyobb adatmennyiség esetén van szükség, ami nagyon fontos vállalati hálózatokban való használat esetén (Enterprise verzió). Azonban nem tény, hogy a TweakGDS letöltése után a problémáid megoldódnak. Végül is Microsoft kell hozzá. NET Frameworkés Microsoft Scripting Runtime. Igen... a telepítést és a beállításokhoz való hozzáférést is meg lehetett volna könnyíteni, bár valószínűleg a fejlesztők is megértik: minek újat írni, ha már van egy kész kereső, portolta helyi számítógépés hagyja, hogy a felhasználó "élvezze", és a jól ismert név csináljon "ebből" egy újabb remeket. Gyerünk, fejezzük be ezt a lírai kitérőt, és folytassuk a keresést.

Ami a keresési lekérdezések elemzését és az eredmények kiadását illeti, itt minden teljesen megegyezik a Google-lel az interneten: ugyanaz a rendszer az eredmények megjelenítésére, ugyanaz a szabványos logikai műveletkészlet a keresési lekérdezésekhez. Általában a Google Desktop Search, mint pl előző program, kizárólag fájlok keresésére készült – természetesen ezekhez a fájlokhoz nincs belső megjelenítő. A Google Desktop Search által támogatott fájlformátumok száma bőven elegendő, és az is jó, hogy a meglátogatott internetes oldalakon keres a gyorsítótárból adatokat véve. A keresési és indexelési sebesség meglehetősen elfogadható. Igaz, otthoni használatra. A lenyűgöző, 20 gigabájtnyi szöveggel a Google Desktop Search 8 óra 17 perc alatt sikerült. Töltsön el néhány napot egy nagyvállalat vállalati hálózatából származó információk feldolgozásával, nem mosolyog egyetlen rendszergazdára sem. A pozitív oldal: a létrehozott index mérete szinten (4,5 GB) bizonyult egy másik, ebben a felülvizsgálatban tesztelt keresőmotorral - SearchInform.

A Google Desktop Search nagy előnye (vagy hiánya – döntse el Ön), hogy támogatja azokat a beépülő modulokat, amelyek sokat változtathatnak. A másik dolog az, hogy a bővítmények csatlakoztatása és konfigurálása annyira megnehezíti a keresőmotor telepítésének feladatát, hogy elkezd tűnődni, vajon szükség van-e erre, amikor telepíthet egy normál, teljes értékű programot, amelyben már minden jelen lesz. Végül is az egyes funkciók használatához új beépülő modult kell telepítenie. Még ahhoz is, hogy a program teljes mértékben működjön az archívumokkal, külön krémre van szükség. Elbűvöli és elcsábítja az összes ilyen kiegészítő modul ingyenességét. Ha azonban nem veszi figyelembe a keresőmotor asztali verzióját, akkor előfordulhat, hogy a GDS Enterprise kompetens beállítása nem tartozik a hatáskörébe – nem hiába ajánlják fel a Google szakemberei szolgáltatásaikat a saját beállításához. szoftver hálózatához mindössze 10 000 dollárért.

Ha ennek ellenére elsajátítja a beállítási és telepítési eljárást (vagy fizet 10 000 dollárt a Google gyors reagálású csapatának), akkor megérti, hogy a telepítés bonyolultságát több mint ellensúlyozza a vállalati hálózatokban használt nagyon rugalmas beállítások. A Google Desktop vállalati hálózatban végzett munkájának fontos szempontja a használat csoportszabályzat, amely lehetővé teszi az egyes felhasználók preferenciáinak beállítását.

Összefoglalva, azt kell mondani, hogy ennek a programnak a legésszerűbb használata otthoni vagy munkahelyi számítógép. Valójában egy normál számítógéphez elegendő csak a programot telepíteni - a többit maga elvégzi (nem is kérdez semmiről).

A Google Desktop Search Enterprise azonban elfogadható lesz olyan esetekben, amikor sürgősen szükség van rugalmas hálózati házirend-beállításokra a keresőmotor használatához, miközben a keresési lekérdezések feldolgozásának képessége a második helyen áll a fontosság és az idő (vagy pénz) szempontjából. a program felállítására költött első helyre kerül.

Hivatalos oldal:
Terjesztési mérete TweakGDS-szel: 1,2 MbCopernic Desktop Search

Kattintson a képre a nagyításhoz

A program felülete rendkívül pozitív érzelmeket vált ki - minden az általánosan elfogadott szabványoknak megfelelően történik, semmi felesleges, egyszóval kellemes design. A kezdők számára nagyon könnyű megérteni a Copernic Desktop Search felületét. Bár kissé zavarba ejtő, hogy a tervezők kifejezetten a program felületét hozták létre, figyelembe véve, hogy a program a szabványos Windows XP témában fog működni. Ha ugyanazt a klasszikus témát használja, a program nem néz ki olyan szép. De ez inkább ízlés dolga.

Az első indításkor a program felajánlja indexek létrehozását a kereséshez. Kicsit szokatlannak tűnt, hogy az indexelésre szánt mappák kiválasztása után a program nem ajánlja fel semmilyen gomb megnyomását, mint például az "Indexelés indítása", miközben az indexelés nem indul el automatikusan, csak ekkor vették észre, hogy a Copernic megpróbálja elindítani az indexelést, amikor a számítógép tétlen. . Kicsit ásni kell a programlehetőségek között, hogy mindent megfelelően beállítson. Meg kell jegyezni, hogy meglehetősen széles testreszabási lehetőségek állnak rendelkezésre. automatikus létrehozás index: beépített ütemező, az indexelés lehetősége a számítógép tétlensége közben, a háttérben, alacsony prioritással. Az indexelés nem volt túl gyors – 10 óra 51 perc –, ez lassabb, mint más keresőkben (kivéve a Bloodhoundot, mégis a Copernic egy nagyságrenddel gyorsabb, mint az iSleuthHound Technologies fejlesztése).

Most az index szerkezetéről. Általában nincs benne semmi különös. Lehetőség van fájltípusok kiválasztására általánosított és részletezett formában egyaránt. Vagyis kezdetben kiválaszthatja, hogy mit szeretne indexelni - Dokumentumok, Képek, Videók, Zene. Az opciók ablakának másik lapján lehetőség lesz bizonyos fájltípusok kiterjesztés szerinti kiválasztására. Ezenkívül az indexet úgy is beállíthatja, hogy például a 16x16-nál kisebb képek ne legyenek indexelve, vagy a 10 másodpercnél rövidebb hangfájlok ne legyenek indexelve. A mappákból származó fájlok indexelése mellett a Copernic képes dolgozni a Microsoft Outlook és a Microsoft Outlook Express címjegyzékéből származó e-mailekkel és névjegyekkel, valamint lehetőség van a Kedvencek és az előzmények indexelésére az Internet Explorerből.

Ami a keresési képességeket illeti, itt nagyon gyengék. A tesztek során még az is kiderült, hogy a program nem keres oroszul txt és html formátumú dokumentumokat, így csak címsorok alapján lehet megtalálni, tartalom szerint semmiképpen. Az egyetlen dolog, amit a program a keresés hatékonyságának javítására biztosít, az a használata standard készlet logikai műveleteket, és már akkor is kísérletileg fedezték fel ezt a lehetőséget, mivel nem dokumentálták. Mellesleg a program segítsége sincs rendben - csak az interneten keresztül érhető el, ami, látod, nagyon kényelmetlen, és nincs túl sok súgó információ a hálózaton. Nyilvánvalóan a fejlesztők úgy döntöttek, hogy a program egyszerű felülete nem jelenti a normál segítség jelenlétét. Folytatva a beszélgetést a keresési lehetőségekről, meg kell jegyezni, hogy a lekérdezések gyenge elemzése ellenére a program érdekes keresőrendszert biztosít - a felhasználó kiválaszthatja a fájlok típusát (képek, videók, zenék stb.), beírhat egy keresési lekérdezés, és válassza ki a kiválasztott fájltípusra jellemző attribútumokat. Például azért hangfájlokat, ezek lehetnek mp3 címkékből származó értékek (előadó, album, dátum stb.), a képeknél például kiválaszthatja a méretüket (felbontás szerint), általában minden típusnak saját beállításai vannak. Egy bizonyos típusú fájl keresése után a program egy igen informatív listát jelenít meg a találati ablakban, és ha a kérésben más típusú fájlok is szerepelnek, akkor azokat egy adott hivatkozásra kattintva nyithatja meg.

Külön érdemes megemlíteni az eredménykijelző ablakot. Ezeknek a fájloknak a tartalma a talált fájlok listája alatt jelenik meg (hasonló sémát gyakran használnak levelezőkliensek). Igaz, a szöveg csak natív formátumban tekinthető meg, és nincs egyszerű szöveges megjelenítési mód, ami nem mindig kényelmes, hiszen egy dokumentum megnyitása ilyenkor több időt vesz igénybe. De mivel a Copernic képes képeket és zenéket keresni, lehetőség van ezeknek a multimédiás fájloknak a megtekintésére.

Ennek a programnak az alapelveit leírtuk, most nézzük meg, mit tud nekünk ajánlani a Copernic Desktop Search a hálózattal való együttműködéshez... Elvileg nagyon sokáig nézheti, de nem valószínű, hogy bármit is lát. Más szóval, ezt a programot nem hálózati programnak tervezték. A Copernic Desktop Search kizárólag otthoni keresőmotor.

Nyilvánvalóan ennek a programnak az egyetlen (leglogikusabb) felhasználása az otthoni számítógép. Itt teljesen megbirkózik a felhasználók összes egyszerű keresési lekérdezésével, amely egy vagy két szóból áll, megtalálja a szükséges információkat, valamint a keresések fájltípusok szerinti elválasztását és a multimédiás fájlok támogatását, valamint a háttérben történő indexelést alacsony prioritású módban. , kellemes felülettel párosítva, csak erőt adnak a programnak ahhoz, hogy bizalmat szerezzen a tapasztalatlan felhasználók körében.

Hivatalos oldal
Terjesztési méret: 2,6 MbISYS asztali számítógép

Kattintson a képre a nagyításhoz

Nagyon erős program. A mindenféle funkcióval ellátott felszereltség szintjét tekintve valahol a listában a következő SearchInform kereső közelében van. Ugyanakkor a telepítőfájl mérete meghaladja a 40 Mb-ot! Nehéz megmondani, mit lehetne ilyen méretekbe beletömni, mert ugyanaz a SearchInform, hasonló funkcionalitással, 15Mb-ot vesz igénybe.

A telepítési folyamat itt sem túl kellemes, vagy inkább még a telepítési folyamat sem. Még a program letöltése előtt is regisztrálni kell, különben semmi. Ezután az interfész. Nagyon szépen van elkészítve, semmi fölöslegesen nem akad meg a szem, azonban ezek egy hozzászokott ember benyomásai. Egy kezdőnek nem lesz könnyű kitalálnia, hol és mi van, hova kell kattintani, és végül hol kereshet. Erősen ajánlott a súgó elolvasása a munka megkezdése előtt – sok ideget és időt takaríthat meg. Minden más mellett az is teljes hiánya Orosz nyelv támogatása a programban. Nem jó. Ráadásul az ablakok itt nincsenek túlterhelve vezérlőkkel, de ez több modulból és további ablakok használatából fakadt. Például a keresési lekérdezéseket egy program futtatásával írják be, az indexeket pedig egy másik program segítségével kezelik. A keresési lekérdezések itt is megjelennek különálló, megjelenő mezőkben. Nehéz megmondani, melyik a jobb - túlterhelt felület vagy mindenütt jelen lévő több ablak, inkább ízlés dolga.

Ami az indexek létrehozását illeti, a program lehetőséget biztosít az új index beállítási folyamatának egyszerűsítésére. Ezek a funkciók számos kész sablonok indexek létrehozásához a Saját dokumentumok, Levelek, Levelek és dokumentumok, Adott mappa, Mappa fájltípusok kiválasztása stb. mappákban. Ezek a sablonok megkönnyítik az indexek létrehozását az első szakaszban. Az indexekkel való munkavégzésre szolgáló segédprogram nem túl jó felülettel rendelkezik, amely elriaszt némi bonyolultságot (ez őszintén szólva nagyon szubjektív értékelés), de ha megnézzük, sok hasznos lehetőséget kínál, és általában a használata nem okoz sok nehézség. Az ISYS Desktop képes különféle adatforrásokból származó adatokat indexelni, és számos rugalmas beállítást biztosít az ilyen indexeléshez. Között további jellemzők indexeléshez: SQL, FTP, TRIM Context, WORLDOX 2002, szkriptek támogatása. Ha index létrehozásakor a "Fájltípusok választásával rendelkező mappa" opciót választotta, lehetősége van manuálisan (kiterjesztés szerint) kiválasztani az indexelendő fájltípusokat. Azt kell mondanunk, hogy egyszerűen rengeteg támogatott fájltípus létezik, de nem lehet saját típust (kiterjesztést) hozzáadni a meglévő listához. Megjegyezheti egy indexelési ütemező jelenlétét is. Az ISYS Desktopnak 6 óra 13 percbe telt egy index létrehozása és 20 gigabájtnyi információ feldolgozása, végül jó időt és a létrehozott fájl méretét - 7,9 GB - mutatta.

Ennek a programnak a keresési lehetőségei nem rosszak. Az ISYS-ben használt program sokkal erősebb, mint a logikai műveletek szokásos támogatása. A speciális keresési lehetőségek közül a program szinonimák használatát, rendezési szűrőt kínál (útvonal, név és a fájl létrehozásának dátuma szerint). A logikai operátorok halmaza valamivel szélesebb, mint a standard halmaz. A logikai műveletek mellett a program lehetővé teszi számos más operátorral való együttműködést, amelyek elvileg helyettesíthetnek bizonyos keresési típusokat, például az elemzéssel végzett keresést teljesen helyettesíthetjük speciális operátorok használatával. Nagyon meglepődtem, hogy a programnak nincs morfológiával történő keresése. Ez komoly hiányosság, mivel a keresés hatékonysága jelentősen javul a morfológiai elemzéssel. Ezen kívül nincs listája a jelentőségteljes szavaknak, de van egy kiterjedt listája a nem jelentős szavaknak. Olyan funkciókat is deklarált a keresésben, mint a "közelítő keresés" és a "heurisztikus elemzés".

Az ISYS többféle keresési lekérdezést kínál, nevezetesen a vizuális lekérdezéseket. Ez különböző típusú ablakokkal történik a keresési lekérdezések bevitelére, azonban valójában egyetlen ablak sem teszi lehetővé a fent felsoroltakon kívüli technológiák használatát.

A keresési eredmények nagyon informatívak, relevancia szerint rendezett dokumentumok listájaként jelennek meg. Az alábbiakban a kiválasztott dokumentum előnézete látható. A Copernic Desktop Search-től eltérően itt az előnézet csak sima szöveg formájában érhető el, nem sikerült elérni a dokumentumok natív formátumban való megjelenítését, legyen szó Word, Html vagy PDF, bár ez elvileg nem túl kritikus. A program lehetővé teszi, hogy a talált dokumentumokat bizonyos kritériumok szerint csoportokra ossza (alapértelmezés szerint relevancia szerint vannak felosztva). A már megtalált dokumentumokat külön mappák kiválasztásával is megtekintheti (ez akkor hasznos, ha az eredmény nagyon sok dokumentumot eredményez).

A program vállalati hálózatban való használata is meglehetősen indokolt, hiszen jó lehetőségeket biztosít a hálózati keresések szervezésére. A keresőrendszer egy nyilvános index létrehozásán alapul, amely nyilvános hálózati erőforrásokból indexelt adatokat tartalmaz.

Valójában az ISYS programja érdemes odafigyelni, legalábbis megismerkedni vele. Ez a program egy kiforrott projekt Hatalmas mennyiségű funkciókat (persze nem mindig és nem mindenkinek, szükség van rájuk, de akkor is). Nem ismert, hogy a program milyen javulást fog elérni a keresési lekérdezések feldolgozása terén, de nem ismert Ebben a pillanatban szinte univerzális használatra ajánlható. És mivel még mindig túl nehéz az otthoni rendszerek számára, a telepítés fő helyei a vállalati hálózatok.

Hivatalos oldal:
Terjesztési mérete: 40 MbSearchInform

Kattintson a képre a nagyításhoz

Valószínűleg nem érdemes rögtön a SearchInform felület leírásával kezdeni. Először is le kell írni a telepítés folyamatát, vagy inkább annak egyik részletét: internetkapcsolat nélkül nem tudod telepíteni a programot. A helyzet az, hogy az első indítás előtt a program felhasználói regisztrációt igényel (ingyenes), és minden megadott adatot elküld a szervernek. Nyilvánvalóan a fejlesztőknek ilyen intézkedéseket kellett tenniük a kalózkodás elleni küzdelemben, de ez nem befolyásolta pozitívan a telepítés egyszerűségét.

A programfelület minden általánosan elfogadott szabálynak megfelelően készült, azonban első pillantásra kissé nehézkes. A programot első alkalommal használva úgy tűnik, hogy túl bonyolult, néha nem könnyű megjegyezni, hogy melyik menüben, lapon található a kívánt lehetőség, azonban hosszabb használat mellett már nem tűnik olyan vészesen bonyolultnak a felület. A lényeg az, hogy először olvassa el a súgót.

Miután egy kicsit foglalkozott a felülettel, elkezdheti az index létrehozását. Maga a folyamat nagyon egyszerű, és az indexelés sebessége, még a szem alapján is, sokkal nagyobb, mint az összes többi keresőmotoré. Az egyértelmű tesztszámok azt mutatják, hogy a SearchInform kétszer olyan gyors, mint a dtSearch és az iSYS indexelési sebességét tekintve! A program rekordidő alatt - 3 óra 17 perc - indexelte a megadott adatokat 20 gigabájt mennyiségben. A létrehozott index mérete pedig a legkisebb 4,4 GB-nak bizonyult - 100 megabájttal kisebb, mint a Google Desktop Search-é.

A program támogatja a szokásos fájlok és mappák mellett az e-mailek indexelését, adatbázisok (!) és egyéb külső források (DMS, CRM) összekapcsolását és indexelését is, indexeléskor azonnal megadhat egy szótárt a morfológiai kereséshez, és minden attribútum indexelt fájlok legyenek. Az index létrehozása után, amikor megpróbálja végrehajtani a dokumentumok első tesztkeresését, némi zavarba ütközhet: "kétféle keresés létezik, de melyikre van szükségem?". Mint korábban említettük, a lényeg az, hogy elolvassa a súgót, akkor minden világossá válik. A program valóban kétféle keresést tud végrehajtani – egy kifejezéskeresést és olyan dokumentumok keresését, amelyek tartalmilag hasonlóak a lekérdezési szöveghez.

A keresési lekérdezés elemzéséhez szükséges összes fő funkció leírása fent volt, így most csak a program által biztosított keresési lehetőségeket soroljuk fel. Kezdjük a kifejezéskereséssel: természetesen morfológiai keresés, idézetkeresés, logikai műveletek, szóelemző keresés (keresés a szó eleje, vége, középrész vagy teljes egyezés alapján), vegyes idézet keresés (amikor a lekérdezésből származó összes szónak jelen kell lennie a dokumentumban, de nem feltétlenül a megadott sorrendben), hibajavító keresések, szinonimák használata, "majdnem idézet keresés" (a beírt kifejezést keresse idézetként, de lehet más szavak a beírt szavak között) stb. A felsorolt ​​opciók némelyike ​​saját specifikus beállításokkal rendelkezik. Ezen kívül lehetőség van jelentéktelen szavak szótárának használatára, és a programban már van egy kész lista ezekről a szavakról, a kereséshez használhatja a kiemelt szavak szótárát is (természetesen ki kell töltenie saját magad).

Itt elvileg röviden átfutottuk a kifejezéskeresés összes főbb jellemzőjét.

Térjünk át a program funkcióinak figyelembevételére - a hasonló dokumentumok keresésére. A fejlesztők azt állítják, hogy ez korántsem egyszerű szöveges keresés, ez pontosan egy "hasonló keresés" - mindenhol így írják le, de oké, hívhatod, ahogy akarod - a lényeg. Rövid internetes kereséssel gyorsan kiderülhet, hogy az úgynevezett "hasonló keresés" új fejlemény a szövegelemzés területén. Ez a rendszer lehetővé teszi a szemantikai tartalom szempontjából hasonló szövegek megtalálását. A legkellemesebb az volt, hogy a próbalekérdezések lebonyolítása után kiderült, hogy az elmélet teljesen összhangban van a gyakorlattal! A program valóban megkeresi a tartalmilag hasonló dokumentumokat, és listában jeleníti meg, hasonlósági százalék szerint rendezve.

Ezután nézzük meg, mit kínál a SearchInform (különösen a SearchInform Corporate vállalati verziója) a vállalati hálózatban végzett munkához. Kétféle alkalmazás létezik: szerveroldali és felhasználói oldal. A szerver rész önállóan dolgozza fel a megadott indexeket, és a felhasználók a hozzájuk rendelt hozzáférési jogosultságtól függően kereshetnek. A felhasználók bejelentkezésekkel automatikusan konfigurálhatók. Windows bejegyzések(mondás szakmai nyelv, a SearchInform Windows NTFS hitelesítést használ) vagy manuálisan (a felhasználókat külön kell hozzáadni). Minden felhasználó számára engedélyezhető vagy megtagadható hozzáférés bizonyos indexekhez, valamint csoportokba is vonhatja a felhasználókat. Általánosságban elmondható, hogy a SearchInform hálózati beállításai a Google előtt járnak a rugalmasság terén, a Snoop Server pedig a kényelem és az egyszerűség terén.

Hivatalos oldal:
Terjesztési méret: 14,7 MbIndexelési sebesség-összehasonlítás

KeresőrendszerIndexelési időIndex mérete
Bloodhound Pro Deluxe 4.538 óra 46 perc19 GB
Isys Desktop 7.06 óra 13 perc7,9 GB
DtSearch 7.06 óra 3 perc8,6 GB
Google Desktop Search Enterprise8 óra 17 perc4,5 GB
Copernic Desktop Search*10 óra 51 perc7 GB
SearchInform 1.5.023 óra 17 perc4,4 GB

* Az orosz szöveget tartalmazó .html és .txt dokumentumok többsége, bár indexelve voltak, a nevükön kívül nem található.

Minden program figyelmet érdemel.

A tesztek és az áttekintésben bemutatott programok alapos vizsgálata alapján bizonyos következtetések vonhatók le. Tehát a Google Desktop Search Copernic Desktop Search meglehetősen alkalmas egy tapasztalatlan felhasználó számára otthoni információkereső rendszerként. Jó munkát végeznek az egyszerű kérésekkel, nem nagyon terhelik a felhasználót a beállításokkal, ráadásul teljesen ingyenesek. A Google vállalati keresők piacára való belépési kísérlete egyelőre nem bizonyult erősen indokoltnak: a teljes értékű munkához további modulokkal kell akasztani a programot, és korántsem egyszerű beállítani. Ezért a Desktop Search, a Copernic neveit kimondva a Google az "asztali" keresőmotorok egy rését hagyja maga mögött.

Igaz, az erősebb megoldások – a dtSearch, az iSYS és a SearchInform sem váratlanul, és az „asztali” verziójukat kínálják a felhasználóknak. De elfogadható áron, ellentétben a Google és a Copernic ingyenes szoftvereivel. Természetesen fizetni kell a teljesítményért, a sebességért és a funkcionalitásért. A dtSearch, az iSYS és a SearchInform fejlesztői azonban természetesen a vállalati szektorra helyezik a hangsúlyt. Hálózat, funkcionalitás, indexelés és keresési sebesség – ez különbözteti meg ezeket a termékeket „versenytársaiktól”. A teszt eredménye alapján meghatározták a kedvencet - SearchInform. A program lehetőséget biztosít hasonló dokumentumok keresésére, a legmagasabb indexelési és keresési sebességgel rendelkezik, és jó funkciókészlettel rendelkezik.

A megfelelő és naprakész információk megtalálása az interneten néha nagyon nehéz. Az információs szemét mennyisége a weben hógolyóként növekszik, és néha egyszerűen lehetetlen elérni a valóban szükséges adatokat a hagyományos Yandex és a Google segítségével. A kezében tartott könyv sokszorosára növeli az információkeresés hatékonyságát az interneten. Technikákat, keresőoldalakat és programokat ír le a speciális információkereséshez. Az internetes keresés modern változatait tekintik: univerzális keresés, vertikális keresés, metakereső rendszerek, személyes keresőmotorok építése, audiovizuális tartalom keresése, keresés a rejtett interneten. Az összes vizsgált rendszerhez megadjuk azok jellemzőit és tippjeit a leghatékonyabb felhasználáshoz.

Bevezetés

Az internetes keresés az internetes munka fontos eleme. A modern internet webes forrásainak pontos számát aligha tudja biztosan valaki. A számla mindenesetre milliárdokba rúg. Ahhoz, hogy az adott pillanatban szükséges információkat fel tudd használni, akár üzleti, akár szórakozási célból, először meg kell találnod az erőforrások e folyamatosan feltöltődő óceánjában. Ez egyáltalán nem könnyű feladat, mivel a modern weben található információ nem strukturált, ami problémákat okoz a megtalálásban. Nem véletlen, hogy az internetes keresők egyfajta „ablakává” váltak ebbe az információs térbe.

Nem valószínű, hogy az internetezők között lesznek olyanok, akik soha nem használtak nagy univerzális keresőmotorokat. Mindenki ajkán ott van a Google, a Yandex és még pár nagy gép neve. Remekül boldogulnak vele napi feladatok Internetes keresés, és a felhasználók gyakran meg sem próbálnak csere után nézni. Ugyanakkor az internetes keresők száma korunkban több ezerre tehető. Az alternatív gépek ilyen sokféleségének okai különbözőek. Egyes projektek a nemzeti internetes forrásokkal való gondos munkával közvetlenül a globális piac vezetőivel próbálnak versenyezni. Mások olyan lekérdezési funkciókat kínálnak, amelyek nem találhatók meg a bejáratott keresőmotorokban. Az alternatív gépek jelentős része egy adott témakör vagy egy bizonyos típusú tartalom keresésére specializálódott, és lenyűgöző eredményeket ér el e problémák megoldásában. Bárhogy is legyen, az ilyen keresőmotorok felvétele a felhasználó saját internetes keresőeszköz-arzenáljába jelentősen javíthatja annak minőségét. Itt azonban van egy árnyalat: tudni kell az ilyen gépekről, és ki kell tudni használni a képességeiket.

Feltételezzük, hogy a könyv olvasói már eléggé jól ismerik az univerzális keresőmotorok segítségével történő keresés technikáját. Annyira jó, hogy érezték a használatukkal kapcsolatos korlátokat. Valószínűleg az ilyen emberek már megpróbáltak bizonyos kiegészítő eszközöket keresni és alkalmazni. A nyomtatott szó nem kerüli meg az internetes keresés témáját: mind a cikkek, mind a könyvek rendszeresen megjelennek. De a hősök általában ugyanazok - több vezető univerzális keresőmotor. Könyvünk abban különbözik, hogy a modern keresési megoldások teljes skáláját igyekszik lefedni. Itt leírásokat és ajánlásokat talál a legjobb modern szolgáltatások használatához, amelyek a leggyakoribb keresési feladatok megoldására összpontosítanak. Ez a könyv azoknak szól, akik sokat dolgoznak az interneten, és a weben keresik a szükséges információkat – legyen szó üzleti tevékenységről, tanulásról vagy hobbiról.

A sikeres internetes kereséshez két feltételnek kell teljesülnie: a lekérdezéseket jól kell megfogalmazni, és megfelelő helyeken kell rákérdezni. Más szóval, a felhasználótól elvárás egyrészt, hogy a keresési érdeklődését le tudja fordítani a keresési lekérdezés nyelvére, másrészt a keresőmotorok, az elérhető keresőeszközök, azok előnyei, hátrányai, amelyek lehetővé teszik az egyes esetekben a legmegfelelőbb keresési eszközök kiválasztását.

Jelenleg nincs egyetlen olyan erőforrás, amely megfelelne az internetes keresés minden követelményének. Ezért a keresés komoly megközelítésével elkerülhetetlenül különböző eszközöket kell használnia, mindegyiket a legmegfelelőbb esetben használja.

1. fejezet

Univerzális internetes keresők

Az univerzális internetes keresőmotorok az internetes keresés fő és legismertebb eszközei. Az ilyen keresőmotorok maximális lefedettséget biztosítanak a különféle erőforrásokhoz. Ez az univerzális típus, amely magában foglalja a legnagyobb és legnépszerűbb keresőmotorokat. Ezek igazán hatékony megoldások, sok olyan funkcióval és eszközzel, amelyekről sok felhasználó gyakran nem tud. Az univerzális keresés funkcióinak és lehetőségeinek megértése lehetővé teszi, hogy megtudja az erősségeket és gyenge oldalai ilyen rendszereket és tudatosan választják ki a leghatékonyabb keresési eszközöket.

Az univerzális keresőmotorok piaca meglehetősen nagy. Ebben a fejezetben csak a legerősebb gépeket vesszük figyelembe, amelyek megfelelően tudnak dolgozni az orosz nyelvű lekérdezésekkel. A fejezetet történetek nyitják az orosz keresés vezetőiről - a Google.ru és a Yandex rendszerekről. Ezekről a keresőmotorokról könyvek és sok cikk született. A főbb jellemzőkre összpontosítunk, amelyek fontosak a végfelhasználó számára, és megpróbáljuk azonosítani az erősségeit.

Hozzájuk tartozik a Microsoft Corporation új keresőfejlesztése - az eddig észrevehetően figyelmen kívül hagyott Bing rendszer, valamint egy hasznos és meglehetősen erős Exalead kereső, melynek előnye, hogy jó támogatást keressen az európai internetes forrásokban. Ez a rendszer- még mindig ritka vendég felhasználóink ​​keresési arzenáljában, ezért részletesebben foglalkozik vele, mint a többivel.

Ebben a fejezetben az áttekintés során Google rendszerekés a Yandex, csak a webes keresési lehetőségekre összpontosítunk, és a projektek speciális adatbázisaiban való keresést a következő kép- és videókeresésről szóló fejezetek tárgyalják. Más univerzális keresőmotorok esetében a multimédiás kereséssel kapcsolatos információkat azonnal megadják, miután megismerkedtek velük.

Mivel a fejezet négy hőse közül három külföldi származású, rögtön megjegyezzük, hogy csak az orosz változatuk lehetőségeit elemezzük. Az a tény, hogy a külföldi rendszerek egyes funkciói, különösen a kísérletiek, gyakran csak a szolgáltatások eredeti, általában angol nyelvű verziójában érhetők el.

Google

A Google keresőmotorját méltán tartják a világelső a modern internetes keresésben. 1998-ban alakult Google a mai napig a vezető irányadók közé tartozik az internetes keresés és webszolgáltatások területén.

A Google fejlesztőit mindig is megkülönböztette a keresőmotorjuk algoritmusainak fejlesztésére irányuló fokozott figyelem, valamint az ésszerű konzervativizmus a területen. felhasználói felület. Klasszikusnak nevezhető a lekérdezés Google-on történő összeállításának lehetőségei, és a keresési eredmények megjelenítési módjai is egyfajta standardtá váltak. Nemrég Google Developers jelentős változásokat hajtott végre ezeken a területeken - a legnagyobb keresőmotor túlságosan régimódinak tűnt a fiatal versenytársak hátterében.

A Google rendelkezik a világ egyik legnagyobb indexbázisával, amely az információforrások széles körű lefedettségét biztosítja. A Google indexinformációi több függőleges bázisban vannak összefoglalva. A leghíresebb webes adatbázison kívül számos multimédiás adatbázis (Képek, Videók) működik az RSS-hírcsatornákon található releváns információk és üzenetek forrásaival, a Hírek adatbázis, valamint a Blogs adatbázis, amely indexeli a hálózati naplókat. Emellett a Google további források széles skáláját kínálja, amelyek között érdemes megemlíteni egy térképszolgáltatást, egy webhelyjegyzéket és egy kérdés-válasz szolgáltatást. Ezeket az erőforrásokat keresőeszközöknek is tekinthetjük.

A webes adatbázisban a Google egyszerű és speciális keresési módokat kínál a lekérdezések összeállításához. Egyszerű keresés módban a kiegészítő eszközök közül csak virtuális billentyűzet. A részletes keresés több lehetőséget kínál. Mivel a speciális keresési űrlap szinte minden Google keresőtermékben elérhető, térjünk rá részletesebben (1.1. ábra).

Yandex

A nagyközönségnek 1997-ben hivatalosan bemutatott Yandex keresőmotor sikeresen fejlődött, és tíz évvel később először került be a világ tíz legnagyobb keresője közé. Az internet orosz szegmensében vezető pozíciót ért el, amelyet az erősödő verseny ellenére sem fog feladni. A Yandex megkülönböztető jellemzői létezésének kezdete óta saját eredeti algoritmusai voltak a keresési eredmények relevanciájának meghatározására, rugalmas eszközök a lekérdezési szöveggel való munkavégzéshez, és figyelembe veszik az orosz nyelv morfológiájának sajátosságait azok feldolgozása során.

A Yandex saját index adatbázisaira támaszkodik. A webes dokumentumokban való keresés mellett a rendszer a speciális erőforrások és kiegészítő szolgáltatások jó választékát kínálja. A Yandex jelenleg képekkel, videókkal, hírekkel, blogokkal és szótárokkal dolgozik. Hatékony keresési lehetőségeket ágyazunk be saját térképészeti szolgáltatásunkba és a termékkereső rendszerbe is. Ezenkívül a Yandex saját webhelykatalógust is tart fenn. Erősség A Yandex egy fejlett helyi keresőprogram, amely különösen fontos felhasználóink ​​számára. A Yandex hozzáférést biztosít adatbázisaihoz külső fejlesztők számára. Ennek eredményeként számos orosz alternatív internetes keresési projekt ilyen vagy olyan módon használja a Yandex erőforrásait. A szokásos keresőrendszer mellett a Yandex rövidített változata is elérhető, amely a ya.ru webhelyen érhető el. Ennek a verziónak a felülete csak egy lekérdezés beviteli mezőből és egy keresés indítógombból áll.

A webes dokumentumkeresés egyszerű és összetett keresési módokat is kínál. Az egyszerű keresés nem biztosít szűrőket, ezt kompenzálja a természetes nyelvű lekérdezések automatikus elemzésének képessége, a viszonylag hosszú lekérdezések magabiztos feldolgozása és az automatikus lekérdezés-kiegészítő rendszer. A lekérdezés maximális hossza negyven szó.

A lekérdezés összeállítására szolgáló speciális keresési űrlap csak egy mezőt kínál. A lekérdező szavakat összekötő logikai operátorok manuális bevitele javasolt, jó. A Yandex meglehetősen részletes lekérdezési nyelvvel rendelkezik. A további speciális keresési űrlapok különféle szűrők (1.4).

bing

A Microsoft internetes keresési előzményeit nem könnyű felhívni. A lakosság számára következetesen kínált szolgáltatások többször módosították az algoritmusokat, a használt adatbázisokat és természetesen a neveket. A 2000-es évek elejéig a keresőmotornak nem volt saját adatbázisa, és az AltaVista, az Inktomi és a Looksmart külső indexeivel dolgozott. Az eredeti MSN Search elnevezést 2006-ig használták, majd évekig a keresőmotor nevének megváltoztatása hagyománnyá vált a Microsoftnál.

A saját indexeiben való keresésre való végső átállással együtt az MSN Search átnevezték először Windows LiveLive Search névre. Végül 2009 nyarának elején az Élő keresést felváltotta az új Bing keresőprojekt.

"A Bing más módon fogja látni az internetes információkat, és segít a felhasználóknak fontos döntések meghozatalában" - ezzel a kijelentéssel kezdődött a Microsoft Bing bevezetéséről szóló sajtóközleménye. A fejlesztők törekvései érthetőek voltak: a Microsoft keresőmotorjai minden erőfeszítés ellenére nyugaton következetesen elmaradtak a vezetők - Google és Yahoo! - népszerűségétől. Ha a Microsoft korábbi keresési projektjeinek orosz nyelvű verzióiról beszélünk, akkor a talált linkek számát és minőségét tekintve sokkal rosszabbak voltak, mint a nagy orosz keresők. A versenytársak felzárkózása érdekében a Bing fejlesztői a keresés minőségének javítására és az új technológiák bevezetésére hagyatkoztak, amelyek közül sokat az azokat létrehozó cégekkel együtt vásároltak meg.

Megjegyzendő Orosz változat A Bing, mint a legtöbb más honosított verzió, számos további funkciót, például boltkeresést hiányol. Mivel valójában csak északon dolgoznak. Amerika, nincs értelme részletesen foglalkozni velük.

Exalead

Európa egyik jellemzője, beleértve az internetes keresést is, a nemzeti nyelvek nagy száma. Egy európai vezetőnek mondó keresőmotornak egyszerűen jól kell indexelnie az internet nemzeti szegmenseit, és jó minőségben kell feldolgoznia a lekérdezéseket számos európai nyelven, a legnagyobb és a kevésbé elterjedt nyelveken egyaránt. Ezen a területen lehet komolyan venni az európai fejlődést versenyelőny erős tengerentúli versenytársakhoz képest. Az Exalead rendszer jelenleg komolyan igényli egy ilyen európai kereső szerepét. Ezt a projektet az Európai Unió által finanszírozott Quaere kutatási program részeként fejlesztették ki.

Az Exalead saját index adatbázisokkal rendelkezik. A rendszer fő keresési forrásai a webdokumentumok, képek, videók és hírek adatbázisai. Kezdőlap Az Exalead lehetőséget kínál személyre szabás. Ezen az oldalon linkeket helyezhet el kedvenc oldalaira – ezek grafikus miniatűrök-képernyőképekként jelennek meg. Igaz, ehhez ingyenesen regisztrálnia kell egy fiókot, valamint lehetővé kell tennie a böngésző számára az Exalead cookie-k tárolását.

Az Exalead Web Search egyszerű és speciális keresési módokat kínál. A speciális keresési űrlap, a Binghez hasonlóan, közvetlenül a problémaoldalon nyílik meg. Ne feledje, hogy az Exalead nemcsak egy ismerős űrlapot kínál további mezőkkel, hanem egy összetett legördülő menüt is, amely varázslóként működik a lekérdezés finomításához (ábra. 1.7). Amikor kiválaszt egy vagy másik elemet a varázsló menüjében, a lekérdezési karakterlánc új elemeket, és szükség esetén operátorokat és speciális karaktereket ad hozzá.

Bevezetés

Jelenleg az internet több száz millió szervert egyesít, amelyek több milliárd különböző webhelyet és különféle információkat tartalmazó egyedi fájlokat tárolnak. Ez egy óriási információs tárház. Az interneten többféle információkeresési módszer létezik.

Keresés ismert cím alapján. A szükséges címek könyvtárakból származnak. A cím ismeretében csak írja be címsor Böngésző.

1. példa www.gov.ru - Oroszország állami hatóságainak szervere.

Cím létrehozása a felhasználó által. Az internetes címgeneráló rendszer ismeretében webhelyek keresésekor címeket hozhat létre.

Egy kulcsszóhoz tematikus vagy földrajzi tartományt kell hozzáadni (cég, vállalkozás, szervezet neve vagy egyszerű angol főnév), és össze kell kapcsolni az intuíciót.

2. példa Kereskedelmi weboldalak címei:

www.samsung.com SAMSUNG),

www.mtv.com (MTV zenei hírek).

3. példa Oktatási intézmények címei:

www.ntu.edu (US National University).

Kereső motorok Internet

Az interneten történő információkereséshez speciális információkereső rendszereket fejlesztettek ki. A keresőmotorok rendes címmel rendelkeznek, és speciális keresésszervezési eszközöket (keresési karakterlánc, tárgykatalógus, hivatkozások) tartalmazó weboldalként jelennek meg. Keresőmotor hívásához írja be a címét a böngésző címsorába.

A LiveInternet.ru statisztikai szolgáltatás szerint a keresőmotorok megoszlása ​​Oroszországban körülbelül a következő:

2) Google - 35,0%

3) Mail.ru keresés - 8,3%

4) Rambler - 0,9%

Az információs rendszerezés módja szerint az információkereső rendszereket két típusra osztják: osztályozásra (rubrikátorokra) és szótárra.

Rubrikátorok (osztályozók)- az információk hierarchikus (faszerű) szerveződését használó keresőmotorok. Információkereséskor a felhasználó tematikus címsorokon keresztül néz, fokozatosan szűkítve a keresési mezőt (például ha meg kell találni egy szó jelentését, akkor először meg kell találnia egy szótárt az osztályozóban, majd meg kell találnia a megfelelő szót benne).



Szótár keresők nagy teljesítményű automatikus szoftver- és hardverrendszerek. Segítségükkel az interneten található információk megtekintésére (szkennelésére) kerül sor. Az adott információ helyére vonatkozó adatok speciális referenciakönyvek-indexekbe kerülnek. A kérésre válaszul a keresés a lekérdezési karakterláncnak megfelelően történik. Ennek eredményeként a felhasználó felkínálja azokat a címeket (URL-eket), ahol a keresett szó vagy szócsoport megtalálható volt a szkenneléskor. A javasolt hivatkozások bármelyikének kiválasztásával a talált dokumentumhoz léphet. A legtöbb modern keresőmotor vegyes.

A leghíresebb és legnépszerűbb keresők:

Vannak keresésre szakosodott rendszerek információs források különböző irányokba.

https://my.mail.ru

https://ru-ru.facebook.com

https://twitter.com

https://www.tumblr.com

https://www.instagram.com stb.

Tárgykeresők:

Szoftver keresés:

Katalógusok (tematikus linkgyűjtemények megjegyzésekkel):

http://www.atrus.ru

Lekérdezés végrehajtási szabályok

Minden keresőben a Súgó részben tájékozódhat a keresésről, a lekérdezési karakterlánc összeállításáról. Az alábbiakban egy tipikus, "átlagos" lekérdezési nyelvről olvashat.

Egyszerű kérés

Írjon be egy szót, amely meghatározza a keresési témát. Például a Rambler.ru keresőben elég beírni: automatizálás.

A rendszer olyan dokumentumokat talál, amelyek a kérésben megadott szavakat tartalmazzák. Az orosz szavak minden formáját felismeri, a betűk esetét általában figyelmen kívül hagyják.

A lekérdezésben használhatja a „*” vagy „?” karaktert. Jelölje be a "?" a kulcsszóban egy karaktert helyettesítünk, amely helyére tetszőleges betű helyettesíthető, a „*” karakter pedig egy karaktersorozat.

Például egy lekérdező automata* olyan dokumentumokat talál, amelyek tartalmazzák az automatikus, automatikus és így tovább szavakat.

Összetett kérés

Gyakran szükség van kombinálásra kulcsszavakat pontosabb információkért. Ebben az esetben további összekötő szavakat, függvényeket, operátorokat, szimbólumokat, zárójelekkel elválasztott operátorkombinációkat használnak.

Például a zene & (beatles beatles) lekérdezés azt jelenti, hogy a felhasználó olyan dokumentumokat keres, amelyek a zene és a beatles vagy a zene és a beatles szavakat tartalmazzák.

A keresőkiszolgálók és könyvtárak listája

Cím Leírás
www.excite.com Keresőmotor csomópont-értékelésekkel és útmutatókkal
www.alta-vista.com Keresőszerver, fejlett keresési lehetőségek állnak rendelkezésre
www.hotbot.com kereső szerver
www.ifoseek.com Keresőszerver (könnyen használható)
www.ipl.org Internet Publik könyvtár, a Világfalu projekt részeként működő nyilvános könyvtár
www.wisewire.com WiseWire - keresés szervezése mesterséges intelligencia segítségével
www.webcrawler.com WebCrawler - keresőszerver, könnyen használható
www.yahoo.com Webkatalógus és felület az AltaVista szerveren a teljes szöveges keresés eléréséhez
www.aport.ru Aport - orosz nyelvű keresőszerver
www.yandex.ru Yandex - orosz nyelvű keresőszerver
www.rambler.ru Rambler - orosz nyelvű keresőszerver
Internetes súgóforrások
www.yellow.com Internet Yellow Pages
monk.newmail.ru Különféle profilú keresők
www.top200.ru Top 200 webhely
www.allru.net
www.ru Az orosz internetes források katalógusa
www.allru.net/z09.htm Oktatási források
www.students.ru Orosz diákszerver
www.cdo.ru/index_new.asp Távoktatási Központ
www.open.ac.uk Open University UK
www.ntu.edu Amerikai Nemzeti Egyetem
www.translate.ru Elektronikus szövegfordító
www.pomorsu.ru/guide.library.html A netes könyvtárakra mutató hivatkozások listája
www.elibrary.ru Tudományos elektronikus könyvtár
www.citforum.ru E-könyvtár
www.infamed.com/psy Pszichológiai tesztek
www.pokoleniye.ru Internet Oktatási Szövetség honlapja
www.metod.narod.ru Oktatási források
www.spb.osi.ru/ic/distant Távoktatás az interneten
www.examen.ru Vizsgák és tesztek
www.kbsu.ru/~book/ Számítástechnika tankönyv
Mega.km.ru Enciklopédiák és szótárak

Professzionális információkeresés az interneten

Az információkeresés az egyik leggyakoribb és egyben a legtöbb kihívást jelentő feladatokat amellyel minden felhasználónak meg kell küzdenie a weben. Ha azonban a hálózati közösség egy hétköznapi tagja számára kívánatos, de távolról sem kötelező minőség a hatékony információkeresési módszerek ismerete, akkor az információs szakemberek számára az internetes források gyors eligazodásának és a szükséges források megtalálásának képessége az egyik alapvető képesítési ismeretek.

Az internetes információkeresés során felmerülő nehézségek okát két fő tényező határozza meg. Először is, a weben található források száma rendkívül nagy. 2001 végén a legdurvább becslések körülbelül 7,5 milliárd dokumentumot jeleztek a világ szerverein. Másodszor, az interneten található információ mennyisége nemcsak óriási, hanem rendkívül dinamikus is. Abban a fél percben, amit a szakasz első sorainak elolvasásával töltött, körülbelül száz új vagy megváltozott dokumentum jelent meg a virtuális univerzumban, több tucat új címre került, és az egységek örökre megszűntek létezni. Az internet soha nem "alszik", ahogy a bolygónk sem "alszik el", amely mentén az emberi üzleti tevékenység hulláma gördül folyamatosan, pontosan az időzónák változásának megfelelően.

A könyvtárban található dokumentumok stabil és ellenőrzött gyűjteményével ellentétben a weben egy óriási és folyamatosan változó információtömbről van szó, amelyben az adatok keresése nagyon-nagyon összetett folyamat. A helyzet gyakran nagyon emlékeztet arra a jól ismert feladatra, hogy tűt kell találni a szénakazalban, és néha a nagy értékű információ csak a megtalálás nehézsége miatt marad kéretlen.

A legtöbb felhasználó a globális számítógépes hálózatok. Az amatőrök és a profik is gyakran ugyanazokat az eszközöket használják. A keresések eredménye és a rájuk fordított idő azonban igen nagymértékben eltér egymástól.

Ennek a résznek az a célja, hogy részletesen megismerkedjen az információkeresés eszközeivel és módszereivel, valamint fenntartható készségek fejlesztése a weben való professzionális kereséshez minden típusú adat között: a bármilyen formátumú szövegtől a videóig és az animációig.