Wyszukiwanie informacji w Internecie

Internet rozwija się w bardzo szybkim tempie, więc znajdź niezbędne informacje wśród setek miliardów stron WWW i setek milionów plików staje się to coraz trudniejsze. Do wyszukiwania informacji wykorzystywane są specjalne wyszukiwarki, które zawierają stale aktualizowane informacje o lokalizacji stron WWW i plików na setkach milionów serwerów internetowych.

Wyszukiwarki zawierają pogrupowane tematycznie informacje o zasobach informacyjnych sieci WWW w bazach danych. Specjalne programy-roboty okresowo „omijają” internetowe serwery WWW, czytają wszystkie napotkane dokumenty, zaznaczają w nich słowa kluczowe i wpisują adresy internetowe dokumentów do bazy danych.

Większość wyszukiwarek umożliwia autorowi witryny internetowej wprowadzanie informacji do bazy danych poprzez wypełnienie formularza rejestracyjnego. W trakcie wypełniania ankiety deweloper strony wprowadza adres strony, jej nazwę, krótki opis zawartość witryny, a także słowa kluczowe, dzięki którym najłatwiej będzie znaleźć witrynę.

Szukanie słowa kluczowego. Wyszukiwanie dokumentu w bazie wyszukiwarki odbywa się poprzez wpisanie zapytań do pole wyszukiwania.

Żądanie musi zawierać jedno lub więcej słów kluczowych, które są głównymi słowami kluczowymi dla tego dokumentu. Na przykład, aby wyszukać same wyszukiwarki internetowe, możesz wpisać słowa kluczowe „ Rosyjski system szukaj informacji w Internecie ”(ryc. 6.21).

Jakiś czas po wysłaniu zapytania wyszukiwarka zwróci listę adresów internetowych dokumentów, w których znaleziono określone słowa kluczowe. Aby wyświetlić ten dokument w przeglądarce, wystarczy aktywować odsyłający do niego link (rys. 6.22).

Jeśli słowa kluczowe zostały wybrane bez powodzenia, to lista adresów dokumentów może być zbyt duża (może zawierać dziesiątki, a nawet setki tysięcy linków). Aby zawęzić listę, możesz wpisać dodatkowe słowa kluczowe w polu wyszukiwania lub skorzystać z katalogu wyszukiwarki.

Jedną z najbardziej kompletnych i potężnych wyszukiwarek jest Google (www.google.ru), która przechowuje w swojej bazie danych 8 miliardów stron internetowych, a co miesiąc roboty otwierają 5 milionów nowych stron. W Runecie (rosyjska część Internetu) obszerne bazy danych zawierające po 200 milionów dokumentów każda posiadają wyszukiwarki Yandex (www.yandex.ru) i Rambler (www.rambler.ru).

Szukaj w hierarchicznym systemie katalogów. W bazie danych wyszukiwarki witryny sieci Web są pogrupowane w hierarchiczne katalogi tematyczne, które są analogiczne do katalogu tematycznego w bibliotece.

Sekcje tematyczne najwyższego poziomu, na przykład: Internet, komputery, nauka i edukacja i tak dalej, zawierają katalogi zagnieżdżone. Na przykład katalog internetowy może zawierać podkatalogi Przeszukaj pocztę i inne (ryc. 6.23).

Wyszukiwanie informacji w katalogu sprowadza się do wybrania konkretnego katalogu, po czym użytkownikowi zostanie zaprezentowana lista linków do adresów internetowych najczęściej odwiedzanych i znaczących witryn sieci Web. Każdy link jest zwykle opatrzony adnotacją, czyli zawiera krótki komentarz do treści dokumentu.

Wyszukiwarka Aport (www.aport.ru) posiada najbardziej kompletny wielopoziomowy hierarchiczny katalog tematyczny rosyjskojęzycznych zasobów internetowych. Katalog zawiera szczegółową adnotację zawartości stron internetowych oraz wskazanie ich położenia geograficznego.

Wyszukiwanie plików. Do wyszukiwania plików na serwerach archiwów plików służą wyspecjalizowane wyszukiwarki, w tym wyszukiwarka FileSearch (www.filesearch.ru). Aby wyszukać plik, musisz wpisać nazwę pliku w polu wyszukiwania, a wyszukiwarka zwróci adresy internetowe serwerów archiwum plików, które przechowują plik o podanej nazwie.

Wyszukiwanie informacji w rosyjskojęzycznej części Internetu za pomocą większości wyszukiwarek: Google, Rambler, Aport, Applex i wyszukiwarki plików Research można wykonać za pomocą zintegrowanej wyszukiwarki Gogle.ru (ryc. 6.24). Aby to zrobić, po prostu wpisz słowa kluczowe w pasku wyszukiwania, użyj przełączników, aby ustawić rodzaj wymaganych informacji i kliknij przycisk z nazwą wyszukiwarki Gogle.ru (ryc. 6.24). Aby to zrobić, wystarczy wpisać słowa kluczowe w pasku wyszukiwania, za pomocą przełączników ustawić rodzaj wymaganych informacji i kliknąć przycisk z nazwą wyszukiwarki.


Ryż. 6.24. Zintegrowana wyszukiwarka Google.ru

Metody wyszukiwania w Internecie

Trzy sposoby wyszukiwania w Internecie

Internet w ogólności, aw szczególności sieć WWW, zapewnia abonentowi dostęp do tysięcy serwerów i milionów stron internetowych, które przechowują niewyobrażalną ilość informacji. Jak nie zgubić się w tym „oceanku informacji”? Aby to zrobić, musisz nauczyć się wyszukiwać i znajdować niezbędne informacje w sieci.

Jak już wspomniano, istnieją trzy główne sposoby wyszukiwania informacji w Internecie.

1. Określanie adresu strony. To jest najbardziej szybki sposób wyszukiwania, ale można go użyć tylko wtedy, gdy znany jest dokładny adres dokumentu.

2. Nawigacja przez hiperłącza. Jest to najmniej wygodna metoda, ponieważ może być używana do wyszukiwania dokumentów, które mają znaczenie tylko zbliżone do bieżącego dokumentu. Jeśli bieżący dokument jest poświęcony na przykład muzyce, to korzystając z hiperłączy tego dokumentu, trudno będzie uzyskać dostęp do strony poświęconej sportowi.

3. Dzwonię do serwera wyszukiwania wyszukiwarka) . Korzystanie z wyszukiwarek to najwygodniejszy sposób znajdowania informacji. Obecnie w rosyjskojęzycznej części Internetu popularne są następujące serwery wyszukiwania:

    Yandex;
    Wędrowiec;
    Aport.

Istnieją również inne wyszukiwarki. Na przykład, sprawny system wyszukiwanie zaimplementowane na serwerze usługi pocztowe poczta.ru.

Szukaj serwerów

Najbardziej dostępny i wygodny sposób wyszukiwania informacji w ogólnoświatowa sieć jest korzystanie z wyszukiwarek. Jednocześnie informacje można wyszukiwać według katalogów, a także zestawu słów kluczowych charakteryzujących przeszukiwany dokument tekstowy.

Rozważ bardziej szczegółowo użycie serwerów wyszukiwania. serwer wyszukiwania zawiera dużą liczbę linków do najbardziej różne dokumenty, a wszystkie te linki są zorganizowane w katalogi tematyczne. Na przykład: sport, kino, samochody, gry, nauka itp. Co więcej, te linki są ustawiane przez serwer niezależnie, w tryb automatyczny poprzez regularne przeglądanie wszystkich stron internetowych, które pojawiają się w sieci WWW. Ponadto serwery wyszukiwania zapewniają użytkownikowi możliwość wyszukiwania informacji według słów kluczowych. Po wprowadzeniu słów kluczowych serwer wyszukiwania rozpoczyna przeglądanie dokumentów na innych serwerach sieci Web i wyświetla łącza do tych dokumentów, w których znajdują się określone słowa. Zazwyczaj wyniki wyszukiwania są sortowane w porządku malejącym według specjalnej oceny dokumentu, która wskazuje, w jakim stopniu dany dokument spełnia kryteria wyszukiwania lub jak często jest wyświetlany w Internecie.

Język zapytań wyszukiwarki

Grupa słów kluczowych, utworzona według określonych zasad - przy użyciu języka zapytań, nazywana jest zapytaniem do serwera wyszukiwania. Języki zapytań dla różnych wyszukiwarek są bardzo podobne. Możesz dowiedzieć się więcej na ten temat, odwiedzając sekcję „Pomoc” żądanego serwera wyszukiwania. Rozważmy zasady generowania zapytań na przykładzie wyszukiwarki Yandex.

Składnia operatora Co oznacza operator Przykład zapytania
przestrzeń lub & Logiczne AND (w zdaniu) fizjoterapia
&& Logiczne AND (w dokumencie) przepisy kulinarne && (ser topiony)
| Logiczne OR zdjęcie | fotografia | migawka | obraz fotograficzny
+ Obowiązkowa obecność słowa w znalezionym dokumencie +być lub +nie być
() Grupowanie słów (technologia | produkcja) (ser | twarożek)
~ operator binarny I NIE (w zdaniu) banki ~ prawo
~~
lub
_
Binarny operator AND NOT (w dokumencie) Przewodnik po Paryżu ~~ (agencja | wycieczka)
/(nm) Odległość w słowach (minus (-) - wstecz, plus (+) - do przodu) dostawcy /2 muzyka do kawy /(-2 4) wakaty edukacyjne ~ /+1 studentów
" " Wyszukiwanie frazy „czerwony kapturek” Odpowiednik: czerwony / +1 kapturek
&&/(nm) Odległość w zdaniach (minus (-) - wstecz, plus (+) - do przodu) bank && /1 podatki

Pozyskać najwyższe wyniki szukaj, musisz pamiętać o kilku prostych zasadach:

    1. Nie szukaj informacji na temat tylko jednego słowa kluczowego.

    2. Najlepiej nie wprowadzać słów kluczowych wielkimi literami, ponieważ może to spowodować, że nie zostaną znalezione te same słowa zapisane małymi literami.

    3. Jeśli wyszukiwanie nie przyniosło żadnych wyników, sprawdź, czy są słowa kluczowe x błędy ortograficzne.

Nowoczesne wyszukiwarki zapewniają możliwość połączenia się z wygenerowanym żądaniem analizatora semantycznego. Za jego pomocą możesz, wpisując słowo, wybrać dokumenty, w których występują pochodne tego słowa w różnych przypadkach, czasach itp.

pytania testowe

1. Jak wyszukiwane są dokumenty według słów kluczowych? W systemie katalogowym?

Zadania do samorealizacji

6.8 Praktyczne zadanie. Porównaj wyniki wyszukiwania dokumentów według słów kluczowych przy użyciu różnych wyszukiwarek (użyj zintegrowanej wyszukiwarki Google).

6.9 Zadanie praktyczne. Wyszukaj na serwerach archiwum plików plik odtwarzacza multimedialnego WinAmp.

Co to jest

DuckDuckGo to dość znana wyszukiwarka open source. kod źródłowy. Serwery znajdują się w USA. Oprócz własnego robota wyszukiwarka korzysta z wyników innych źródeł: Yahoo, Bing, Wikipedia.

Lepiej

DuckDuckGo pozycjonuje się jako najlepsze narzędzie do wyszukiwania prywatności i prywatności. System nie zbiera żadnych danych o użytkowniku, nie przechowuje logów (brak historii wyszukiwania), używa ciasteczka maksymalnie ograniczone.

DuckDuckGo nie zbiera ani nie udostępnia danych osobowych użytkowników. To jest nasza polityka prywatności.

Gabriel Weinberg, założyciel DuckDuckGo

Dlaczego tego potrzebujesz

Wszystkie główne wyszukiwarki próbują personalizować wyniki wyszukiwania na podstawie danych o osobie przed monitorem. Zjawisko to nazywa się „bańką filtra”: użytkownik widzi tylko te wyniki, które są zgodne z jego preferencjami lub które system uważa za takie.

Tworzy obiektywny obraz, który nie zależy od Twojego przeszłego zachowania w sieci i eliminuje tematyczne reklamy google i „Yandex”, na podstawie twoich próśb. Za pomocą DuckDuckGo łatwo jest wyszukiwać informacje w językach obcych, podczas gdy Google i Yandex domyślnie preferują witryny rosyjskojęzyczne, nawet jeśli zapytanie jest wpisane w innym języku.


Co to jest

not Evil to system, który przeszukuje anonimową sieć Tor. Aby z niego skorzystać, musisz przejść do tej sieci, na przykład uruchamiając wyspecjalizowany .

not Evil nie jest jedyną wyszukiwarką tego rodzaju. Istnieje LOOK (domyślne wyszukiwanie w przeglądarce Tor, dostępne od zwykły internet) lub TORCH (jedna z najstarszych wyszukiwarek w sieci Tor) i inne. Zdecydowaliśmy się na nie Zło z powodu niewątpliwej aluzji do Google (wystarczy spojrzeć na stronę startową).

Lepiej

Szuka tam, gdzie zasadniczo odmawia się dostępu Google, Yandex i innym wyszukiwarkom.

Dlaczego tego potrzebujesz

W sieci Tor jest wiele zasobów, których nie można znaleźć w przestrzegającym prawa Internecie. A ich liczba będzie rosła w miarę zacieśniania się kontroli władz nad zawartością sieci. Tor to rodzaj sieci w sieci z sieciami społecznościowymi, trackerami torrentów, mediami, platformy handlowe, blogi, biblioteki i tak dalej.

3. YaCy

Co to jest

YaCy to zdecentralizowana wyszukiwarka działająca na zasadzie sieci P2P. Każdy komputer, który ma podstawowy moduł oprogramowania, samodzielnie skanuje Internet, to znaczy jest analogiem robota wyszukującego. Uzyskane wyniki są gromadzone we wspólnej bazie danych, z której korzystają wszyscy uczestnicy YaCy.

Lepiej

Trudno tu powiedzieć, czy jest lepiej, czy gorzej, ponieważ YaCy to zupełnie inne podejście do organizacji wyszukiwania. Brak jednego serwera i firmy właściciela sprawia, że ​​wyniki są całkowicie niezależne od czyichkolwiek preferencji. Autonomia każdego węzła wyklucza cenzurę. YaCy jest w stanie przeszukiwać głębokie sieci i nieindeksowane sieci publiczne.

Dlaczego tego potrzebujesz

Jeśli jesteś zwolennikiem open source i darmowy internet, na które nie mają wpływu agencje rządowe i duże korporacje, to YaCy jest Twoim wyborem. Może być również używany do organizowania wyszukiwań w sieci firmowej lub innej sieci autonomicznej. I choć YaCy nie jest zbyt przydatny w życiu codziennym, jest godną alternatywą dla Google pod względem procesu wyszukiwania.

4. Pipl

Co to jest

Pipl to system przeznaczony do wyszukiwania informacji o konkretnej osobie.

Lepiej

Autorzy Pipla twierdzą, że ich wyspecjalizowane algorytmy wyszukują efektywniej niż „zwykłe” wyszukiwarki. W szczególności profile mają priorytet portale społecznościowe, komentarze, listy uczestników oraz różne bazy danych, w których publikowane są informacje o osobach, takie jak bazy orzeczeń sądowych. Wiodącą pozycję Pipl w tej dziedzinie potwierdzają Lifehacker.com, TechCrunch i inne publikacje.

Dlaczego tego potrzebujesz

Jeśli potrzebujesz znaleźć informacje o osobie mieszkającej w USA, to Pipl będzie znacznie skuteczniejszy niż Google. Najwyraźniej bazy danych rosyjskich sądów są niedostępne dla wyszukiwarki. Dlatego nie radzi sobie tak dobrze z obywatelami Rosji.

Co to jest

FindSounds to kolejna wyspecjalizowana wyszukiwarka. Przeszukuje otwarte źródła różnych dźwięków: dom, natura, samochody, ludzie i tak dalej. Usługa nie obsługuje żądań w języku rosyjskim, ale istnieje imponująca lista tagów w języku rosyjskim, które można wyszukiwać.

Lepiej

W wydawaniu tylko dźwięków i nic więcej. W ustawieniach możesz ustawić żądany format i jakość dźwięku. Wszystkie znalezione dźwięki są dostępne do pobrania. Istnieje wyszukiwanie wzorców.

Dlaczego tego potrzebujesz

Jeśli potrzebujesz szybko znaleźć dźwięk wystrzału z muszkietu, uderzenie ssącego dzięcioła lub krzyk Homera Simpsona, to ta usługa jest dla Ciebie. I wybraliśmy to tylko z dostępnych zapytań w języku rosyjskim. Na język angielski spektrum jest jeszcze szersze.

Poważnie, wyspecjalizowana usługa oznacza wyspecjalizowaną grupę odbiorców. Ale czy tobie też się przyda?

Co to jest

Wolfram|Alpha to wyszukiwarka obliczeniowa. Zamiast linków do artykułów zawierających słowa kluczowe, daje gotową odpowiedź na zapytanie użytkownika. Na przykład, jeśli wpiszesz „porównaj populację Nowego Jorku i San Francisco” w języku angielskim w formularzu wyszukiwania, Wolfram|Alpha natychmiast wyświetli tabele i wykresy z porównaniem.

Lepiej

Ta usługa jest lepsza niż inne w znajdowaniu faktów i obliczaniu danych. Wolfram|Alpha gromadzi i systematyzuje wiedzę dostępną w sieci od różne obszary w tym nauka, kultura i rozrywka. Jeśli ta baza zawiera gotową odpowiedź na wyszukiwana fraza, system to pokazuje, jeśli nie, oblicza i wyświetla wynik. W tym przypadku użytkownik widzi tylko i nic więcej.

Dlaczego tego potrzebujesz

Jeśli jesteś na przykład studentem, analitykiem, dziennikarzem lub badaczem, możesz użyć Wolfram|Alpha do znalezienia i obliczenia danych związanych z Twoją działalnością. Usługa nie rozumie wszystkich próśb, ale stale się rozwija i staje się coraz inteligentniejsza.

Co to jest

Metasearch engine Dogpile wyświetla połączoną listę wyników z wyszukiwarek. SERPy Google, Yahoo i inne popularne systemy.

Lepiej

Po pierwsze, Dogpile wyświetla mniej reklam. Po drugie, serwis wykorzystuje specjalny algorytm do wyszukiwania i pokazywania najlepszych wyników z różnych wyszukiwarek. Według twórców Dogpile, ich system generuje najbardziej kompletny problem w całym Internecie.

Dlaczego tego potrzebujesz

Jeśli nie możesz znaleźć informacji w Google lub innej standardowej wyszukiwarce, poszukaj ich w kilku wyszukiwarkach jednocześnie, używając Dogpile.

Co to jest

BoardReader to system wyszukiwania tekstu dla forów, serwisów Q&A i innych społeczności.

Lepiej

Usługa pozwala zawęzić pole wyszukiwania do serwisów społecznościowych. Dzięki specjalnym filtrom możesz szybko znaleźć posty i komentarze, które odpowiadają Twoim kryteriom: językowi, dacie publikacji, nazwie witryny.

Dlaczego tego potrzebujesz

BoardReader może przydać się specjalistom od PR i innym specjalistom od mediów, którzy są zainteresowani opinią mediów w określonych kwestiach.

Wreszcie

Życie alternatywnych wyszukiwarek jest często ulotne. Lifehacker zapytał byłego prezesa ukraińskiego oddziału Yandex Sergey Petrenko o długoterminowe perspektywy takich projektów.


Siergiej Petrenko

Były dyrektor generalny Yandex.Ukraine.

Jeśli chodzi o los alternatywnych wyszukiwarek, jest prosty: być bardzo niszowymi projektami z małą publicznością, a zatem bez jasnych perspektyw komercyjnych lub, odwrotnie, z całkowitą jasnością ich braku.

Patrząc na przykłady w artykule, można zauważyć, że takie wyszukiwarki albo specjalizują się w wąskiej, ale poszukiwanej niszy, która być może tylko do tej pory nie rozrosła się na tyle, by być zauważalną na radarach Google czy Yandex, lub testują oryginalną hipotezę w rankingu, która nie ma jeszcze zastosowania w wyszukiwaniu konwencjonalnym.

Na przykład, jeśli wyszukiwanie Tora nagle okaże się poszukiwane, to znaczy, że przynajmniej procent odbiorców Google będzie potrzebować stamtąd wyników, wtedy oczywiście zwykłe wyszukiwarki zaczną rozwiązywać problem znajdź je i pokaż użytkownikowi. Jeśli z zachowania odbiorców wynika, że ​​znaczna część użytkowników w znacznej liczbie zapytań wydaje się bardziej trafnymi wynikami, danymi bez uwzględnienia czynników, które zależą od użytkownika, to Yandex lub Google zaczną dawać takie wyniki.

„Być lepszym” w kontekście tego artykułu nie oznacza „być lepszym we wszystkim”. Tak, pod wieloma względami nasi bohaterowie są dalecy od Yandex (nawet daleko od Binga). Ale każda z tych usług daje użytkownikowi coś, czego nie mogą zaoferować giganci branży wyszukiwania. Na pewno znasz też podobne projekty. Podziel się z nami - porozmawiajmy.

Wyszukiwanie informacji w Internecie

Wyszukiwanie informacji w Internecie

Wyszukiwanie informacji w powszechnie używanym trzy drogi(Patrz Rys.1). Pierwszy z nich - szukaj według adresu. Jest używany, gdy użytkownik zna adres zasobu informacyjnego zawierającego potrzebne mu informacje. Organizując wyszukiwanie informacji według adresu (forma adresu - IP, domena lub URL - w tym przypadku nie ma znaczenia) wystarczy wpisać adres zasobu w odpowiednim polu przeglądarki - program zaprojektowany w celu zapewnienia dostępu do zasobów sieciowych.

Ryż. 1. Sposoby wyszukiwania informacji w bazach hipertekstowych

Drugi- wyszukiwanie za pomocą nawigacji hiperłącza. Korzystając z tego typu wyszukiwania, użytkownik musi najpierw uzyskać dostęp do serwera powiązanego z odpowiednią bazą danych. Następnie możesz znaleźć dokument za pomocą hiperłączy. Oczywiście ta metoda jest wygodna, gdy adres zasobu jest nieznany użytkownikowi. Jako punkt wyjścia do wyszukiwania przy wdrażaniu tej metody, przeznaczone są portale WWW - serwery, które zapewniają bezpośredni dostęp do określonego zestawu serwerów, w tym do zainstalowanych na nich zasobów informacyjnych, a także aplikacje WWW realizujące usługi WWW odpowiadające cel portalu. Serwery dostępne za pośrednictwem portalu mogą być specyficzne dla konkretnego systemu (na przykład korporacyjnego) lub różne systemy i być specjalnie dobrane zgodnie ze specyficznymi, tematycznymi lub innymi cechami dokumentów i danych zawartych na ich stronach. Zazwyczaj portale łączą różne funkcje, aby utrzymać klienta jak najdłużej. Dominującą usługą portalu jest usługa help desk: wyszukiwanie, rubryki, wskaźniki finansowe, informacje o pogodzie itp. Podczas gdy witryny sieci Web są głównie zbiorami statycznych stron sieci Web, portale są zbiorami narzędzia programowe oraz nieustrukturyzowane informacje, które te narzędzia przekształcają w dane strukturalne na żądanie określonych użytkowników.

Trzeci metoda wyszukiwania polega na wykorzystaniu serwerów wyszukiwania w Internecie. Serwery wyszukiwania to dedykowane hosty - komputery, na których znajdują się bazy danych zasobów internetowych. Interfejs użytkownika taki serwer posiada pole do wpisywania słów kluczowych opisujących interesujący użytkownika temat (patrz rys. 2).

Rys.2. Widok okna serwera wyszukiwania Yandex

Serwer odbiera te słowa jako żądanie informacji, zgodnie z którym wyszukuje zasoby i przedstawia użytkownikowi listę znalezionych dokumentów. Oczywiście przy implementacji tej metody możliwe są błędy zarówno pierwszego (brak celu), jak i drugiego rodzaju (szum informacyjny). Należy wspomnieć, że wyróżnia się dwie grupy serwerów wyszukiwania: wyszukiwarki i katalogi tematyczne. Ich różnica wynika ze sposobu tworzenia i późniejszego uzupełniania bazy zasobów internetowych, które: podany serwer wykonuje wyszukiwanie informacji. Tak więc wyszukiwarki mają program specjalny- robot wyszukiwania. Stale monitoruje sieć, zbiera informacje z strony internetowe, indeksuje je i poprawia ich obraz wyszukiwania w swojej bazie danych. W katalogach tematycznych baza dokumentów internetowych tworzona jest „ręcznie” przez wyspecjalizowanych redaktorów. Ponieważ w Internecie nie ma jednej administracji, jej zasoby informacyjne stale się zmieniają. Mogą się w nim pojawiać nowe dokumenty, a istniejące dokumenty mogą zniknąć. Częstotliwość aktualizacji informacji w dokumentach dla różnych witryn jest różna: dla niektórych kilka razy na godzinę, dla niektórych raz dziennie, dzień, miesiąc itp. Dlatego bardzo ważne jest zrozumienie, że korzystając z systemów wyszukiwania informacji w celu znalezienia informacji w Internecie, wyszukiwanie odbywa się nie w rzeczywistej przestrzeni dokumentów internetowych, ale w pewnym modelu, którego zawartość może znacznie różnić się od rzeczywista zawartość Internetu w momencie wyszukiwania. W zależności od stopnia pokrycia indeksowanych zasobów wyszukiwarki można podzielić na dwie grupy: międzynarodową i rosyjskojęzyczną. Te pierwsze indeksują z rzędu wszystkie dokumenty publikowane w Internecie. Druga indeksuje zasoby znajdujące się w strefy domen z przewagą języka rosyjskiego. Lista najpopularniejszych systemów znajduje się w tabeli. jeden.

Patka. 1. Najpopularniejsze wyszukiwarki

Międzynarodowy rosyjskojęzyczni
Google Yandex (44,4% Runetu)
Wieśniak! Wędrowiec (10,6% Runetu)
bing Mail.ru (7,3% Runetu)
msn Nigma (0,5% Runet)
AltaVista Gogo.ru (0,3% Runet)
Zapytać się Aport (0,2% Runet)

Uwaga: Runet to rosyjskojęzyczna część Internetu, która tworzy domeny z nazwami ru i rf.

Należy wspomnieć, że istnieje specjalna kategoria wyszukiwarek - metasearch engine. Ich zasadnicza różnica od Wyszukiwarki a katalogi tematyczne polegają na tym, że nie mają własnej bazy indeksów, dlatego po otrzymaniu żądania użytkownika przekierowują je do kilku serwerów wyszukiwania jednocześnie (patrz rys. 3).

Ryż. 3. Schemat systemu metawyszukiwania

Możliwość jednoczesnego korzystania z wielu wyszukiwarek dla jednego żądania to oczywista zaleta metasearcherów. Obecnie system Metabot.ru znalazł szerokie zastosowanie, którego interfejs pokazano na ryc. 4. Ten system umożliwia korzystanie z międzynarodowych i rosyjskojęzycznych serwerów wyszukiwania do wyszukiwania zasobów.

Wysyłanie dobrej pracy do bazy wiedzy jest proste. Skorzystaj z poniższego formularza

Studenci, doktoranci, młodzi naukowcy, którzy wykorzystują bazę wiedzy w swoich studiach i pracy będą Ci bardzo wdzięczni.

Podobne dokumenty

    Sposoby wyszukiwania informacji w Internecie. Podstawowe wymagania i metody wyszukiwania informacji. Struktura i charakterystyka usług wyszukiwania. Globalne wyszukiwarki WWW (World Wide Web). Planowanie wyszukiwania i gromadzenia informacji w Internecie.

    streszczenie, dodano 02.11.2010

    Charakterystyka metod wyszukiwania informacji w Internecie, czyli za pomocą linków hipertekstowych, wyszukiwarek i narzędzi specjalnych. Analiza nowych zasobów Internetu. Historia powstania i opis zachodnich i rosyjskojęzycznych wyszukiwarek.

    streszczenie, dodane 05.12.2010

    Opis i klasyfikacja nowoczesnych systemów wyszukiwania informacji. dokumenty hipertekstowe. Przegląd i oceny największych wyszukiwarek na świecie. Opracowanie systemu wyszukiwania informacji, który demonstruje mechanizm wyszukiwania informacji w Internecie.

    praca dyplomowa, dodana 16.06.2015

    Analiza możliwości wyszukiwarek Yandex i Google, ich porównanie pod kątem użyteczności. Historia powstania wyszukiwarek, charakterystyka ich interfejsu, narzędzia wyszukiwania i algorytmy. Formacja pytania i kryterium odpowiedzi na nie.

    streszczenie, dodane 05/07/2011

    Rozważanie wyszukiwarek internetowych jako kompleksu oprogramowania i sprzętu z interfejsem sieciowym, który zapewnia możliwość wyszukiwania informacji. Typy wyszukiwarek: Archie, Wandex, Aliweb, WebCrawler, AltaVista, Yahoo!, Google, Yandex, Bing i Rambler.

    streszczenie, dodane 05.10.2013

    Struktura i zasady budowania Internetu, wyszukiwania i zapisywania w nim informacji. Historia powstania i klasyfikacja systemów wyszukiwania informacji. Zasada działania i charakterystyka wyszukiwarek Google, Yandex, Rambler, Yahoo. Szukaj według adresów URL.

    praca semestralna, dodana 29.03.2013

    Istota i zasada działania globalnego Internetu. Szukaj informacji według parametrów w System Google. Specjalistyczne systemy wyszukiwania informacji: „KtoTam”, „Tagoo”, „Truveo”, „Kinopoisk”, „Catch-Umov”. Właściwe korzystanie z wyszukiwarek.

    prezentacja, dodano 16.02.2015

    Przechowywanie danych w Internecie. Dokumenty hipertekstowe, typy plików. Pliki graficzne, ich rodzaje i cechy. Wyszukiwarki i zasady wyszukiwania informacji. Badanie wyszukiwarek internetowych. Wszystko o wyszukiwarkach Yandex, Google, Rambler.

    praca semestralna, dodana 26.03.2011

Informacje ogólne.

Obecnie Internet łączy setki milionów serwerów, które obsługują miliardy różnych witryn i pojedynczych plików zawierających różnego rodzaju informacje. To gigantyczne repozytorium informacji. Istnieją różne metody wyszukiwania informacji w Internecie.

Szukaj według znanego adresu. Wymagane adresy są pobierane z katalogów. Znając adres, po prostu wpisz go w pasek adresu Przeglądarka.

www.gov.ru - serwer rosyjskich władz państwowych.

Konstrukcja adresu przez użytkownika. Znając system generowania adresów internetowych, możesz tworzyć adresy podczas wyszukiwania witryn sieci Web.

Konieczne jest dodanie do słowa kluczowego domeny tematycznej lub geograficznej (nazwa firmy, przedsiębiorstwa, organizacji lub prosty angielski rzeczownik) i musi być połączona intuicja.

Adresy komercyjnych witryn internetowych:

www.cnn.com (CNN World News),

www.sony.com SONY),

www.mtv.com (wiadomości muzyczne MTV).

Adresy placówek edukacyjnych:

www.ntu.edu (Uniwersytet Narodowy Stanów Zjednoczonych).

Adresy serwerów regionalnych:

www.poland.net (Polska),

www.israil.net (Izrael).

Wyszukiwarki internetowe

Do wyszukiwania informacji w Internecie opracowano specjalne systemy wyszukiwania informacji. Wyszukiwarki mają zwykły adres i są wyświetlane jako strona internetowa zawierająca specjalne narzędzia do organizowania wyszukiwania (ciąg wyszukiwania, katalog tematyczny, linki). Aby wywołać wyszukiwarkę, wystarczy wpisać jej adres w pasku adresu przeglądarki.

Zgodnie z metodą organizowania informacji, systemy wyszukiwania informacji dzielą się na dwa typy: klasyfikacja (rubrykatory) i słownik.

Rubrykatory (klasyfikatory) to wyszukiwarki wykorzystujące hierarchiczną (podobną do drzewa) organizację informacji. Podczas wyszukiwania informacji użytkownik przegląda nagłówki tematyczne, stopniowo zawężając pole wyszukiwania (na przykład, jeśli chcesz znaleźć znaczenie słowa, najpierw musisz znaleźć słownik w klasyfikatorze, a następnie go w nim znaleźć właściwe słowo).

Systemy wyszukiwania słowników są potężnymi automatycznymi systemami oprogramowania i sprzętu. Za ich pomocą przeglądane (skanowane) są informacje w Internecie. Dane o lokalizacji tej lub innej informacji są wprowadzane do specjalnych ksiąg-indeksów. W odpowiedzi na żądanie wykonywane jest wyszukiwanie zgodnie z ciągiem zapytania. W rezultacie użytkownikowi oferowane są te adresy (URL), w których wyszukiwane słowo lub grupa słów została znaleziona w momencie skanowania. Wybierając dowolny z proponowanych linków, możesz przejść do znalezionego dokumentu. Większość nowoczesnych wyszukiwarek jest mieszana.

Najbardziej znane i popularne wyszukiwarki:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

Istnieją systemy, które specjalizują się w wyszukiwaniu zasoby informacji w różnych kierunkach.

Szukaj osób w Internecie:

www.whowhere.ru www. bigfoot.com

Szukaj według grup dyskusyjnych (Usenet):

www.dejanews.com

Wyszukiwarki tematów:

Szukaj oprogramowanie:

Szukaj w archiwach plików:

http://ftpseach.com city.ru, http://ftpsearch. licos.com

Katalogi (kolekcje tematyczne linków z adnotacjami):

http://www.atrus.ru

Często skuteczne wyszukiwanie informacji można przeprowadzić za pomocą katalogów regionalnych - wyspecjalizowanych serwerów zawierających dane o przedsiębiorstwach lub zasobach WWW miasta lub regionu. Na przykład w Petersburgu taki katalog znajduje się pod adresem http://www.spb.ru.

Listę IPS można znaleźć na stronie www.monk. nowa poczta.ru

Bardziej szczegółową listę wyszukiwarek i katalogów przedstawia tabela. 3.2.

Zasady wykonywania zapytań

W każdej wyszukiwarce w sekcji Pomoc można uzyskać informacje na temat wyszukiwania, tworzenia ciągu zapytania. Poniżej znajdują się informacje o typowym, „przeciętnym” języku zapytań.

Prosta prośba.

Wpisz jedno słowo, które definiuje temat wyszukiwania. Na przykład w wyszukiwarce Rambler.ru wystarczy wpisać: automatyzacja.

Znaleziono dokumenty zawierające słowa określone we wniosku. Rozpoznawane są wszystkie formy rosyjskich słów, z reguły ignorowane są litery.

W zapytaniu możesz użyć znaku „*” lub „?”. Podpisać "?" w słowie kluczowym zastępowany jest jeden znak, w miejsce którego można podstawić dowolną literę, a znak „*” jest ciągiem znaków.

Na przykład automat zapytań* znajdzie dokumenty zawierające słowa automatyczne, automatyczne i tak dalej.

Złożona prośba.

Często istnieje potrzeba łączenia słów kluczowych, aby uzyskać bardziej szczegółowe informacje. W tym przypadku stosuje się dodatkowe słowa łączące, funkcje, operatory, symbole, kombinacje operatorów oddzielone nawiasami.

Na przykład zapytanie music & (beatles | beatles) oznacza, że ​​użytkownik szuka dokumentów zawierających słowa music and beatles lub music and beatles.

Tabela 3.1 przedstawia przyjęte w systemie Aport zasady generowania wniosków (http://www.aport.ru).

Tabela 3.1

Operatory dla wniosków o formowanie

Operator Synonimy Komentarz
I ORAZ & Zapytanie znajdzie dokumenty zawierające oba słowa kluczowe. Może, ale nie musi być napisane. Na przykład zapytanie: informatyka i podręcznik jest równoważne podręcznikowi informatyki
LUB LUB | Wyszukuje te dokumenty, które używają jednego z podanych słów lub obu słów jednocześnie
NIE NIE-~ Wyszukiwanie jest ograniczone do dokumentów, które nie zawierają słowa określonego po operatorze
" " " " Cytaty podwójne lub pojedyncze pozwalają znaleźć frazę
data= data:data= Wyszukiwanie jest ograniczone do dokumentów, które mieszczą się w określonym przedziale dat Przykład 1. data waluty=01/02/2002-01/03/2002. To żądanie zwróci dokumenty zawierające słowo „waluta” i mające datę między 1 lutego 2002 a 1 marca 2002. Przykład 2. data=01/03/2002 waluta Przykład 3. data:<02/03/2002 валюта

Tabela 3.2

Lista serwerów wyszukiwania i katalogów

Adres zamieszkania Opis
www.excite.com Wyszukiwarka z recenzjami węzłów i przewodnikami
www.alta-vista.com Serwer wyszukiwania, dostępne zaawansowane możliwości wyszukiwania
www.hotbot.com serwer wyszukiwania
www.poland.net www.israil.net Regionalne serwery wyszukiwania Polski, Izraela
www.ifoseek.com Serwer wyszukiwania (łatwy w użyciu)
www.ipl.org Biblioteka Internet Publik, biblioteka publiczna działająca w ramach projektu World Village
www.wisewire.com WiseWire - organizacja wyszukiwania z wykorzystaniem sztucznej inteligencji
www.webcrawler.com WebCrawler - serwer wyszukiwania, łatwy w użyciu
www.yahoo.com Katalog internetowy i interfejs umożliwiający dostęp do wyszukiwania pełnotekstowego na serwerze AltaVista
www.aport.ru Aport - serwer wyszukiwania w języku rosyjskim
www.yandex.ru Yandex - rosyjskojęzyczny serwer wyszukiwania
www.wędrowiec.ru Rambler - rosyjskojęzyczny serwer wyszukiwania
Zasoby pomocy internetowej
www.żółty.com Internetowe żółte strony
mnich. nowa poczta.ru Wyszukiwarki o różnych profilach
www.top200.ru 200 najlepszych stron internetowych
www.allru.net
www.ru Katalog rosyjskich zasobów internetowych
www.allru.net/z09. htm Zasoby edukacyjne
www.studenci.ru Rosyjski serwer studencki
www.cdo.ru/index_new. żmija Centrum kształcenia na odległość
www.otwarte. ac. Wielka Brytania Otwarty Uniwersytet w Wielkiej Brytanii
www.ntu.edu Amerykański Uniwersytet Narodowy
www.tłumacz.ru Elektroniczny tłumacz tekstu
www.pomorsu.ru/przewodnik. biblioteka.html Lista linków do bibliotek sieciowych
www.library.ru Naukowa biblioteka elektroniczna
www.citforum.ru E-biblioteka
www.infamed.com/psy Testy psychologiczne
www.pokoleniye.ru Strona internetowa Federacji Edukacji Internetowej
www.metoda. ludzie.ru Zasoby edukacyjne
www.spb. www.osi.ru/ic/distant Kształcenie na odległość w Internecie
www.egzamin.ru Egzaminy i testy
www.kbsu.ru/~książka/ Podręcznik informatyki
Mega. km.ru Encyklopedie i słowniki

Wyszukiwanie informacji w Internecie: pułapki

Problemy, które nie leżą na powierzchni, często dają się odczuć dopiero „z perspektywy czasu”, po zakończeniu pewnego etapu prac poszukiwawczych i być może na podstawie ich wyników podjęto już jakąś decyzję. Co uniemożliwia uczynienie sytuacji transparentną od samego początku działania tego czy innego systemu wyszukiwania informacji (IPS)? Odpowiedź jest dość prosta: brak kompleksowych informacji tego typu ze strony dewelopera. Bezpośrednią konsekwencją tego jest nierzetelność otrzymywanych danych i ich niekontrolowana utrata. Rzadko zdarza się znaleźć w sieci wyszukiwarkę, która nie posiada pewnych „nieudokumentowanych” funkcji. Wydawałoby się, że użytkownik nie potrzebuje aż tylu informacji, a mianowicie:

jak zapełniana jest baza danych IPS i jaka jest jej objętość;

pełen zakres możliwości języka wyszukiwania systemu;

główne cechy prezentacji wyników wyszukiwania, przede wszystkim algorytm rankingu rekordów z listy odpowiedzi na zapytanie.

Niestety, źródłem takich informacji zwykle nie jest dokument dostępny ze strony głównej serwera wyszukiwania, ale publikacje poszczególnych autorów rozsiane po sieci, książki i czasopisma komputerowe. Powodem tego stanu rzeczy jest najwyraźniej nie tylko zaniedbanie dewelopera, ale także czynnik zwany polityką marketingową. Mówiąc najprościej, dostarczenie wyszukiwarce najpełniejszych informacji o sobie nie zawsze wpływa pozytywnie na jej ranking. Niemniej jednak w niektórych przypadkach użytkownik jest w stanie przejąć kontrolę nad sytuacją. Często za pomocą testów można poznać funkcje wybranej usługi wyszukiwania. Budowanie specjalnych zapytań testowych, które szybko wyjaśniają dokładnie ten aspekt działania systemu, który jest najważniejszy dla bieżącego zadania okazuje się w wielu przypadkach nietrywialny. Jak uniknąć niektórych kłopotów podczas pracy z IPS, poświęcimy naszą dyskusję. Jako przykłady ilustrujące prezentację zostaną wzięte pod uwagę powszechnie znane wyszukiwarki internetowe.