Wyszukiwanie informacji w Internecie

Internet rozwija się w bardzo szybkim tempie, więc znajdź niezbędne informacje wśród setek miliardów stron WWW i setek milionów plików staje się to coraz trudniejsze. Do wyszukiwania informacji wykorzystywane są specjalne wyszukiwarki, które zawierają stale aktualizowane informacje o lokalizacji stron WWW i plików na setkach milionów serwerów internetowych.

Wyszukiwarki zawierają pogrupowane tematycznie informacje o zasobach informacyjnych sieci WWW w bazach danych. Specjalne programy-roboty okresowo „omijają” internetowe serwery WWW, czytają wszystkie napotkane dokumenty, zaznaczają w nich słowa kluczowe i wpisują adresy internetowe dokumentów do bazy danych.

Większość wyszukiwarek umożliwia autorowi witryny internetowej wprowadzanie informacji do bazy danych poprzez wypełnienie formularza rejestracyjnego. W trakcie wypełniania ankiety deweloper strony wprowadza adres strony, jej nazwę, krótki opis zawartość witryny, a także słowa kluczowe, dzięki którym najłatwiej będzie znaleźć witrynę.

Szukanie słowa kluczowego. Wyszukiwanie dokumentu w bazie wyszukiwarki odbywa się poprzez wpisanie zapytań do pole wyszukiwania.

Żądanie musi zawierać jedno lub więcej słów kluczowych, które są głównymi słowami kluczowymi dla tego dokumentu. Na przykład, aby wyszukać same wyszukiwarki internetowe, możesz wpisać słowa kluczowe „ Rosyjski system szukaj informacji w Internecie ”(ryc. 6.21).

Jakiś czas po wysłaniu zapytania wyszukiwarka zwróci listę adresów internetowych dokumentów, w których znaleziono określone słowa kluczowe. Aby wyświetlić ten dokument w przeglądarce, wystarczy aktywować odsyłający do niego link (rys. 6.22).

Jeśli słowa kluczowe zostały wybrane bez powodzenia, to lista adresów dokumentów może być zbyt duża (może zawierać dziesiątki, a nawet setki tysięcy linków). Aby zawęzić listę, możesz wpisać dodatkowe słowa kluczowe w polu wyszukiwania lub skorzystać z katalogu wyszukiwarki.

Jedną z najbardziej kompletnych i potężnych wyszukiwarek jest Google (www.google.ru), która przechowuje w swojej bazie danych 8 miliardów stron internetowych, a co miesiąc roboty otwierają 5 milionów nowych stron. W Runecie (rosyjska część Internetu) obszerne bazy danych zawierające po 200 milionów dokumentów każda posiadają wyszukiwarki Yandex (www.yandex.ru) i Rambler (www.rambler.ru).

Szukaj w hierarchicznym systemie katalogów. W bazie danych wyszukiwarki witryny sieci Web są pogrupowane w hierarchiczne katalogi tematyczne, które są analogiczne do katalogu tematycznego w bibliotece.

Sekcje tematyczne najwyższego poziomu, na przykład: Internet, komputery, nauka i edukacja i tak dalej, zawierają katalogi zagnieżdżone. Na przykład katalog internetowy może zawierać podkatalogi Przeszukaj pocztę i inne (ryc. 6.23).

Wyszukiwanie informacji w katalogu sprowadza się do wybrania konkretnego katalogu, po czym użytkownikowi zostanie zaprezentowana lista linków do adresów internetowych najczęściej odwiedzanych i znaczących witryn sieci Web. Każdy link jest zwykle opatrzony adnotacją, czyli zawiera krótki komentarz do treści dokumentu.

Wyszukiwarka Aport (www.aport.ru) posiada najbardziej kompletny wielopoziomowy hierarchiczny katalog tematyczny rosyjskojęzycznych zasobów internetowych. Katalog zawiera szczegółową adnotację zawartości stron internetowych oraz wskazanie ich położenia geograficznego.

Wyszukiwanie plików. Do wyszukiwania plików na serwerach archiwów plików służą wyspecjalizowane wyszukiwarki, w tym wyszukiwarka FileSearch (www.filesearch.ru). Aby wyszukać plik, musisz wpisać nazwę pliku w polu wyszukiwania, a wyszukiwarka zwróci adresy internetowe serwerów archiwum plików, które przechowują plik o podanej nazwie.

Wyszukiwanie informacji w rosyjskojęzycznej części Internetu za pomocą większości wyszukiwarek: Google, Rambler, Aport, Applex i wyszukiwarki plików Research można wykonać za pomocą zintegrowanej wyszukiwarki Gogle.ru (ryc. 6.24). Aby to zrobić, po prostu wpisz słowa kluczowe w pasku wyszukiwania, użyj przełączników, aby ustawić rodzaj wymaganych informacji i kliknij przycisk z nazwą wyszukiwarki Gogle.ru (ryc. 6.24). Aby to zrobić, wystarczy wpisać słowa kluczowe w pasku wyszukiwania, za pomocą przełączników ustawić rodzaj wymaganych informacji i kliknąć przycisk z nazwą wyszukiwarki.


Ryż. 6.24. Zintegrowana wyszukiwarka Google.ru

Metody wyszukiwania w Internecie

Trzy sposoby wyszukiwania w Internecie

Internet w ogólności, aw szczególności sieć WWW, zapewnia abonentowi dostęp do tysięcy serwerów i milionów stron internetowych, które przechowują niewyobrażalną ilość informacji. Jak nie zgubić się w tym „oceanku informacji”? Aby to zrobić, musisz nauczyć się wyszukiwać i znajdować niezbędne informacje w sieci.

Jak już wspomniano, istnieją trzy główne sposoby wyszukiwania informacji w Internecie.

1. Określanie adresu strony. To jest najbardziej szybki sposób wyszukiwania, ale można go użyć tylko wtedy, gdy znany jest dokładny adres dokumentu.

2. Nawigacja przez hiperłącza. Jest to najmniej wygodna metoda, ponieważ może być używana do wyszukiwania dokumentów, które mają znaczenie tylko zbliżone do bieżącego dokumentu. Jeśli bieżący dokument jest poświęcony na przykład muzyce, to korzystając z hiperłączy tego dokumentu, trudno będzie uzyskać dostęp do strony poświęconej sportowi.

3. Dzwonię do serwera wyszukiwania wyszukiwarka) . Korzystanie z wyszukiwarek to najwygodniejszy sposób znajdowania informacji. Obecnie w rosyjskojęzycznej części Internetu popularne są następujące serwery wyszukiwania:

    Yandex;
    Wędrowiec;
    Aport.

Istnieją również inne wyszukiwarki. Na przykład, sprawny system wyszukiwanie zaimplementowane na serwerze usługi pocztowe poczta.ru.

Szukaj serwerów

Najbardziej dostępny i wygodny sposób wyszukiwania informacji w ogólnoświatowa sieć jest korzystanie z wyszukiwarek. Jednocześnie informacje można wyszukiwać według katalogów, a także zestawu słów kluczowych charakteryzujących przeszukiwany dokument tekstowy.

Rozważ bardziej szczegółowo użycie serwerów wyszukiwania. serwer wyszukiwania zawiera dużą liczbę linków do najbardziej różne dokumenty, a wszystkie te linki są zorganizowane w katalogi tematyczne. Na przykład: sport, kino, samochody, gry, nauka itp. Co więcej, te linki są ustawiane przez serwer niezależnie, w tryb automatyczny poprzez regularne przeglądanie wszystkich stron internetowych, które pojawiają się w sieci WWW. Ponadto serwery wyszukiwania zapewniają użytkownikowi możliwość wyszukiwania informacji według słów kluczowych. Po wprowadzeniu słów kluczowych serwer wyszukiwania rozpoczyna przeglądanie dokumentów na innych serwerach sieci Web i wyświetla łącza do tych dokumentów, w których znajdują się określone słowa. Zazwyczaj wyniki wyszukiwania są sortowane w porządku malejącym według specjalnej oceny dokumentu, która wskazuje, w jakim stopniu dany dokument spełnia kryteria wyszukiwania lub jak często jest wyświetlany w Internecie.

Język zapytań wyszukiwarki

Grupa słów kluczowych, utworzona według określonych zasad - przy użyciu języka zapytań, nazywana jest zapytaniem do serwera wyszukiwania. Języki zapytań dla różnych wyszukiwarek są bardzo podobne. Możesz dowiedzieć się więcej na ten temat, odwiedzając sekcję „Pomoc” żądanego serwera wyszukiwania. Rozważmy zasady generowania zapytań na przykładzie wyszukiwarki Yandex.

Składnia operatora Co oznacza operator Przykład zapytania
przestrzeń lub & Logiczne AND (w zdaniu) fizjoterapia
&& Logiczne AND (w dokumencie) przepisy kulinarne && (ser topiony)
| Logiczne OR zdjęcie | fotografia | migawka | obraz fotograficzny
+ Obowiązkowa obecność słowa w znalezionym dokumencie +być lub +nie być
() Grupowanie słów (technologia | produkcja) (ser | twarożek)
~ operator binarny I NIE (w zdaniu) banki ~ prawo
~~
lub
_
Binarny operator AND NOT (w dokumencie) Przewodnik po Paryżu ~~ (agencja | wycieczka)
/(nm) Odległość w słowach (minus (-) - wstecz, plus (+) - do przodu) dostawcy /2 muzyka do kawy /(-2 4) wakaty edukacyjne ~ /+1 studentów
" " Wyszukiwanie frazy „czerwony kapturek” Odpowiednik: czerwony / +1 kapturek
&&/(nm) Odległość w zdaniach (minus (-) - wstecz, plus (+) - do przodu) bank && /1 podatki

Pozyskać najwyższe wyniki szukaj, musisz pamiętać o kilku proste zasady:

    1. Nie szukaj informacji na temat tylko jednego słowa kluczowego.

    2. Najlepiej nie wprowadzać słów kluczowych wielkimi literami, ponieważ może to spowodować, że nie zostaną znalezione te same słowa zapisane małymi literami.

    3. Jeśli wyszukiwanie nie przyniosło żadnych wyników, sprawdź, czy są słowa kluczowe x błędy ortograficzne.

Nowoczesne wyszukiwarki zapewniają możliwość połączenia się z wygenerowanym żądaniem analizatora semantycznego. Za jego pomocą możesz, wpisując słowo, wybrać dokumenty, w których występują pochodne tego słowa w różnych przypadkach, czasach itp.

pytania testowe

1. Jak wyszukiwane są dokumenty według słów kluczowych? W systemie katalogowym?

Zadania do samorealizacji

6.8 Praktyczne zadanie. Porównaj wyniki wyszukiwania dokumentów według słów kluczowych przy użyciu różnych wyszukiwarek (użyj zintegrowanej wyszukiwarki Google).

6.9 Zadanie praktyczne. Wyszukaj na serwerach archiwum plików plik odtwarzacza multimedialnego WinAmp.

Mówią, że wszystko jest w Internecie. W rzeczywistości tak nie jest. Materiały do ​​publikowania w sieci są przygotowywane przez prawdziwych ludzi, dlatego można tam znaleźć tylko to, co uznają za konieczne do opublikowania. Jednak rzeka jest zasilana przez strumienie, a dzięki ich kreatywności w dzisiejszym Internecie powstało już około dwóch miliardów stron internetowych. W rezultacie katalogowanie zasobów dostępnych w sieci stało się poważnym problemem. Pomimo tego, że z problemem borykają się tysiące organizacji, nie tylko nie zbliża się on do rozwiązania, ale staje się coraz bardziej dotkliwy. Odsetek skatalogowanych zasobów systematycznie spada. W ostatnie lata ta jesień była katastrofalna. Jeśli więc w 1999 roku odsetek skatalogowanych zasobów zbliżył się do 40%, to już w następnym roku spadł do 25%.

Wniosek jest prosty: przestrzeń WWW zapełnia się szybciej niż jest usystematyzowana.

Niestety nie mamy powodu zakładać, że w najbliższej przyszłości wszystko może się zmienić na lepsze. W rezultacie wyszukiwanie informacji w Internecie można uznać za jedno z najtrudniejszych zadań.

Aby wyszukać interesujące Cię informacje, musisz podać przeglądarce adres strony internetowej, na której się ona znajduje. To najszybszy i najbardziej niezawodny rodzaj wyszukiwania. Do szybki dostęp do zasobu, wystarczy uruchomić przeglądarkę i wpisać adres strony w pasku adresu.

Adresy stron internetowych podawane są w specjalnych katalogach, publikacjach drukowanych, brzmią na antenie popularnych stacji radiowych oraz z ekranów telewizorów.

Jeśli nie znasz adresu, to do wyszukiwania informacji w Internecie są Wyszukiwarki, zawierające informacje o zasobach internetowych.

Każda wyszukiwarka to duża baza słów kluczowych związanych ze stronami internetowymi, na których się znajdują. Aby wyszukać adres serwera z interesującymi Cię informacjami, musisz w polu wyszukiwarki wpisać słowo kluczowe, kilka słów lub frazę. W ten sposób wysyłasz zapytanie do wyszukiwarki. Wyniki wyszukiwania są podawane jako lista adresów stron internetowych, na których występują te słowa.

Z reguły wyszukiwarki składają się z trzech części: robot, indeks i program do przetwarzania żądań.

Robot (Spider, Robot lub Bot) to program, który odwiedza strony internetowe i odczytuje (w całości lub w części) ich zawartość.

Roboty wyszukiwarek różnią się indywidualnym schematem analizy zawartości strony internetowej.

Indeks to magazyn danych, który zawiera kopie wszystkich stron odwiedzanych przez roboty.

Indeksy w każdej wyszukiwarce różnią się ilością i sposobem przechowywania informacji. Bazy danych czołowych wyszukiwarek przechowują informacje o dziesiątkach milionów dokumentów, a ich indeksy sięgają setek gigabajtów. Indeksy są okresowo aktualizowane i uzupełniane, dlatego wyniki pracy jednej wyszukiwarki z tym samym zapytaniem mogą się różnić, jeśli wyszukiwanie zostało wykonane w różnym czasie.

Procesor zapytań to program, który zgodnie z żądaniem użytkownika „przeszukuje” indeks w poszukiwaniu niezbędnych informacji i zwraca linki do znalezionych dokumentów.

Zbiór linków na wyjściu systemu jest dystrybuowany przez program w porządku malejącym od najwyższego stopnia dopasowania linku do żądania do najniższego.

W Rosji najpopularniejsze wyszukiwarki to:

  • Rambler (www.rambler.ru);
  • Yandex (www.yandex.ru);
  • Poczta (www.mail.ru).

Za granicą jest znacznie więcej wyszukiwarek. Najpopularniejsze to:

  • Alta Vista (www.altavista.com);
  • Szybkie wyszukiwanie (www.alltheweb.com);
  • Zorza polarna (www.northernlight.com).

Yandex jest prawdopodobnie najlepszą wyszukiwarką w rosyjskim Internecie. Baza ta zawiera około 200 000 serwerów i do 30 milionów dokumentów, które system skanuje w ciągu kilku sekund. Na przykładzie tego systemu pokażemy, jak wyszukiwane są informacje.

Wyszukiwanie informacji ustawia się wpisując słowo kluczowe w specjalnej ramce i naciskając przycisk „Znajdź” po prawej stronie ramki.

Wyniki wyszukiwania pojawiają się w ciągu kilku sekund i są uszeregowane według ważności - najważniejsze dokumenty są umieszczane na górze listy. W tym przypadku rangę znalezionego dokumentu określa miejsce w dokumencie, w którym znajduje się słowo kluczowe (jest ono ważniejsze w tytule dokumentu niż w jakimkolwiek innym miejscu) oraz liczba wzmianek o słowie kluczowym (znacznik więcej wzmianek, tym wyższa ranga).

Tym samym witryny znajdujące się na pierwszych miejscach na liście prowadzą nie merytorycznie, ale praktycznie pod względem częstotliwości wzmianek o słowie kluczowym. W związku z tym nie należy ograniczać się do przeglądania pierwszych dziesięciu stron proponowanych przez wyszukiwarkę.

Zawartość serwisu można pośrednio ocenić po krótkim opisie umieszczonym przez Wyszukiwarkę pod adresem Serwisu. Niektórzy pozbawieni skrupułów autorzy witryn, aby zwiększyć prawdopodobieństwo pojawienia się ich strony internetowej na pierwszych miejscach w wyszukiwarce, celowo umieszczają w dokumencie bezsensowne powtórzenia słowa kluczowego. Ale gdy tylko wyszukiwarka wykryje taki „zaśmiecony” dokument, automatycznie wyklucza go ze swojej bazy danych.

Nawet uszeregowana lista dokumentów oferowana przez wyszukiwarkę w odpowiedzi na kluczową frazę lub słowo może być niemal przytłaczająca. W związku z tym Yandex (podobnie jak inne potężne wyszukiwarki) umożliwia w ramach pierwszej listy wybór dokumentów, które dokładniej odzwierciedlają cel wyszukiwania, to znaczy doprecyzowanie lub ulepszenie wyników wyszukiwania. Na przykład lista 34 899 stron sieci Web na słowo kluczowe. Wpisanie kwalifikującego słowa kluczowego w poleceniu „Wyszukaj w znalezionych” zmniejsza listę do 750 stron, a wprowadzenie innego kwalifikującego słowa w tym poleceniu zmniejsza listę do 130 stron sieci Web.

Katalogi wyszukiwania to systematyczny zbiór (wybór) linków do innych zasobów internetowych. Linki są zorganizowane jako rubrykator tematyczny, n reprezentująca strukturę hierarchiczną, po której można znaleźć potrzebne informacje.

Weźmy jako przykład strukturę katalogu internetowego wyszukiwania Yandex.

Jest to katalog ogólnego przeznaczenia, ponieważ zawiera łącza do zasobów internetowych w prawie wszystkich możliwych kierunkach. Ten katalog zawiera następujące elementy Tematy:

  • Biznes i Ekonomia;
  • Społeczeństwo i polityka;
  • Nauka i edukacja;
  • Komputery i komunikacja;
  • Podręczniki i linki;
  • Dom i rodzina;
  • Rozrywka i rekreacja;
  • Kultura i sztuka.

Każdy temat zawiera wiele podrozdziały , a one z kolei zawierają nagłówki itp.

Załóżmy, że przygotowujesz wydarzenie na Dzień Zwycięstwa i chcesz poszukać w Internecie słów słynnej piosenki wojskowej Bułata Okudżawy „Słyszysz dudnienie butów”. Wyszukiwanie można zorganizować w następujący sposób:

Yandex > Katalog > Kultura i sztuka > Muzyka > Piosenka autorska

Ta metoda wyszukiwania jest dość szybka i wydajna. Na koniec masz tylko kilka linków, wśród których znajdują się linki do stron z piosenkami znanych bardów. Pozostaje tylko znaleźć na stronie archiwum z tekstami B. Okudżawy i wybrać w nim żądany tekst.

Inny przykład. Załóżmy, że zamierzasz kupić telefon komórkowy i chcesz porównać cechy urządzeń różnych firm. Poszukiwania można przeprowadzić pod następującymi nagłówkami katalogu:.

Yandex > Katalog > Komputery i komunikacja > połączenie mobilne> Telefony komórkowe

Po otrzymaniu Limitowana ilość linki, możesz szybko je przeglądać i wybierać telefon, badając charakterystykę firm i modyfikacje urządzeń.

Większość wyszukiwarek ma możliwość wyszukiwania według słów kluczowych. To jeden z najczęstszych typów wyszukiwania.

Aby wyszukiwać według słów kluczowych, musisz wpisać słowo lub kilka słów do wyszukania w specjalnym oknie i kliknąć przycisk Znajdź.

Wyszukiwarka odnajdzie w swojej bazie i pokaże dokumenty zawierające te słowa. Takich dokumentów może być wiele, ale wiele w tym przypadku niekoniecznie oznacza dobre.

Przeprowadźmy kilka eksperymentów z dowolną wyszukiwarką. Załóżmy, że postanawiamy założyć akwarium i interesują nas wszelkie informacje na ten temat. Na pierwszy rzut oka najprostszą rzeczą jest wyszukanie słowa „akwarium”. Sprawdźmy to na przykład w wyszukiwarce Yandex. Wynik wyszukiwania będzie duża ilość strony - ogromna liczba linków. Co więcej, jeśli przyjrzysz się bliżej, wśród nich znajdą się strony, które wspominają o grupie B. Grebenshchikov's Aquarium, centra handlowe i nieformalne stowarzyszenia o tej samej nazwie, i wiele więcej, które nie mają nic wspólnego z rybami akwariowymi.

Łatwo się domyślić, że takie wyszukiwanie nie zadowoli nawet bezpretensjonalnego użytkownika. Zbyt wiele czasu trzeba będzie poświęcić na wybór spośród wszystkich proponowanych dokumentów tych, które dotyczą interesującej nas tematyki, a tym bardziej na zapoznanie się z ich treścią.

Można od razu dojść do wniosku, że zwykle nie jest wskazane wyszukiwanie po jednym słowie, ponieważ bardzo trudno jest określić temat dokumentu, strony internetowej lub witryny po jednym słowie. Wyjątkiem są rzadkie słowa i terminy, które prawie nigdy nie są używane poza ich obszarem tematycznym.

Mając określony zestaw najczęściej używanych terminów w żądanym obszarze, możesz skorzystać z wyszukiwania zaawansowanego. Na ryc. wyświetlane jest okno wyszukiwania zaawansowanego w wyszukiwarce Yandex. W tym trybie możliwości języka zapytań są implementowane w postaci formularza. Podobną usługę, w tym filtry słownikowe, oferują prawie wszystkie wyszukiwarki.

Spróbujmy wyjaśnić warunki wyszukiwania i wpisz frazę „ryba akwariowa”. Liczba linków zmniejszy się ponad 20-krotnie. Ten wynik bardziej nam odpowiada, ale mimo wszystko wśród proponowanych linków można spotkać na przykład rosyjskie pamiątkowe zestawy etykiet zapałek z wizerunkami ryb, kolekcje wygaszaczy ekranu komputera stacjonarnego oraz katalogi ryb akwariowych ze zdjęciami i akwarium sklepy z akcesoriami. Oczywistym jest, że powinniśmy nadal iść w kierunku udoskonalania warunków poszukiwań.

Aby wyszukiwanie było bardziej produktywne, wszystkie wyszukiwarki mają specjalną język zapytań z własną składnią. Te języki są podobne pod wieloma względami. Nauka ich wszystkich jest dość trudna, ale każda wyszukiwarka ma system pomocy, który pozwoli ci opanować pożądany język.

Oto kilka prostych zasad generowania zapytania w wyszukiwarce Yandex.

Słowa kluczowe w zapytaniu należy pisać małymi (małymi) literami.

Zapewni to wyszukiwanie wszystkich słów kluczowych, a nie tylko tych, które zaczynają się od wielkiej litery.

Wyszukiwanie uwzględnia wszystkie formy słowa zgodnie z zasadami języka rosyjskiego, niezależnie od formy słowa w zapytaniu.

Na przykład, jeśli w zapytaniu podano słowo „wiem”, to słowa „wiedzieć”, „wiem” itd. również spełnią warunek wyszukiwania.

Aby wyszukać stabilną frazę, umieść słowa w cudzysłowie.

Na przykład „naczynia porcelanowe”.

Aby wyszukiwać według dokładnej formy słowa, przed słowem należy umieścić wykrzyknik.

Na przykład, aby wyszukać słowo „wrzesień” w przypadku dopełniacza, należy napisać „!wrzesień”.

Aby wyszukiwać w obrębie jednego zdania, słowa w zapytaniu są oddzielone spacją lub znakiem &

Na przykład „powieść przygodowa” lub „powieść przygodowa”. Kilka słów wpisanych w zapytaniu, oddzielonych spacjami, oznacza, że ​​wszystkie muszą znaleźć się w jednym zdaniu szukanego dokumentu.

Jeśli chcesz wybrać tylko te dokumenty, w których występuje każde słowo podane w zapytaniu, umieść znak plus "+" przed każdym z nich. Jeśli wręcz przeciwnie, chcesz wykluczyć jakiekolwiek słowa z wyników wyszukiwania, umieść minus „-” przed tym słowem. Znaki „+” i „-” należy pisać ze spacją od poprzedniego i razem z następnym słowem.

Na przykład zapytanie „samochód-Wołga” spowoduje wyszukanie dokumentów zawierających słowo „Wołga”, a nie słowo „samochód”.

Podczas wyszukiwania synonimów lub słów o zbliżonym znaczeniu możesz umieścić pionową kreskę „|” między słowami.

Na przykład dla zapytania „dziecko | dzieciak | dziecko” znajdzie dokumenty z którymkolwiek z tych słów.

Zamiast pojedynczego słowa w zapytaniu możesz podstawić całe wyrażenie. Aby to zrobić, musisz wziąć to w nawiasy

Na przykład „(dziecko | niemowlę | dzieci | niemowlę) + (opieka | edukacja)”.

Znak „~” (tylda) umożliwia wyszukiwanie dokumentów ze zdaniem zawierającym pierwsze słowo, ale nie zawierającym drugiego.

Na przykład wyszukiwanie „książki ~ sklep” spowoduje znalezienie wszystkich dokumentów zawierających słowo „książki”, które nie mają obok (w zdaniu) słowa „sklep”.

Jeśli operator zostanie powtórzony raz (na przykład & lub ~), wyszukiwanie odbywa się w obrębie zdania. Podwójny operator (&&,~~) przeszukuje dokument.

Na przykład wyszukiwanie „rak ~~ astrologia” spowoduje znalezienie dokumentów zawierających słowo „rak”, które nie są związane z astrologią.

Wróćmy do przykładu z rybami akwariowymi. Po przeczytaniu kilku dokumentów oferowanych przez wyszukiwarkę staje się jasne, że wyszukiwanie informacji w Internecie nie powinno zaczynać się od wyboru ryb akwariowych. Akwarium to złożony system biologiczny, którego stworzenie i utrzymanie wymaga szczególnej wiedzy, czasu i poważnych inwestycji.

Na podstawie otrzymanych informacji osoba dokonująca wyszukiwania w Internecie może radykalnie zmienić strategię dalszych poszukiwań, decydując się na zapoznanie się z literaturą specjalistyczną związaną z badanym zagadnieniem.

Aby wyszukać literaturę lub dokumenty pełnotekstowe, możliwe jest następujące zapytanie:

"+ (akwarium | akwarysta | akwarysta) + dla początkujących + (porady | literatura) + (artykuł | praca dyplomowa | pełny tekst) - (cena | sklep | dostawa | katalog)".

Po przetworzeniu zapytania przez wyszukiwarkę wynik był bardzo udany. Już pierwsze linki prowadzą do wymaganych dokumentów.

Teraz możesz podsumować wyniki wyszukiwania, wyciągnąć pewne wnioski i zdecydować o możliwych działaniach:

  • Zatrzymaj dalsze poszukiwania, ponieważ z różnych powodów utrzymanie akwarium jest poza twoją mocą.
  • Przeczytaj proponowane artykuły i przystąp do aranżacji akwarium.
  • Szukaj materiałów o chomikach lub papużkach falistych.
  1. Jaki rodzaj wyszukiwania jest najszybszy i najbardziej niezawodny?
  2. Gdzie użytkownik może znaleźć adresy stron WWW?
  3. Jaki jest główny cel wyszukiwarki?
  4. Jakie są części wyszukiwarki?
  5. Jakie znasz wyszukiwarki?
  6. Jaka jest technologia wyszukiwania według rubryk w wyszukiwarce?
  7. Co to jest technologia wyszukiwania słów kluczowych?
  8. Kiedy należy użyć + lub - w swoich kryteriach wyszukiwania?
  9. Jakie kryteria wyszukiwania w Yandex określa następująca fraza:

    (niania|wychowawca|guwernantka)++(opieka|edukacja|nadzór) ?

  10. Co oznacza podwojenie znaku (~~ lub ++) podczas tworzenia złożonego zapytania?

Ćwiczenie.

Zadanie 1. Wyszukiwanie w katalogach.

Skorzystaj z katalogu wyszukiwarki, aby znaleźć następujące informacje (zgodnie z zaleceniami nauczyciela):

  1. Słowa piosenki popularnej grupy muzycznej
  2. Repertuar Teatru Maryjskiego na bieżący tydzień
  3. Charakterystyka Najnowszy model telefon komórkowy znana firma (do wyboru)
  4. Przepis na barszcz ukraiński z kluskami
  5. Długoterminowa prognoza pogody w Twojej okolicy (co najmniej 10 dni)
  6. Zdjęcie Twojego ulubionego współczesnego artysty muzycznego
  7. Przybliżony koszt komputer multimedialny(Cena £)
  8. Informacje o wolnych stanowiskach na stanowisko sekretarza w Twoim regionie lub mieście
  9. Horoskop Twojego znaku zodiaku na bieżący dzień

Na podstawie wyników wyszukiwania sporządź pisemny raport w programie Word: zaprezentuj znaleziony, skopiowany i sformatowany materiał w dokumencie. Przedstaw raport nauczycielowi.

Zadanie 2. Formowanie prośby o dokładny tytuł lub cytat.

Znasz dokładny tytuł dokumentu, np. „Wymagania higieniczne dla komputerów osobistych i organizacja pracy”. Sformułuj zapytanie, aby wyszukać w Internecie pełny tekst dokumentu.

Zapisz wynik wyszukiwania w swoim folderze. Przedstaw nauczycielowi.

Zadanie 3. Tworzenie złożonych zapytań.

  • W dowolnej wyszukiwarce złóż prośbę o wyszukanie informacji o rosyjskiej łaźni. Wyeliminuj oferty usług, reklamy akcesoriów łazienkowych i inne reklamy. Skoncentruj swoje poszukiwania na wpływie rosyjskiej łaźni na organizm.
  • Skomponuj złożone zapytanie, aby wyszukać informacje na temat opieki nad kotami domowymi. Wyklucz z wyszukiwania duże koty (takie jak lwy), a także oferty kupna, sprzedaży, zdjęcia do tapet itp.
  • Wypełnij tekst prośby i wynik wyszukiwania w programie Word i przedstaw go nauczycielowi.
Zadanie 4. Wyszukiwanie tematyczne.

W każdy znany Ci sposób szukaj w Internecie informacji o historii technologii komputerowej. Szukaj w różnych kierunkach: oprawa historyczna, technologia, osobowości. Przedstaw wyniki wyszukiwania w formie prezentacji. Użyj wieloetapowego spisu treści w postaci hiperłączy w swojej prezentacji.

Problem poszukiwania i środków jego organizacji

Gigantyczna i wciąż rosnąca ilość informacji dostępnych w Internecie, m.in. operacyjny, sprawia, że ​​problem ze znalezieniem niezbędnych informacji jest bardzo istotny i złożony. Szybkość wyszukiwania potrzebnych informacji determinuje w dużej mierze profesjonalizm internauty. Warto powiedzieć, że aby zautomatyzować -te zadanie, różne, zarówno obce, jak i systemy domowe wyszukiwania, które są stronami internetowymi specjalnego rodzaju. Jednocześnie, mimo obecności licznych narzędzi do automatyzacji wyszukiwania, zadanie to pozostaje dość pracochłonne, wymagające od użytkownika pewnego doświadczenia, intuicji i znajomości terminologii stosowanej w jego obszarze tematycznym.

Według szacunków opublikowanych w czasopiśmie Nature 8 lipca 1999 r. liczba publicznie zindeksowanych stron internetowych wyniosła 800 milionów. Rok później autor badania (Steve Lawrence z Instytutu Badawczego NEC) uważał, że ich liczba prawie się podwoiła. do 1,5 miliarda. Nawet najlepsze wyszukiwarki indeksują nie więcej niż jedną stronę na sześć. Warto powiedzieć, że w celu wydobycia przydatna informacja z Internetu, musisz wiedzieć, gdzie i jak szukać.

Narzędzie wyszukiwania przeglądarki Internet Explorer upraszcza dostęp do narzędzi wyszukiwania, eliminując potrzebę znajomości adresów wyszukiwarek. W takim przypadku lepiej jest skontaktować się bezpośrednio z wyszukiwarkami, ładując stronę ϲᴏᴏᴛʙᴇᴛϲᴛʙ.

Zgodnie ze sposobem organizacji wyszukiwania i udostępnionymi możliwościami wszystkie narzędzia wyszukiwania można warunkowo podzielić na następujące grupy:

katalogi i specjalistyczne bazy danych;

Wyszukiwarki;

systemy metawyszukiwania.

Katalogi i bazy danych

Katalogi w sieci WWW są podobne do systematycznych katalogów bibliotecznych. Przeszukiwanie katalogów polega na sekwencyjnym poruszaniu się po hierarchicznej liście łączy zwanych nagłówkami lub kategoriami. Pierwsza strona katalogu zawiera linki do głównych tematów, takich jak kultura i sztuka; Medycyna i zdrowie; Społeczeństwo i polityka; Biznes i Ekonomia; Rozrywka itp. Kliknięcie na link ϲᴏᴏᴛʙᴇᴛϲᴛʙ (kategoria) otwiera stronę zawierającą linki wyszczególniające wybrany temat (rubryka) Przesuwając się w dół kategorii szczegółowych, można znaleźć stronę z żądanymi informacjami. Na każdej stronie, która otwiera się podczas poruszania się po katalogu w taki czy inny sposób, wskazana jest kolejność przeglądanych nagłówków zagnieżdżonych, na przykład Business World: Finance: Analytics itp.

Wszystkie katalogi są tworzone i aktualizowane ręcznie przez specjalistów, w taki sam sposób, w jaki bibliografowie kompilują i utrzymują katalogi biblioteczne. Należy zauważyć, że opis dokumentu jest wykonywany albo przez kompilatorów katalogu, albo przez autora. Dzięki ϶ᴛᴏmu zawartość stron zawartych w katalogu jest najbardziej adekwatna do nagłówka, do którego są przypisane. Jednak biorąc pod uwagę szybkość uzupełniania i zmiany informacji w Internecie, „ręczna” metoda utrzymywania katalogów nie pozwala w równym stopniu odzwierciedlać rzeczywistego stanu zasobów internetowych na ten temat.

Wyszukiwarki

(Wyszukiwarki, wyszukiwarki, roboty wyszukiwania)

Istnieją dziesiątki dużych i tysiące małych i wyspecjalizowanych witryn internetowych poświęconych wyszukiwaniu w Internecie. Narzędzia wyszukiwania z grupy pozwolą użytkownikowi na formułowanie wymagań dla potrzebnych mu informacji według określonych zasad (utworzenie zapytania przy użyciu języka zapytań) » wyszukiwarka, ϲᴏᴏᴛʙᴇᴛʙᴇᴛϲᴛʙ przestrzeganie wymagań zdefiniowanych przez użytkownika (istotnych dla zapytania) Wyszukiwanie węzły mogą korzystać z własnych indeksów internetowych, stale aktualizowanych przez specjalne programy zwane pająkami (pająkami) Program pająk bada sieć, sprawdzając każdy link na danej stronie, następnie na stronach zaadresowanych linków itp. i informuje właściciela o wszystkich stronach późniejsze indeksowanie.

W wyniku wyszukiwania powstaje jedna lub więcej stron zawierających linki do dokumentów (stron WWW) istotnych dla zapytania.Warto powiedzieć, że dla każdego linku, data utworzenia dokumentu, jego objętość, stopień trafności do zapytania zwykle wskazuje się również fragmenty tekstu charakteryzujące treść dokumentu. Kliknięcie takiego linku umożliwia pobranie interesującej Cię strony. W przypadku bardzo dużej liczby znalezionych dokumentów można zawęzić zapytanie i w ϲᴏᴏᴛʙᴇᴛϲᴛʙ i powtórzyć z nim wyszukiwanie, ale tylko wśród wybranych stron (takie wyszukiwanie jest różnie wywoływane na różnych maszynach, ale zwykle ϶ᴛᴏ - szukaj w znalezionej) W wielu wyszukiwarkach możesz użyć określonej metody, aby zmienić link do strony, której treść najlepiej odpowiada Twoim potrzebom, i powtórzyć wyszukiwanie, wymagając wyszukania podobnych.

Zaletą automatycznego wyszukiwania jest tak naprawdę to, że daje wgląd w bardzo duże ilości informacji dostępnych w Internecie w ten moment. Jednocześnie złożoność dokładnego opisu żądania, który adekwatnie odzwierciedla Twoje potrzeby informacyjne, a także jeszcze większa złożoność zadania automatycznego określania stopnia Twojego żądania przeglądanych stron, prowadzi do tego, że liczba stron wybieranych „przy pierwszym uruchomieniu” jest tradycyjnie albo bardzo mała, albo nadmiernie duża . Ogólnie rzecz biorąc, wyszukiwanie za pomocą wyszukiwarki jest procesem iteracyjnym (wieloprzejściowym), w wyniku którego forma zapytania jest stopniowo udoskonalana.

Metawyszukiwarki

Jak wspomniano powyżej, każda wyszukiwarka przegląda określony zestaw serwerów i wybiera dokumenty w ϲᴏᴏᴛʙᴇᴛϲᴛʙii według własnych kryteriów. W rezultacie wyszukiwanie w różnych systemach tych samych słów kluczowych daje różne wyniki. To zrodziło pomysł stworzenia tzw. systemów metasearch (lub multisearch), które same niczego nie wyszukują, ale zwracają się o pomoc do kilku wyszukiwarek jednocześnie. Zauważ, że każda z wyszukiwarek ma ϲʙᴏ-ty język zapytań. System tłumaczy zapytanie sformułowane w jego języku na języki zapytań używane przez każdą wyszukiwarkę. Ponadto wyniki wyszukiwania według wszystkich systemów są łączone i prezentowane w formie ϲᴏᴏᴛʙᴇᴛϲᴛʙ. Oczywiście wyszukiwanie za pomocą metasearcherów trwa dłużej niż konwencjonalne wyszukiwarki.

Przegląd najpopularniejszych wyszukiwarek

W Internecie istnieje duża liczba wyszukiwarek, a każdy użytkownik kieruje się tą, do której jest przyzwyczajony lub do której doradzali mu koledzy. Posłużymy się krótkim opisem najpopularniejszych wyszukiwarek, który znajduje się na jednej z witryn.

1. Google (www.google.com) Najszybsza i największa wyszukiwarka. Zaindeksowano ponad 1,3 miliarda stron (z czego nieco ponad 700 milionów to w całości, o reszcie znany jest tylko adres i tekst linku). Możesz uwzględnić/wykluczyć wyniki z określonych witryn i/lub domen. W przeciwieństwie do większości wyszukiwarek Google ocenia popularność zasobu na podstawie liczby linków prowadzących do niego z innych stron. Istnieje wyszukiwanie tematyczne - Apple Macintosh, BSD UNIX, Linux, wyszukiwanie rządowe i uniwersyteckie - wyszukiwanie w zasobach wiodących instytucji naukowych i edukacyjnych.

2. Yandex (www.yandex.ru) Najlepsza wyszukiwarka produkowana w kraju. Indeksuje głównie zasoby rosyjskojęzyczne, podczas gdy ϶ᴛᴏm pod względem możliwości nie ustępuje systemom zagranicznym. Wyszukiwanie można przeprowadzić dokładnie lub w dowolnych formach słownych, ograniczonych datą, wskazującą witrynę lub jej podkatalog. Możesz wyszukiwać na podstawie tzw. indeksu cytowań, wyszukiwać obrazy, skrypty, aplety; ustaw język dokumentu. Niezbędne linki tradycyjnie znajdują się w pierwszych dziesięciu wynikach. Ma wersję „lite” (z minimum elementów projektu) na http://www.ya.ru.

3. AltaVista (www.altavista.com) Zapewnia duże rozszerzenie kryteriów wyszukiwania: w Wyszukiwaniu zaawansowanym do wyboru przedział czasowy, który zawiera datę utworzenia lub modyfikacji zasobu, obsługa 25 języków; istnieje możliwość wydania jednego wyniku na stronę (϶ᴛᴏ zawęża krąg wyszukiwania bez utraty jakości) Wyszukiwanie zaawansowane ma standardowy zestaw funkcji. Do niedawna AV był dużym portalem, ale ze względów finansowych (i nie tylko) znacznie ograniczył liczbę usług.

4 Yahoo! (www.yahoo.com) Należy zauważyć, że jest to jedna z pierwszych wyszukiwarek w Internecie. Oprócz standardowy zestaw funkcje, umożliwia wybór zasobów według daty (4 lata, 1, 3, 6 miesięcy, tydzień, 1, 3 dni) Obsługuje możliwość określenia znaku „*” zamiast dowolnej sekwencji znaków w słowach kluczowych. Na Yahoo! opracowano obszerny, ustrukturyzowany katalog kategorii (kategorii), w których najpierw dokonuje się wyszukiwania, następnie we własnym archiwum, a następnie – za pomocą Systemy Google. Wyszukiwanie w kategoriach daje dobre wyniki - jest ich niewiele i są dobre.

5. Lycos (www.lycos.com) Ostatnio jeden z najpopularniejszych systemów. Przy tym wszystkim nie zapewnia żadnych specjalnych funkcji - „ORAZ” „LUB”, wyszukiwanie fraz, obowiązkowa obecność / brak słowa; w zaawansowanych funkcjach - wyszukiwanie w tytule, adresie URL, nazwie hosta i/lub nazwie domeny; 25 języków, w tym rosyjski - jednym słowem cały "ogólnie przyjęty" zestaw. Możesz określić typ zawartości zasobu - auto, książki, ftp, pobieranie, wiadomości itp. Oczywiście popularność Lycos jest konsekwencją skali ósmego dużego projektu.

6. Rambler (www.rambler.ru) Do niedawna najsłynniejsza rosyjska wyszukiwarka. Wyszukiwanie zaawansowane nie pozwala na wyszukiwanie fraz, a zwykłe wyszukiwanie do lutego 1999 rzadko dawało akceptowalne wyniki. Od lutego system ϶ᴛᴏ korzysta z ulepszonej wyszukiwarki, zmienił się wygląd, ale Rambler nadal nie dorównuje jakościowo (według autora analizującego wyszukiwarki) źródłom informacji statystycznych o projektach internetowych Yandexowi i Aportowi.

7. Aport (www.aport.ru) Kolejna dobra rosyjska wyszukiwarka. Wyszukiwanie odbywa się za pomocą tekstu (tylko we wszystkich formach słów) i adresu URL, używając operatory logiczne i operator „…” (jednak słowa stop w wyrażeniu są nadal ignorowane), według daty i w osobnych polach (tytuł, opis itp.), metaznaki * i! Prezentacja wyników wyszukiwania jest najlepiej zaprojektowana w porównaniu z innymi rosyjskimi wyszukiwarkami. Pewne wątpliwości budzi projekt strony głównej, która jest wyraźnie przeładowana informacjami. Na http://aport.ru dostępna jest nieco „lżejsza” wersja.

Jak wybrać wyszukiwarkę

Podczas przeszukiwania Internetu ważne są dwa elementy - kompletność (nic nie zostało utracone) i dokładność (nic dodatkowego nie znaleziono).

1. Pokrycie i głębokość

Pokrycie odnosi się do objętości bazy danych wyszukiwarki, która jest mierzona trzema wskaźnikami – łączną objętością zindeksowanych informacji, liczbą unikalnych serwerów oraz liczbą unikalnych dokumentów. Głębokość rozumiana jest jako to, czy na jednym serwerze istnieje limit liczby stron lub głębokość zagnieżdżenia katalogów.

Jak sprawdzić: Niektóre maszyny zapisują statystyki robotów na tej stronie. Ale możesz to sprawdzić sam - musisz zapytać o kilka Zapytania, składający się z jednego słowa (ɥᴛᴏ aby wykluczyć wpływ języka zapytań, w tym różne interpretacje spacji), a gdy ϶ᴛᴏm spojrzeć na statystyki wyników wydawanych przez maszynę - zwykle na początku listy jest to wskazane ile w sumie znaleziono dokumentów. Oprócz tego, że słowa powinny pochodzić z różnych dziedzin, dobrze jest również wziąć słowa o różnej wadze - rzadkie, "średnie" i "ciężkie" (częstotliwość) i porównać liczbę znalezionych. W szczególności ciężkie słowa testują pełny tekst (indeksowanie wszystkich słów w dokumencie) wyszukiwarki.

Trudniej jest sprawdzić głębokość chodu robota – na ϶ᴛᴏ trzeba wziąć niektóre strony, np. o rozgałęzionej strukturze archiwum, i sprawdzić, czy dokumenty są indeksowane, do których można dotrzeć tylko np. w 6 kliknięć w linki.

2. Szybkość indeksowania i trafność linków

Szybkość przeglądania sieci wskazuje, jak szybko nowo dodany zasób jest indeksowany i jak szybko aktualizowane są informacje w bazie danych. Nie zapominaj, że ważnym wskaźnikiem jakości wyszukiwarki (jej robota) będzie nie tylko zdobywanie nowych terytoriów, ale także monitorowanie stanu już objętych. Serwery znikają i pozostają, strony na nich są aktualizowane. Linki, które podaje wyszukiwarka na liście znalezionych, muszą po pierwsze istnieć, a po drugie ich treść musi być zgodna z zapytaniem.

Jak sprawdzić: Obiektywne informacje można uzyskać analizując logi serwera - robot wyszukiwarki jest zwykle reprezentowany przez nazwę jego maszyny (lub podobną), dzięki czemu można zobaczyć, jak często odwiedza serwer, ile stron przegląda, itp. Niestety, zwykle dziennik tylko ϲʙᴏ jego strony jest dostępny do badań, więc metoda eksperymentalna pozostaje.

Aby określić szybkość indeksowania, musisz gdzieś utworzyć stronę tekstu, dodać ją do wyszukiwarek i zobaczyć, jak szybko zacznie się pojawiać. Lub zmień istniejącą stronę. Warto powiedzieć, że aby określić trafność linków, sprawdź dokumenty przynajmniej na pierwszej stronie listy znalezionej dla kilku zapytań. Wiadomość nie znaleziono wskazuje, że dokument już nie istnieje.

3. Jakość wyszukiwania (wskaźnik subiektywny)

Warto powiedzieć, że każda wyszukiwarka ma ϲʙᴏ i algorytm sortowania wyników wyszukiwania. Im bliżej góry listy znajduje się dokument, którego potrzebujesz, tym lepiej działa trafność.

Jak sprawdzić: Tylko eksperymentalnie. Dla porównania zaleca się składanie wniosków o różnych długościach. Możesz również użyć języka zapytań, natomiast osoby, które niechętnie czytają opis, mogą skorzystać z rozszerzonej strony zapytań („wyszukiwanie zaawansowane” w Aport i Yandex, „zapytanie szczegółowe” w Rambler - opcje tłumaczenia na rosyjski „wyszukiwanie zaawansowane”)

Oprócz trafności istnieją ważne cechy użytkownika.

4. Szybkość wyszukiwania

Jeśli wyszukiwarka reaguje powoli, praca z nią jest nieefektywna. Warto dodać, że prędkość, jaką widzi użytkownik, zależy nie tylko od samej wyszukiwarki, ale także od kanałów internetowych.

Jak sprawdzić: Eksperymentuj - musisz szukać żądań o różnych długościach, różnych<тяжести>słowa i o różnych porach dnia (obciążenie serwera jest znacznie nierównomierne w ciągu dnia, szczyt to około trzeciej do czwartej po południu)

5. Możliwości wyszukiwania (praca z językiem dokumentu, językiem zapytań)

Kolejnym punktem porównania jest to, co dokładnie iw jaki sposób wyszukiwarka wnosi do indeksu. Warto powiedzieć - wyszukiwarka pełnotekstowa indeksuje wszystkie wyrazy tekstu widoczne dla użytkownika. Obecność morfologii umożliwia znalezienie szukanych słów we wszystkich deklinacjach lub koniugacjach. Oprócz ϶ᴛᴏgo, in język HTML istnieją tagi, które mogą być również przetwarzane przez wyszukiwarkę (tytuły, linki, podpisy obrazów itp.)

Prawie wszystkie maszyny mają język zapytań w postaci standardowych operatorów logicznych (AND, OR, NOT). Niektórzy potrafią wyszukiwać frazy lub słowa z określonej odległości - ϶ᴛᴏ jest często ważne, aby uzyskać rozsądny wynik. Dodatkową funkcją będzie wyszukiwanie w strefach dokumentów - nagłówki, linki, słowa kluczowe (META KEYWORDS) itp. Dodatkowa funkcja język zapytań - zapytanie w języku naturalnym, które nie wymaga znajomości operatorów.

Jak sprawdzić: Zazwyczaj te informacje są publikowane na serwerze wyszukiwarki (w Pomocy "e). Pamiętaj, że mimo to zaleca się sprawdzanie prawdziwych zapytań, ponieważ czasami to, co chcesz, jest podawane jako prawidłowe.

6. Dodatkowe udogodnienia

Są to dodatkowe funkcje, które wyszukiwarka udostępnia użytkownikom. Obejmuje to wszelkiego rodzaju opcje wyszukiwania (wyspecjalizowane strony, wyszukiwanie podobnych dokumentów, ograniczenie zakresu wyszukiwania) oraz listę znalezionych serwerów, wyszukiwanie według dat i serwerów oraz Przyjazny dla użytkownika interfejs wyszukiwarkę i możliwość jej personalizacji.

Jak sprawdzić: Informacje mogą być częściowo publikowane na serwerze wyszukiwarki, ale najlepiej spróbować samemu pracować z tymi funkcjami.

Oczywiste jest, że ta analiza zajmie trochę czasu. Poza tym wyszukiwarki, podobnie jak reszta Internetu, nie stoją w miejscu. Jednocześnie, biorąc pod uwagę, że wyszukiwanie informacji jest jednym z ważnych elementów technologia komputerowa, ϶ᴛᴏ należy poświęcić wystarczającą uwagę – przynajmniej nie mniejszą niż umiejętność pracy w sieci lokalnej.

Na Yandex.ru przeprowadzono ankietę: dlaczego Internet jest potrzebny, a czego mu brakuje (http://www.yandex.ru/polling/9.html) W porządku malejącym dane z ankiety były dystrybuowane w następujący sposób: Internet jest używany jako punkt odniesienia (23 76%), narzędzie badawcze (15,45%), rozrywka (14,15%), a dopiero na czwartym miejscu źródło wiadomości (12,32%) To brzmiało optymistycznie, że 10% użytkowników zawsze, a 73% często sukces znaleźć potrzebne informacje. Czego brakuje w Internecie: informacji, dobrego wyszukiwania i porządku (w tym: uporządkowania, struktury, struktury, struktury, strukturyzacji, a także systemu, systematyzacji, systematyzacji, systematyczności i systematyzacji)

ODPOWIEDZ NA PYTANIA:

Jakie są metody organizowania wyszukiwań w Internecie?

Jak wyszukiwane są informacje w katalogach i bazach danych?

W jaki sposób wprowadzane są informacje do katalogów i baz danych?

Co to są wyszukiwarki internetowe?

Jak powstaje baza informacji w wyszukiwarkach?

Gdzie zaczyna się wyszukiwanie informacji w wyszukiwarkach?

Co to jest prośba?

Jak wyszukiwane są informacje w wyszukiwarkach?

Co oznacza trafność zapytania?

Co można zrobić w przypadku bardzo dużej liczby dokumentów znalezionych podczas dalszych poszukiwań?

Czym są metawyszukiwarki?

Jaka jest podstawowa różnica między wyszukiwarkami metasearch a konwencjonalnymi wyszukiwarkami?

Który z poniższych systemów będzie metawyszukiwarkami:

Jakie są najpopularniejsze krajowe wyszukiwarki?

Jakie są najpopularniejsze zagraniczne wyszukiwarki?

Jakie dwa elementy są ważne przy wyszukiwaniu informacji w Internecie?

Jakie cechy decydują o skuteczności wyszukiwarek podczas wyszukiwania informacji w Internecie?

Warunki korzystania:
Prawa własności intelektualnej do materiału - Informacyjne sieć komputerowa- Borisov N.A., Lukin A.A. należą do jego autora. Niniejsza instrukcja/książka jest publikowana wyłącznie w celach informacyjnych, bez udziału w obiegu komercyjnym. Wszystkie informacje (w tym „Temat 3. Szukaj informacji w Internecie”) są gromadzone z otwartych źródeł lub dodawane przez użytkowników bezpłatnie.
Aby w pełni wykorzystać zamieszczone informacje, Site Project Administration zdecydowanie zaleca zakup książki / podręcznika Information Computer Networks - Borisov N.A., Lukin A.A. w dowolnym sklepie internetowym.

Tag-block: Informacyjne sieci komputerowe - Borisov N.A., Lukin A.A., 2015. Temat 3. Wyszukiwanie informacji w INTERNECIE.

(C) Repozytorium prawne 2011-2016

Trzy sposoby wyszukiwania w Internecie

Internet w ogólności, aw szczególności sieć WWW, zapewnia abonentowi dostęp do tysięcy serwerów i milionów stron internetowych, które przechowują niewyobrażalną ilość informacji. Jak nie zgubić się w tym „oceanku informacji”? Aby to zrobić, musisz nauczyć się wyszukiwać i znajdować niezbędne informacje w sieci.

Jak już wspomniano, istnieją trzy główne sposoby wyszukiwania informacji w Internecie.

1. Określanie adresu strony. Jest to najszybsza metoda wyszukiwania, ale można jej użyć tylko wtedy, gdy adres dokumentu jest dokładnie znany.

2. Nawigacja przez hiperłącza. Jest to najmniej wygodna metoda, ponieważ może być używana do wyszukiwania dokumentów, które są tylko podobne do bieżącego dokumentu. Jeśli bieżący dokument jest poświęcony na przykład muzyce, to korzystając z hiperłączy tego dokumentu, trudno będzie uzyskać dostęp do strony poświęconej sportowi.

3. Kontakt z serwerem wyszukiwania (wyszukiwarką). Korzystanie z wyszukiwarek to najwygodniejszy sposób znajdowania informacji. Obecnie w rosyjskojęzycznej części Internetu popularne są następujące serwery wyszukiwania: Yandex; Wędrowiec.

Istnieją również inne wyszukiwarki. Na przykład na serwerze usługi pocztowej mail.ru zaimplementowano wydajny system wyszukiwania.

Szukaj serwerów

Najbardziej dostępnym i wygodnym sposobem znajdowania informacji w sieci WWW jest korzystanie z wyszukiwarek. Jednocześnie informacje można wyszukiwać według katalogów, a także zestawu słów kluczowych charakteryzujących przeszukiwany dokument tekstowy.

Rozważ bardziej szczegółowo użycie serwerów wyszukiwania. serwer wyszukiwania zawiera dużą liczbę linków do różnych dokumentów, a wszystkie te linki są usystematyzowane w katalogach tematycznych. Na przykład: sport, filmy, samochody, gry, nauka itp. Co więcej, łącza te są ustawiane niezależnie przez serwer, automatycznie poprzez regularne przeglądanie wszystkich stron WWW, które pojawiają się w sieci WWW. Ponadto serwery wyszukiwania zapewniają użytkownikowi możliwość wyszukiwania informacji według słów kluczowych. Po wprowadzeniu słów kluczowych serwer wyszukiwania rozpoczyna przeglądanie dokumentów na innych serwerach sieci Web i wyświetla łącza do tych dokumentów, w których znajdują się określone słowa. Zazwyczaj wyniki wyszukiwania są sortowane w porządku malejącym według specjalnej oceny dokumentu, która wskazuje, w jakim stopniu dany dokument spełnia kryteria wyszukiwania lub jak często jest wyświetlany w Internecie.

Język zapytań wyszukiwarki

Grupa słów kluczowych, utworzona według określonych zasad - przy użyciu języka zapytań, nazywana jest zapytaniem do serwera wyszukiwania. Języki zapytań dla różnych wyszukiwarek są bardzo podobne. Możesz dowiedzieć się więcej na ten temat, odwiedzając sekcję „Pomoc” żądanego serwera wyszukiwania. Rozważ zasady generowania zapytań na przykładzie wyszukiwarki Yandex.

Składnia operatora Co oznacza operator Przykład zapytania
przestrzeń lub & Logiczne AND (w zdaniu) Protezy stałe
&& Logiczne AND (w dokumencie) Rodzaje && (Protezy stałe)
| Logiczne OR zdjęcie | fotografia | migawka | obraz fotograficzny
+ Obowiązkowa obecność słowa w znalezionym dokumencie +być lub +nie być
() Grupowanie słów (technologia | produkcja) (ser | twarożek)
~ Operator binarny AND NOT (w zdaniu) banki ~ prawo
~~ lub _ Binarny operator AND NOT (w dokumencie) Przewodnik po Paryżu ~~ (agencja | wycieczka)
/(nm) Odległość w słowach (minus (-) - wstecz, plus (+) - do przodu) dostawcy /2 muzyka do kawy /(-2 4) wakaty edukacyjne ~ /+1 studentów
« « Wyszukiwanie frazy „Proteza stała” Odpowiednik: Proteza stała /+1
&&/(nm) Odległość w zdaniach (minus (-) - wstecz, plus (+) - do przodu) medycyna && /1 protezy

Informacje ogólne.

Obecnie Internet łączy setki milionów serwerów, które obsługują miliardy różnych witryn i pojedynczych plików zawierających różnego rodzaju informacje. To gigantyczne repozytorium informacji. Istnieją różne metody wyszukiwania informacji w Internecie.

Szukaj według znanego adresu. Wymagane adresy są pobierane z katalogów. Znając adres, po prostu wpisz go w pasek adresu Przeglądarka.

www.gov.ru - serwer rosyjskich władz państwowych.

Konstrukcja adresu przez użytkownika. Znając system generowania adresów internetowych, możesz tworzyć adresy podczas wyszukiwania witryn sieci Web.

Konieczne jest dodanie do słowa kluczowego domeny tematycznej lub geograficznej (nazwa firmy, przedsiębiorstwa, organizacji lub prosty angielski rzeczownik) i musi być połączona intuicja.

Adresy komercyjnych witryn internetowych:

www.cnn.com (CNN World News),

www.sony.com SONY),

www.mtv.com (wiadomości muzyczne MTV).

Adresy placówek edukacyjnych:

www.ntu.edu (Uniwersytet Narodowy Stanów Zjednoczonych).

Adresy serwerów regionalnych:

www.poland.net (Polska),

www.israil.net (Izrael).

Wyszukiwarki internetowe

Do wyszukiwania informacji w Internecie opracowano specjalne systemy wyszukiwania informacji. Wyszukiwarki mają zwykły adres i są wyświetlane jako strona internetowa zawierająca specjalne narzędzia do organizowania wyszukiwania (ciąg wyszukiwania, katalog tematyczny, linki). Aby wywołać wyszukiwarkę, wystarczy wpisać jej adres w pasku adresu przeglądarki.

Zgodnie z metodą organizowania informacji, systemy wyszukiwania informacji dzielą się na dwa typy: klasyfikacja (rubrykatory) i słownik.

Rubrykatory (klasyfikatory) to wyszukiwarki wykorzystujące hierarchiczną (podobną do drzewa) organizację informacji. Podczas wyszukiwania informacji użytkownik przegląda nagłówki tematyczne, stopniowo zawężając pole wyszukiwania (na przykład, jeśli chcesz znaleźć znaczenie słowa, najpierw musisz znaleźć słownik w klasyfikatorze, a następnie go w nim znaleźć właściwe słowo).

Systemy wyszukiwania słowników są potężnymi automatycznymi systemami oprogramowania i sprzętu. Za ich pomocą przeglądane (skanowane) są informacje w Internecie. Dane o lokalizacji tej lub innej informacji są wprowadzane do specjalnych ksiąg-indeksów. W odpowiedzi na żądanie wykonywane jest wyszukiwanie zgodnie z ciągiem zapytania. W rezultacie użytkownikowi oferowane są te adresy (URL), w których wyszukiwane słowo lub grupa słów została znaleziona w momencie skanowania. Wybierając dowolny z proponowanych linków, możesz przejść do znalezionego dokumentu. Większość nowoczesnych wyszukiwarek jest mieszana.

Najbardziej znane i popularne wyszukiwarki:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

Istnieją systemy, które specjalizują się w wyszukiwaniu zasoby informacji w różnych kierunkach.

Szukaj osób w Internecie:

www.whowhere.ru www. bigfoot.com

Szukaj według grup dyskusyjnych (Usenet):

www.dejanews.com

Wyszukiwarki tematów:

Szukaj oprogramowanie:

Szukaj w archiwach plików:

http://ftpseach.com city.ru, http://ftpsearch. licos.com

Katalogi (kolekcje tematyczne linków z adnotacjami):

http://www.atrus.ru

Często skuteczne wyszukiwanie informacji można przeprowadzić za pomocą katalogów regionalnych - wyspecjalizowanych serwerów zawierających dane o przedsiębiorstwach lub zasobach WWW miasta lub regionu. Na przykład w Petersburgu taki katalog znajduje się pod adresem http://www.spb.ru.

Listę IPS można znaleźć na stronie www.monk. nowa poczta.ru

Bardziej szczegółową listę wyszukiwarek i katalogów przedstawia tabela. 3.2.

Zasady wykonywania zapytań

W każdej wyszukiwarce w sekcji Pomoc można uzyskać informacje na temat wyszukiwania, tworzenia ciągu zapytania. Poniżej znajdują się informacje o typowym, „przeciętnym” języku zapytań.

Prosta prośba.

Wpisz jedno słowo, które definiuje temat wyszukiwania. Na przykład w wyszukiwarce Rambler.ru wystarczy wpisać: automatyzacja.

Znaleziono dokumenty zawierające słowa określone we wniosku. Rozpoznawane są wszystkie formy rosyjskich słów, z reguły ignorowane są litery.

W zapytaniu możesz użyć znaku „*” lub „?”. Podpisać "?" w słowie kluczowym zastępowany jest jeden znak, który można zastąpić dowolną literą, a znak „*” jest sekwencją znaków.

Na przykład automat zapytań* znajdzie dokumenty zawierające słowa automatyczne, automatyczne i tak dalej.

Złożona prośba.

Często istnieje potrzeba łączenia słów kluczowych, aby uzyskać bardziej szczegółowe informacje. W tym przypadku stosuje się dodatkowe słowa łączące, funkcje, operatory, symbole, kombinacje operatorów oddzielone nawiasami.

Na przykład zapytanie music & (beatles | beatles) oznacza, że ​​użytkownik szuka dokumentów zawierających słowa music and beatles lub music and beatles.

Tabela 3.1 przedstawia przyjęte w systemie Aport zasady generowania wniosków (http://www.aport.ru).

Tabela 3.1

Operatory dla wniosków o formowanie

Operator Synonimy Komentarz
I ORAZ & Zapytanie znajdzie dokumenty zawierające oba słowa kluczowe. Może, ale nie musi być napisane. Na przykład zapytanie: informatyka i podręcznik jest równoważne podręcznikowi informatyki
LUB LUB | Wyszukuje te dokumenty, które używają jednego z podanych słów lub obu słów jednocześnie
NIE NIE-~ Wyszukiwanie jest ograniczone do dokumentów, które nie zawierają słowa określonego po operatorze
" " " " Cytaty podwójne lub pojedyncze pozwalają znaleźć frazę
data= data:data= Wyszukiwanie jest ograniczone do dokumentów, które mieszczą się w określonym przedziale dat Przykład 1. data waluty=01/02/2002-01/03/2002. To żądanie zwróci dokumenty zawierające słowo „waluta” i mające datę między 1 lutego 2002 a 1 marca 2002. Przykład 2. data=01/03/2002 waluta Przykład 3. data:<02/03/2002 валюта

Tabela 3.2

Lista serwerów wyszukiwania i katalogów

Adres zamieszkania Opis
www.excite.com Wyszukiwarka z recenzjami węzłów i przewodnikami
www.alta-vista.com Serwer wyszukiwania, dostępne zaawansowane możliwości wyszukiwania
www.hotbot.com serwer wyszukiwania
www.poland.net www.israil.net Regionalne serwery wyszukiwania Polski, Izraela
www.ifoseek.com Serwer wyszukiwania (łatwy w użyciu)
www.ipl.org Biblioteka Internet Publik, biblioteka publiczna działająca w ramach projektu World Village
www.wisewire.com WiseWire - organizacja wyszukiwania z wykorzystaniem sztucznej inteligencji
www.webcrawler.com WebCrawler - serwer wyszukiwania, łatwy w użyciu
www.yahoo.com Katalog internetowy i interfejs umożliwiający dostęp do wyszukiwania pełnotekstowego na serwerze AltaVista
www.aport.ru Aport - serwer wyszukiwania w języku rosyjskim
www.yandex.ru Yandex - rosyjskojęzyczny serwer wyszukiwania
www.wędrowiec.ru Rambler - rosyjskojęzyczny serwer wyszukiwania
Zasoby pomocy internetowej
www.żółty.com Internetowe żółte strony
mnich. nowa poczta.ru Wyszukiwarki o różnych profilach
www.top200.ru 200 najlepszych stron internetowych
www.allru.net
www.ru Katalog rosyjskich zasobów internetowych
www.allru.net/z09. htm Zasoby edukacyjne
www.studenci.ru Rosyjski serwer studencki
www.cdo.ru/index_new. żmija Centrum kształcenia na odległość
www.otwarte. ac. Wielka Brytania Otwarty Uniwersytet w Wielkiej Brytanii
www.ntu.edu Amerykański Uniwersytet Narodowy
www.tłumacz.ru Elektroniczny tłumacz tekstu
www.pomorsu.ru/przewodnik. biblioteka.html Lista linków do bibliotek sieciowych
www.library.ru Naukowa biblioteka elektroniczna
www.citforum.ru E-biblioteka
www.infamed.com/psy Testy psychologiczne
www.pokoleniye.ru Strona internetowa Federacji Edukacji Internetowej
www.metoda. ludzie.ru Zasoby edukacyjne
www.spb. www.osi.ru/ic/distant Kształcenie na odległość w Internecie
www.egzamin.ru Egzaminy i testy
www.kbsu.ru/~książka/ Podręcznik informatyki
Mega. km.ru Encyklopedie i słowniki

Wyszukiwanie informacji w Internecie: pułapki

Problemy, które nie leżą na powierzchni, często dają się odczuć dopiero „z perspektywy czasu”, po zakończeniu pewnego etapu prac poszukiwawczych i być może na podstawie ich wyników podjęto już jakąś decyzję. Co uniemożliwia uczynienie sytuacji transparentną od samego początku działania tego czy innego systemu wyszukiwania informacji (IPS)? Odpowiedź jest dość prosta: brak kompleksowych informacji tego typu ze strony dewelopera. Bezpośrednią konsekwencją tego jest nierzetelność otrzymywanych danych i ich niekontrolowana utrata. Rzadko zdarza się znaleźć w sieci wyszukiwarkę, która nie posiada pewnych „nieudokumentowanych” funkcji. Wydawałoby się, że użytkownik nie potrzebuje aż tylu informacji, a mianowicie:

jak zapełniana jest baza danych IPS i jaka jest jej objętość;

pełen zakres możliwości języka wyszukiwania systemu;

główne cechy prezentacji wyników wyszukiwania, przede wszystkim algorytm rankingu rekordów z listy odpowiedzi na zapytanie.

Niestety, źródłem takich informacji zwykle nie jest dokument dostępny ze strony głównej serwera wyszukiwania, ale publikacje poszczególnych autorów rozsiane po sieci, książki i czasopisma komputerowe. Powodem tego stanu rzeczy jest najwyraźniej nie tylko zaniedbanie dewelopera, ale także czynnik zwany polityką marketingową. Mówiąc najprościej, dostarczenie wyszukiwarce najpełniejszych informacji o sobie nie zawsze wpływa pozytywnie na jej ranking. Niemniej jednak w niektórych przypadkach użytkownik jest w stanie przejąć kontrolę nad sytuacją. Często za pomocą testów można poznać funkcje wybranej usługi wyszukiwania. Budowanie specjalnych zapytań testowych, które szybko wyjaśniają dokładnie ten aspekt działania systemu, który jest najważniejszy dla bieżącego zadania okazuje się w wielu przypadkach nietrywialny. Jak uniknąć niektórych kłopotów podczas pracy z IPS, poświęcimy naszą dyskusję. Jako przykłady ilustrujące prezentację zostaną wzięte pod uwagę powszechnie znane wyszukiwarki internetowe.