Търсене на информация в интернет

Интернет се разраства с много бързи темпове, така че намерете необходимата информациясред стотици милиарди уеб страници и стотици милиони файлове става все по-трудно. За търсене на информация се използват специални търсачки, които съдържат постоянно актуализирана информация за местоположението на уеб страници и файлове на стотици милиони интернет сървъри.

Търсачките съдържат тематично групирана информация за информационните ресурси на World Wide Web в бази данни. Специални програми-роботи периодично "заобикалят" интернет уеб-сървърите, четат всички срещнати документи, маркират ключови думи в тях и въвеждат интернет адреси на документи в базата данни.

Повечето търсачки позволяват на автора на уеб сайта да въвежда информация в базата данни чрез попълване на регистрационен формуляр. В процеса на попълване на въпросника разработчикът на сайта въвежда адреса на сайта, името му, Кратко описаниесъдържанието на сайта, както и ключовите думи, по които най-лесно ще намерите сайта.

Търсене по ключова дума.Търсенето на документ в базата данни на търсачката се извършва чрез въвеждане на заявки в поле за търсене.

Заявката трябва да съдържа една или повече ключови думи, които са основните за този документ. Например, за да търсите самите интернет търсачки, можете да въведете ключовите думи " Руска систематърсене на информация в интернет "(фиг. 6.21).

Известно време след изпращане на заявката търсачката ще върне списък с интернет адреси на документи, в които са намерени посочените ключови думи. За да видите този документ в браузъра, е достатъчно да активирате връзката, сочеща към него (фиг. 6.22).

Ако ключовите думи са избрани неуспешно, тогава списъкът с адреси на документи може да е твърде голям (може да съдържа десетки или дори стотици хиляди връзки). За да стесните списъка, можете да въведете допълнителни ключови думи в полето за търсене или да използвате директорията на търсачката.

Една от най-пълните и мощни търсачки е Google (www.google.ru), която съхранява 8 милиарда уеб страници в своята база данни и 5 милиона нови страници се въвеждат от роботи всеки месец. В Runet (руската част на Интернет) обширни бази данни, съдържащи по 200 милиона документа, имат търсачки Yandex (www.yandex.ru) и Rambler (www.rambler.ru).

Търсене в йерархична система от директории.В база данни на търсачка уеб сайтовете са групирани в йерархични предметни директории, които са аналогични на предметен каталог в библиотека.

Тематични раздели от най-високо ниво, например: Интернет, Компютри, Наука и образованиеи така нататък, съдържат вложени директории. Например интернет директорията може да съдържа поддиректории Търсене, пощаи други (фиг. 6.23).

Търсенето на информация в директория се свежда до избор на конкретна директория, след което на потребителя ще бъде представен списък с връзки към интернет адресите на най-посещаваните и значими уеб сайтове. Всяка връзка обикновено е анотирана, т.е. съдържа кратък коментар на съдържанието на документа.

Търсачката Aport (www.aport.ru) има най-пълния многостепенен йерархичен тематичен каталог на рускоезични интернет ресурси. Каталогът съдържа подробна анотация на съдържанието на уеб сайтовете и указание за тяхното географско местоположение.

Търсене на файлове.За търсене на файлове в сървърите за файлови архиви има специализирани търсачки, включително търсачката FileSearch (www.filesearch.ru). За да търсите файл, трябва да въведете името на файла в полето за търсене и търсачката ще ви върне интернет адресите на файловите архивни сървъри, които съхраняват файла с даденото име.

Търсенето на информация в рускоезичната част на Интернет с помощта на повечето търсачки: Google, Rambler, Aport, Applex и търсачката на файлове Research може да се извърши с помощта на интегрираната търсачка Gogle.ru (фиг. 6.24). За да направите това, просто въведете ключови думи в лентата за търсене, използвайте превключвателите, за да зададете вида на необходимата информация и щракнете върху бутона с името на търсачката Gogle.ru (фиг. 6.24). За да направите това, просто въведете ключови думи в лентата за търсене, използвайте превключвателите, за да зададете вида на необходимата информация и щракнете върху бутона с името на търсачката.


Ориз. 6.24. Интегрирана търсачка Google.ru

Методи за търсене в Интернет

Три начина за търсене в Интернет

Интернет като цяло и в частност World Wide Web предоставят на абоната достъп до хиляди сървъри и милиони уеб страници, които съхраняват невъобразимо количество информация. Как да не се изгубите в този "информационен океан"? За да направите това, трябва да се научите как да търсите и намирате необходимата информация в мрежата.

Както вече споменахме, има три основни начина за намиране на информация в Интернет.

1. Посочване на адреса на страницата.Това е най бърз начинтърсене, но може да се използва само ако е известен точният адрес на документа.

2. Навигация чрез хипервръзки.Това е най-малко удобният метод, тъй като може да се използва за търсене на документи, които са близки по смисъл до текущия документ. Ако текущият документ е посветен например на музика, тогава с помощта на хипервръзките на този документ едва ли ще е възможно да стигнете до сайт, посветен на спорта.

3. Извикване на сървъра за търсене търсачка) . Използването на търсачки е най-удобният начин за намиране на информация. В момента следните сървъри за търсене са популярни в рускоезичната част на Интернет:

    Яндекс;
    Rambler;
    Апорт.

Има и други търсачки. Например, ефективна систематърсене, реализирано на сървъра пощенски услуги mail.ru.

Сървъри за търсене

Най-достъпният и удобен начин за търсене на информация в световната мрежае използването на търсачки. В същото време информацията може да се търси по каталози, както и по набор от ключови думи, характеризиращи търсения текстов документ.

Разгледайте по-подробно използването на сървъри за търсене. сървър за търсенесъдържа голям брой връзки към повечето различни документи, и всички тези връзки са организирани в тематични директории. Например: спорт, кино, коли, игри, наука и т.н. Освен това тези връзки се задават от сървъра независимо, в автоматичен режимкато редовно разглеждате всички уеб страници, които се появяват в световната мрежа. Освен това сървърите за търсене предоставят на потребителя възможност за търсене на информация по ключови думи. След въвеждане на ключови думи сървърът за търсене започва да преглежда документи на други уеб сървъри и показва връзки към тези документи, в които са намерени посочените думи. Обикновено резултатите от търсенето се сортират в низходящ ред по специална оценка на документа, която показва колко добре даден документ отговаря на критериите за търсене или колко често се изисква в мрежата.

Език за заявки в търсачката

Група от ключови думи, формирани по определени правила - с помощта на езика на заявките, се нарича заявка към сървъра за търсене. Езиците за заявки за различните търсачки са много сходни. Можете да научите повече за това, като посетите секцията "Помощ" на желания сървър за търсене. Помислете за правилата за генериране на заявки с помощта на търсачката Yandex като пример.

Синтаксис на оператора Какво означава оператор Пример за заявка
интервал или & Логическо И (в рамките на изречението) физиотерапия
&& Логическо И (в рамките на документа) рецепти && (топено сирене)
| Логическо ИЛИ снимка | фотография | моментна снимка | фотографско изображение
+ Задължително присъствие на думата в намерения документ +да бъдеш или +да не бъдеш
() Групиране на думи (технология | производство) (сирене | извара)
~ двоичен операторИ НЕ (в рамките на изречението) банки ~ закон
~~
или
_
Двоичен оператор И НЕ (в рамките на документа) Пътеводител за Париж ~~ (агенция | обиколка)
/(nm) Разстояние с думи (минус (-) - назад, плюс (+) - напред) доставчици /2 кафе музика /(-2 4) свободни работни места за образование ~ /+1 студенти
" " Търсене по фраза "червена шапчица" Еквивалентно: червена / +1 шапчица
&&/(nm) Разстояние в изречения (минус (-) - назад, плюс (+) - напред) банка && /1 данъци

Придобивам най-добри резултатитърсене, трябва да запомните няколко прости правила:

    1. Не търсете информация само по една ключова дума.

    2. Най-добре е да не въвеждате ключови думи с главни букви, тъй като това може да доведе до неоткриване на същите думи, написани с малки букви.

    3. Ако търсенето ви не даде резултати, проверете дали има ключови думи x правописни грешки.

Съвременните търсачки предоставят възможност за свързване към генерираната заявка на семантичен анализатор. С негова помощ можете, като въведете дума, да изберете документи, в които има производни на тази дума в различни падежи, времена и др.

тестови въпроси

1. Как се търсят документи по ключови думи? В система от директории?

Задачи за самостоятелно изпълнение

6.8 Практическа задача. Сравнете резултатите от търсенето на документи по ключова дума с помощта на различни търсачки (използвайте интегрираната търсачка на Google).

6.9 Практическа задача. Потърсете във файловите архивни сървъри файла на WinAmp media player.

Казват, че всичко е в интернет. Всъщност не е така. Материалите за публикуване в мрежата се подготвят от реални хора и затова можете да намерите само това, което те смятат за необходимо да публикуват там. Въпреки това реката се захранва от потоци и благодарение на тяхната креативност днес в интернет вече са формирани около два милиарда уеб страници. В резултат на това каталогизирането на наличните в мрежата ресурси се превърна в основен проблем. Въпреки факта, че хиляди организации се занимават с проблема, той не само не се доближава до разрешаване, но става все по-остър. Процентът на каталогизираните ресурси постоянно намалява. AT последните годинитова падане беше катастрофално. Така че, ако през 1999 г. процентът на каталогизираните ресурси се доближи до 40%, то само за една следваща година той спадна до 25%.

Изводът е прост: уеб пространството се запълва по-бързо, отколкото се систематизира.

За съжаление, нямаме причина да предполагаме, че нещо може да се промени към по-добро в близко бъдеще. В резултат на това търсенето на информация в Интернет може да се счита за една от най-трудните задачи.

За да търсите информацията, която ви интересува, трябва да кажете на браузъра адреса на уеб страницата, на която се намира. Това е най-бързият и надежден тип търсене. За бърз достъпкъм ресурса, просто стартирайте браузъра и въведете адреса на страницата в адресната лента.

Адресите на уеб страниците се дават в специални директории, печатни издания, звучат в ефира на популярни радиостанции и от телевизионни екрани.

Ако не знаете адреса, тогава за търсене на информация в интернет има търсачки, съдържащи информация за интернет ресурси.

Всяка търсачка е голяма база данни от ключови думи, свързани с уеб страниците, на които се намират. За да търсите адреса на сървъра с информацията, която ви интересува, трябва да въведете ключова дума, няколко думи или фраза в полето на търсачката. Така изпращате заявка към търсачката. Резултатите от търсенето са дадени като списък с адреси на уеб страници, където се срещат тези думи.

По правило търсачките се състоят от три части: робот, програма за индексиране и обработка на заявки.

Робот (паяк, робот или бот) е програма, която посещава уеб страници и чете (изцяло или частично) тяхното съдържание.

Роботите на търсачките се различават по своята индивидуална схема за анализ на съдържанието на уеб страница.

Индексът е хранилище на данни, което съдържа копия на всички страници, посетени от роботи.

Индексите във всяка търсачка се различават по количеството и начина, по който се съхранява информацията. Базите данни на водещите търсачки съхраняват информация за десетки милиони документи, а индексираните им обеми са стотици гигабайти. Индексите периодично се актуализират и допълват, така че резултатите от работата на една търсачка с една и съща заявка може да се различават, ако търсенето е извършено по различно време.

Обработчикът на заявки е програма, която според заявката на потребителя "търси" индекса за необходимата информация и връща връзки към намерените документи.

Наборът от връзки на изхода на системата се разпределя от програмата в низходящ ред от най-високата степен на съвпадение на връзката към заявката до най-ниската.

В Русия най-често срещаните търсачки са:

  • Рамблер (www.rambler.ru);
  • Яндекс (www.yandex.ru);
  • Поща (www.mail.ru).

В чужбина има много повече търсачки. Най-популярните са:

  • Алта Виста (www.altavista.com);
  • Бързо търсене (www.alltheweb.com);
  • Северно сияние (www.northernlight.com).

Yandex е може би най-добрата търсачка в руския интернет. Тази база данни съдържа около 200 000 сървъра и до 30 милиона документа, които системата сканира за секунди. На примера на тази система ще покажем как се търси информация.

Търсенето на информация се задава чрез въвеждане на ключова дума в специална рамка и натискане на бутона "Намери" вдясно от рамката.

Резултатите от търсенето се появяват в рамките на няколко секунди и са подредени по важност - най-важните документи се поставят в горната част на списъка. В този случай рангът на намерения документ се определя от мястото в документа, където се намира ключовата дума (това е по-важно в заглавието на документа, отколкото на всяко друго място) и броя на споменаванията на ключовата дума ( повече споменавания, толкова по-висок е рангът).

По този начин сайтовете, намиращи се на първите места в списъка, са водещи не от гледна точка на съдържанието, а на практика, по отношение на честотата на споменаване на ключовата дума. В тази връзка не трябва да се ограничавате до разглеждането на първите десет сайта, предложени от търсачката.

Съдържанието на сайта може да бъде косвено оценено от неговото кратко описание, поставено от търсачката под адреса на сайта. Някои безскрупулни автори на сайтове, за да увеличат вероятността уеб страницата им да се появи на първите места в търсачката, умишлено включват безсмислени повторения на ключовата дума в документа. Но веднага щом търсачката засече такъв "осеян" документ, тя автоматично го изключва от своята база данни.

Дори класираният списък от документи, предлаган от търсачката в отговор на ключова фраза или дума, може да бъде почти огромен. В тази връзка Yandex (както и други мощни търсачки) предоставя възможност в рамките на първия списък да избира документи, които по-точно отразяват целта на търсенето, тоест да прецизират или подобрят резултатите от търсенето. Например списък от 34 899 уеб страници на ключова дума. Въвеждането на квалифицираща ключова дума в командата „Търсене в намерените“ намалява списъка до 750 страници, а въвеждането на друга квалифицираща дума в тази команда намалява списъка до 130 уеб страници.

Директориите за търсене са систематична колекция (подбор) от връзки към други интернет ресурси. Връзките са организирани като тематичен рубрикатор, n представлява йерархична структура, движейки се през която можете да намерите необходимата ви информация.

Да вземем за пример структурата на интернет каталога за търсене на Yandex.

Това е директория с общо предназначение, тъй като съдържа връзки към интернет ресурси в почти всички възможни посоки. Тази директория съдържа следното Теми:

  • Бизнес и икономика;
  • Общество и политика;
  • Наука и образование;
  • Компютри и комуникации;
  • Наръчници и връзки;
  • Дом и семейство;
  • Развлечения и отдих;
  • Култура и изкуство.

всеки темавключва много подраздели , а те от своя страна съдържат заглавияи т.н.

Да предположим, че подготвяте събитие за Деня на победата и искате да потърсите в интернет думите от известната военна песен на Булат Окуджава „Чуваш, че ботушите дрънчат“. Търсенето може да се организира по следния начин:

Yandex > Каталог > Култура и изкуство > Музика > Авторска песен

Този метод на търсене е доста бърз и ефективен. Накрая ви се предлагат само няколко връзки, сред които има връзки към сайтове с песни на известни бардове. Остава само да намерите на сайта архив с текстове на Б. Окуджава и да изберете желания текст в него.

Друг пример. Да предположим, че ще купувате мобилен телефон и искате да сравните характеристиките на устройства от различни компании. Търсенето може да се извърши в следните заглавия на каталога:.

Yandex > Каталог > Компютри и комуникации > мобилна връзка> Мобилни телефони

След като получи ограничено количествовръзки, можете бързо да ги видите и да изберете телефон, като разгледате характеристиките на фирмите и модификациите на устройствата.

Повечето търсачки имат възможност да търсят по ключови думи. Това е един от най-често срещаните видове търсене.

За да търсите по ключови думи, трябва да въведете дума или няколко думи за търсене в специален прозорец и да кликнете върху бутона Намери.

Търсачката ще намери в своята база данни и ще покаже документи, съдържащи тези думи. Може да има много такива документи, но много в случая не означава непременно добре.

Нека проведем някои експерименти с някоя от търсачките. Да предположим, че решим да създадем аквариум и се интересуваме от всякаква информация по тази тема. На пръв поглед най-простото е да търсите думата "аквариум". Нека проверим това, например, в търсачката Yandex. Резултатът от търсенето ще бъде голяма сумастраници - огромен брой връзки. Освен това, ако се вгледате по-внимателно, сред тях ще има сайтове, които споменават групата на Б. Гребенщиков за аквариум, търговски центрове и неформални асоциации със същото име и много други, които нямат нищо общо с аквариумните риби.

Лесно е да се досетите, че такова търсене не може да задоволи дори непретенциозния потребител. Твърде много време ще трябва да отделим за избиране сред всички предложени документи на тези, които се отнасят до темата, от която се нуждаем, и още повече за запознаване със съдържанието им.

Веднага можем да заключим, че обикновено не е препоръчително да се търси по една дума, тъй като е много трудно да се определи темата на документ, уеб страница или сайт по една дума. Изключение правят редки думи и термини, които почти никога не се използват извън своята предметна област.

Имайки определен набор от най-често срещаните термини в желаната област, можете да използвате разширено търсене. На фиг. показва се прозорецът за разширено търсене в търсачката Yandex. В този режим възможностите на езика за заявки се реализират като форма. Подобна услуга, включително филтри за речници, се предлага от почти всички търсачки.

Нека се опитаме да изясним условията за търсене и да въведем фразата "аквариумни риби". Броят на връзките ще намалее над 20 пъти. Този резултат ни подхожда повече, но все пак сред предложените връзки можете да срещнете, например, руски сувенирни комплекти от кибритени етикети с изображения на риби и колекции от скрийнсейвъри за настолен компютър и каталози на аквариумни риби със снимки и аквариум магазини за аксесоари. Очевидно е, че трябва да продължим да се движим в посока на усъвършенстване на условията за търсене.

За да направят търсенето по-продуктивно, всички търсачки имат специален език за заявки със собствен синтаксис. Тези езици са сходни по много начини. Научаването на всички тях е доста трудно, но всяка търсачка има помощна система, която ще ви позволи да овладеете желания език.

Ето няколко прости правила за генериране на заявка в търсачката Yandex.

Ключовите думи в заявката трябва да бъдат написани с малки (малки) букви.

Това ще гарантира, че се търсят всички ключови думи, а не само тези, които започват с главна буква.

Търсенето взема предвид всички форми на думата според правилата на руския език, независимо от формата на думата в заявката.

Например, ако думата „знам“ е посочена в заявката, тогава думите „знам“, „знам“ и т.н. също ще отговарят на условието за търсене.

За да търсите стабилна фраза, оградете думите в кавички.

Например "порцеланови съдове".

За да търсите по точната дума, трябва да поставите удивителен знак пред думата.

Например, за да търсите думата "септември" в родителен падеж, ще напишете "!Септември".

За да търсите в едно изречение, думите в заявката се разделят с интервал или знак &

Например „приключенски роман“ или „приключение и роман“. Няколко думи, въведени в заявката, разделени с интервали, означават, че всички те трябва да бъдат включени в едно изречение на търсения документ.

Ако искате да изберете само тези документи, в които се среща всяка дума, посочена в заявката, поставете знак плюс "+" пред всеки от тях. Ако, напротив, искате да изключите някоя дума от резултата от търсенето, поставете минус "-" пред тази дума. Знаците "+" и "-" трябва да се изписват с интервал от предходната и заедно със следващата дума.

Например, заявката "Volga-car" ще намери документи, които съдържат думата "Volga", а не думата "автомобил".

Когато търсите синоними или думи, които са близки по значение, можете да поставите вертикална лента "|" между думите.

Например за заявката „дете | дете | baby" ще намери документи с всяка от тези думи.

Вместо една дума в заявка, можете да замените цял израз. За да направите това, трябва да го вземете в скоби

Например „(дете | бебе | деца | бебе) + (грижи | образование)“.

Знакът "~" (тилда) ви позволява да намерите документи с изречение, съдържащо първата дума, но не съдържащо втората.

Например, търсенето "книги ~ магазин" ще намери всички документи, съдържащи думата "книги", които нямат думата "магазин" до себе си (в изречението).

Ако операторът се повтори веднъж (например & или ~), търсенето се извършва в рамките на изречението. Двойният оператор (&&,~~) търси в документа.

Например, търсенето на "рак ~~ астрология" ще намери документи с думата "рак", които не са свързани с астрологията.

Да се ​​върнем към примера с аквариумните рибки. След прочитане на няколко документа, предлагани от търсачката, става ясно, че търсенето на информация в интернет не трябва да започва с избора на аквариумни рибки. Аквариумът е сложна биологична система, чието създаване и поддръжка изисква специални знания, време и сериозни инвестиции.

Въз основа на получената информация човек, който извършва търсене в Интернет, може радикално да промени стратегията за по-нататъшно търсене, като реши да проучи специална литература, свързана с разглеждания въпрос.

За търсене на литература или документи с пълен текст е възможна следната заявка:

"+ (аквариум | акварист | акварист) + за начинаещи + (съвети | литература) + (статия | теза | пълен текст) - (цена | магазин | доставка | каталог)".

След обработка на заявката от търсачката, резултатът беше много успешен. Вече първите линкове водят до необходимите документи.

Сега можете да обобщите резултатите от търсенето, да направите определени изводи и да вземете решение за възможни действия:

  • Спрете по-нататъшното търсене, тъй като по различни причини поддръжката на аквариума е извън вашите сили.
  • Прочетете предложените статии и продължете с подреждането на аквариума.
  • Потърсете материали за хамстери или вълнисти папагали.
  1. Кой тип търсене е най-бързият и надежден?
  2. Къде потребителят може да намери адреси на уеб страници?
  3. Каква е основната цел на търсачката?
  4. Какви са частите на търсачката?
  5. Какви търсачки познавате?
  6. Каква е технологията на търсене по рубрикатор на търсачката?
  7. Какво представлява технологията за търсене по ключови думи?
  8. Кога трябва да използвате + или - във вашите критерии за търсене?
  9. Какви критерии за търсене в Yandex се задават от следната фраза:

    (бавачка|възпитател|гувернантка)++(грижи|образование|надзор) ?

  10. Какво означава удвояването на знака (~~ или ++) при формиране на сложна заявка?

Упражнение.

Задача 1. Търсене в директории.

Използвайте директорията на търсачката, за да намерите следната информация (според указанията на учителя):

  1. Текст на песен от популярна музикална група
  2. Репертоарът на Мариинския театър за текущата седмица
  3. Характеристики последен модел мобилен телефонизвестна компания (по ваш избор)
  4. Рецепта за украински борш с кнедли
  5. Дългосрочна прогноза за времето във вашия район (поне 10 дни)
  6. Снимка на вашия любим изпълнител на съвременна песен
  7. приблизителна цена мултимедиен компютър(цена)
  8. Информация за свободни позиции за длъжността секретар във вашия регион или град
  9. Хороскоп на вашата зодия за текущия ден

Въз основа на резултатите от търсенето направете писмен отчет в Word: представете намерения, копиран и форматиран материал в документа. Представете доклада на учителя.

Задача 2. Формиране на заявка за точно заглавие или цитат.

Знаете точното заглавие на документа, например „Хигиенни изисквания към персоналните електронни компютри и организация на работа“. Формулирайте заявка за търсене в Интернет на пълния текст на документа.

Запазете резултата от търсенето във вашата папка. Представете на учителя.

Задача 3. Формиране на сложни заявки.

  • Във всяка търсачка направете заявка за търсене на информация за руската баня. Премахване на оферти за услуги, реклами за аксесоари за баня и други реклами. Насочете търсенето си към ефекта на руската баня върху тялото.
  • Съставете сложна заявка за търсене на информация относно грижите за домашни котки. Изключете големи котки (като лъвове) от вашето търсене, както и оферти за покупка, продажба, снимки за тапет и т.н.
  • Попълнете текста на заявката и резултата от търсенето в Word и го представете на учителя.
Задача 4. Тематично търсене.

По всякакъв начин, който знаете, търсете в интернет информация за историята на компютърните технологии. Търсете в различни посоки: историческа обстановка, технологии, личности. Представете резултатите от търсенето под формата на презентация. Използвайте многоетапно съдържание под формата на хипервръзки във вашата презентация.

Проблемът за търсенето и средствата за неговата организация

Гигантското и непрекъснато нарастващо количество информация, достъпна в интернет, вкл. оперативен, прави проблема с намирането на необходимата информация много актуален и сложен. Скоростта на търсене на необходимата информация определя до голяма степен професионализма на интернет потребителя. Струва си да се каже, че за автоматизиране на ϶ᴛᴏth задача, различни, както чужди, така и домашни системитърсене, които са уеб страници от специален вид. В същото време, въпреки наличието на множество инструменти за автоматизация на търсенето, тази задача остава доста трудоемка, изискваща от потребителя определен опит, интуиция и познаване на терминологията, използвана в неговата предметна област.

Оценка, публикувана в списание Nature на 8 юли 1999 г., изчислява, че броят на публично индексираните уеб страници е 800 милиона.Една година по-късно авторът на изследването (Стив Лорънс от изследователския институт на NEC) смята, че техният брой почти се е удвоил. до 1,5 млрд. Дори най-добрите търсачки индексират не повече от една на всеки шест страници. Струва си да се каже, че за да се извлече полезна информацияот интернет, трябва да знаете къде и как да търсите.

Инструментът за търсене на Internet Explorer опростява достъпа до инструменти за търсене, елиминирайки необходимостта да знаете адресите на търсачките. В този случай е по-добре да се свържете директно с търсачките, като заредите страницата ϲᴏᴏᴛʙᴇᴛϲᴛʙ.

Според метода на организиране на търсенето и предоставените възможности всички инструменти за търсене могат условно да бъдат разделени на следните групи:

каталози и специализирани бази данни;

търсачки;

системи за метатърсене.

Каталози и бази данни

Каталозите в WWW са подобни на систематичните библиотечни каталози. Търсенето в директория се състои от последователно придвижване през йерархичен списък от връзки, наречени заглавия или категории. Първата страница на директорията съдържа връзки към основни теми като култура и изкуство; Медицина и здраве; Общество и политика; Бизнес и икономика; Развлечения и т.н.. Щракването върху ϲᴏᴏᴛʙᴇᴛϲᴛʙ връзка (категория) отваря страница, съдържаща връзки с подробности за избраната тема (рубрика). Придвижвайки се надолу по категориите с подробности, можете да намерите страница с желаната информация. На всяка страница, отворена при движение през каталога по един или друг начин, е посочена последователността от прегледани вложени заглавия, например Бизнес свят: Финанси: Анализ и др.

Всички каталози се създават и поддържат актуални ръчно от специалисти, по същия начин, по който библиографите съставят и поддържат библиотечни каталози. Уместно е да се отбележи, че описанието на документа се извършва или от съставителите на каталога, или от автора. Благодарение на ϶ᴛᴏmu, съдържанието на страниците, включени в каталога, е най-адекватно на рубриката, към която са приписани. Но предвид скоростта на попълване и промените в информацията в Интернет, "ръчният" метод за поддържане на каталози не позволява еднакво отразяване на реалното състояние на интернет ресурсите по тази тема.

Търсачки

(търсачки, търсачки, роботи за търсене)

Има десетки големи и хиляди малки и специализирани уеб сайтове, посветени на търсенето в Интернет. Инструментите за търсене от групата ϶ᴛᴏth ще позволят на потребителя, съгласно определени правила, да формулира изисквания за информацията, от която се нуждае (създаване на заявка, използвайки езика на заявката). » търсачката, ϲᴏᴏᴛʙᴇᴛʙᴇᴛϲᴛʙ следва дефинирани от потребителя изисквания (релевантни за заявката ) Възлите за търсене могат да използват свои собствени интернет индекси, постоянно актуализирани от специални програми, наречени паяци (паяци) Програмата паяк изследва мрежата, проверявайки всяка връзка на дадена страница, след това на страници, адресирани връзки и т.н., и информира своя собственик за всички страници за последващо индексиране.

В резултат на търсенето се създават една или повече страници, съдържащи връзки към документи (уеб страници), подходящи за заявката. Струва си да се каже, че за всяка връзка, датата на създаване на документа, неговия обем, степента на релевантност към заявката обикновено се посочват и текстови фрагменти, които характеризират съдържанието на документа. Щракването върху такава връзка ви позволява да изтеглите страницата, която ви интересува. В случай на много голям брой намерени документи, можете да прецизирате заявката и в ϲᴏᴏᴛʙᴇᴛϲᴛʙ и да повторите търсенето с нея, но само сред избраните страници (такова търсене се нарича различно в различните машини, но обикновено ϶ᴛᴏ - търсене в намереното) В редица търсачки можете да използвате определен метод, да промените връзката към страницата, чието съдържание отговаря най-добре на вашите нужди, и да повторите търсенето, което изисква от вас да търсите подобни.

Предимството на автоматизираното търсене всъщност е, че предоставя преглед на много големи количества информация, налична в Интернет на този момент. В същото време сложността на точното описание на заявката, която адекватно отразява вашите информационни нужди, както и още по-голямата сложност на задачата за автоматично определяне на степента на ϲᴏᴏᴛʙᴇᴛϲᴛʙ вашата заявка на разгледаните страници, води до факта, че броят на страниците, избрани „при първо изпълнение“, традиционно е или много малък, или прекалено голям. Като цяло търсенето с помощта на търсачка е итеративен (многопроходен) процес, в резултат на който формулярът за заявка постепенно се усъвършенства.

Метатърсачки

Както беше отбелязано по-горе, всяка търсачка преглежда определен набор от сървъри и избира документи в ϲᴏᴏᴛʙᴇᴛϲᴛʙii със свои собствени критерии. В резултат на това търсенето от различни системи за едни и същи ключови думи дава различни резултати. Това доведе до идеята за създаване на така наречените системи за метатърсене (или мултитърсене), които не търсят нищо сами, а се обръщат за помощ към няколко търсачки наведнъж. Имайте предвид, че всяка от метатърсачките има ϲʙᴏти език за заявки. Системата превежда заявката, формулирана на нейния език, на езиците за заявки, използвани от всяка търсачка. Освен това резултатите от търсенето от всички системи се комбинират и представят в ϲᴏᴏᴛʙᴇᴛϲᴛʙ форма. Естествено, търсенията с помощта на метатърсачки отнемат повече време от конвенционалните търсачки.

Преглед на най-популярните търсачки

В интернет има голям брой търсачки и всеки потребител се ръководи от тази, към която е свикнал или към която са го посъветвали негови колеги. Ще използваме кратко описание на най-популярните търсачки, което е дадено на един от сайтовете.

1. Google (www.google.com) Най-бързата и най-голяма търсачка. Повече от 1,3 милиарда страници са индексирани (от които малко над 700 милиона са напълно, за останалите са известни само адресът и текстът на връзката). Можете да включвате/изключвате резултати от конкретни сайтове и/или домейни. За разлика от повечето търсачки, Google оценява популярността на даден ресурс по броя на връзките, водещи към него от други страници. Има тематично ориентирано търсене - Apple Macintosh, BSD UNIX, Linux, американско правителство и университетско търсене - търсене в ресурсите на водещи научни и образователни институции.

2. Yandex (www.yandex.ru) Най-добрата местна търсачка. Той индексира предимно рускоезични ресурси, докато ϶ᴛᴏm не отстъпва на чуждите системи по отношение на възможностите. Търсенето може да се извършва точно или във всякакви словоформи, ограничено по дата, посочвайки сайта или неговата поддиректория. Можете да търсите на базата на така наречения индекс на цитиране, да търсите изображения, скриптове, аплети; задайте езика на документа. Необходимите връзки традиционно се намират в първите десет резултата. Има "олекотена" версия (с минимум дизайнерски елементи) на http://www.ya.ru.

3. AltaVista (www.altavista.com) Предоставя голямо разширение на критериите за търсене: в Разширено търсене има избор на времеви интервал, който включва датата на създаване или модификация на ресурса, поддръжка на 25 езика; има възможност за издаване на един резултат на сайт (϶ᴛᴏ стеснява кръга на търсене, без да жертва качеството) Мощното търсене има стандартен набор от функции. Доскоро AV беше голям портал, но поради финансови (и не само) причини значително намали броя на услугите.

4 Yahoo! (www.yahoo.com) Важно е да се отбележи, че една от първите търсачки в Интернет. Освен от стандартен комплектфункции, ви позволява да избирате ресурси по дата (4 години, 1, 3, 6 месеца, седмица, 1, 3 дни) Поддържа възможността да посочите знака "*" вместо произволна последователност от знаци в ключовите думи. В Yahoo! беше съставен голям структуриран каталог от категории (категории), Първо търсенето се извършва в тях, след това в собствен архив, след това - с помощта на Google системи. Търсенето в категории дава добри резултати - малко са и са добри.

5. Lycos (www.lycos.com) Напоследък – една от най-популярните системи. С всичко това не предоставя никакви специални функции - "И" "ИЛИ", търсене на фрази, задължително присъствие / липса на дума; в разширени функции - търсене в заглавие, URL, име на хост и/или име на домейн; 25 езика, включително руски - с една дума, целият "общоприет" набор. Можете да посочите вида на съдържанието на ресурса - автоматично, книги, ftp, изтегляне, новини и др. Очевидно популярността на Lycos е следствие от мащаба на ϶ᴛᴏth голям проект.

6. Rambler (www.rambler.ru) Доскоро най-известната руска търсачка. Разширеното търсене не ви позволява да търсите по фрази, а редовното търсене до февруари 1999 г. рядко дава приемливи резултати. От февруари системата ϶ᴛᴏ използва подобрена търсачка, дизайнът се промени, но качеството на Rambler все още не е равно на Yandex и Aport (според автора, който анализира търсачките) Сайтът има рейтингов каталог на Rambler Top 100 ресурси, един от признатите източници на статистическа информация за интернет проекти.

7. Aport (www.aport.ru) Друга добра руска търсачка. Търсенето се извършва по текст (само във всички словоформи) и по URL, като се използва логически оператории оператор "…" (обаче стоп думите във фразата все още се игнорират), по дата и в отделни полета (заглавие, описание и т.н.), мета-символи * и! Представянето на резултатите от търсенето е най-добре проектирано в сравнение с други руски търсачки. Известни съмнения предизвиква дизайнът на главната страница, която очевидно е претоварена с информация. На http://aport.ru има малко "олекотена" версия.

Как да изберем търсачка

При търсене в Интернет са важни два компонента - пълнота (нищо не е загубено) и точност (нищо допълнително не е намерено).

1. Покритие и дълбочина

Покритието се отнася до обема на базата данни на търсачката, който се измерва с три показателя – общо количество индексирана информация, брой уникални сървъри и брой уникални документи. Под дълбочина се разбира дали има ограничение за броя на страниците или за дълбочината на влагането на директория на един сървър.

Как да проверите: Някои машини пишат статистики за роботи на този сайт. Но можете да го проверите сами - трябва да попитате няколко заявки за търсене, състоящ се от една дума (ɥᴛᴏ, за да се изключи влиянието на езика на заявката, включително различни интерпретации на интервала), а когато ϶ᴛᴏm погледнете статистиката на резултатите, издадени от машината - обикновено в началото на списъка се посочва колко общо документа са намерени. Освен, че думите трябва да са от различни области, е добре да се вземат думи с различна тежест - редки, "средни" и "тежки" (често срещани), и да се сравнява броят на намерените. Тежките думи, по-специално, тестват пълния текст (индексиране на всички думи в документа) на търсачката.

По-трудно е да се провери дълбочината на ходене на робота - за ϶ᴛᴏ е необходимо да вземете някои сайтове, например с разклонена архивна структура, и да проверите дали документите са индексирани, които могат да бъдат достигнати само, например в 6 клика върху връзките.

2. Скорост на обхождане и уместност на връзките

Скоростта на преминаване в мрежата показва колко бързо се индексира новодобавен ресурс и колко бързо се актуализира информацията в базата данни. Не забравяйте, че важен показател за качеството на търсачката (нейния робот) ще бъде не само улавянето на нови територии, но и наблюдението на състоянието на вече обхванатите. Сървърите изчезват и остават, страниците на тях се актуализират. Връзките, които търсачката дава в списъка с намерени, трябва, първо, да съществуват и, второ, тяхното съдържание трябва да отговаря на заявката.

Как да проверите: Обективна информация може да бъде получена чрез анализиране на регистрационните файлове на сървъра - роботът на търсачката обикновено е представен от името на своята машина (или подобно), така че можете да видите колко често посещава сървъра, колко страници преглежда, и т.н. За съжаление обикновено дневникът само на ϲʙᴏ от неговия сайт е достъпен за проучване, така че експерименталният метод остава.

За да определите скоростта на обхождане, трябва да създадете някъде страница с текст, да я добавите към търсачките и да видите колко бързо ще започне да се появява. Или променете съществуваща страница. Струва си да се каже, че за да определите уместността на връзките, проверете документите поне на първата страница от списъка, намерен за няколко заявки. Съобщение не е намеренопоказва, че документът вече не съществува.

3. Качество на търсенето (субективен показател)

Струва си да се каже, че всяка търсачка има ϲʙᴏ и алгоритъм за сортиране на резултатите от търсенето. Колкото по-близо до върха на списъка е документът, от който се нуждаете, толкова по-добре работи уместността.

Как да проверите: Само чрез опит. Препоръчително е да правите заявки с различна дължина за сравнение. Можете също да използвате езика на заявката, докато ϶ᴛᴏm тези, които не са склонни да четат описанието, могат да използват разширената страница за заявка („разширено търсене“ в Aport и Yandex, „подробна заявка“ в Rambler - опции за превод на руски „разширено търсене“ )

В допълнение към уместността има важни потребителски характеристики.

4. Скорост на търсене

Ако търсачката реагира бавно, работата с нея е неефективна. Струва си да се добави, че скоростта, видяна от потребителя, зависи не само от самата търсачка, но и от интернет каналите.

Как да проверите: Чрез експеримент - трябва да търсите заявки с различна дължина, различни<тяжести>думи и по различно време на деня (натоварването на сървъра е значително неравномерно през целия ден, пикът е около три до четири часа следобед)

5. Възможности за търсене (работа с езика на документа, език за заявки)

Друга точка за сравнение е какво точно и как търсачката допринася за индекса. Струва си да се каже, че търсачката с пълен текст индексира всички думи от текста, видими за потребителя. Наличието на морфология прави възможно намирането на желаните думи във всички склонения или спрежения. В допълнение към ϶ᴛᴏgo, в HTML езикима тагове, които също могат да бъдат обработени от търсачка (заглавия, връзки, надписи на изображения и т.н.)

Почти всички машини имат език за заявки под формата на стандартни логически оператори (И, ИЛИ, НЕ). Някои могат да търсят фрази или думи на дадено разстояние - ϶ᴛᴏ често е важно за получаване на разумен резултат. Допълнителна функция ще бъде търсене в зони на документи - заглавия, връзки, ключови думи (META KEYWORDS) и др. Допълнителна функцияезик за заявки - заявка на естествен език, която не изисква познаване на оператори.

Как да проверите: Обикновено тази информация се публикува на сървъра на търсачката (в Помощ "e). Имайте предвид, че все пак се препоръчва да проверявате реални заявки, тъй като понякога това, което искате, се дава като валидно.

6. Допълнителни удобства

Това са допълнителни функции, които търсачката предоставя на потребителите. Това включва всички видове опции за търсене (специализирани страници, търсене на подобни документи, ограничаване на обхвата на търсенето) и списък с намерени сървъри и търсене по дати и сървъри, и удобен за потребителя интерфейстърсачка и възможността за нейното персонализиране.

Как да проверите: Информацията може да е частично публикувана на сървъра на търсачката, но най-добре е да се опитате сами да работите с тези функции.

Ясно е, че този анализ ще отнеме известно време. Освен това търсачките, както и останалата част от Интернет, не стоят неподвижни. В същото време, като се има предвид, че търсенето на информация е един от важните компоненти компютърна технология, ϶ᴛᴏ трябва да се обърне достатъчно внимание - поне не по-малко от способността за работа в локална мрежа.

Беше проведено проучване на Yandex.ru: защо е необходим Интернет и какво му липсва (http://www.yandex.ru/polling/9.html) В низходящ ред данните от проучването бяха разпределени, както следва: Интернет е използван като директория (23, 76%), инструмент за проучване (15,45%), забавление (14,15%) и едва на четвърто място - източник на новини (12,32%) Звучи оптимистично, че 10% от потребителите винаги, а 73% често успяват да намерят информацията, от която се нуждаете. И какво липсва в Интернет: информация, добро търсене и ред (включително: подреденост, структура, структура, структурираност, структуриране, както и системи, систематизация, систематизация, системност и систематизация)

ОТГОВОРИ НА ВЪПРОСИТЕ:

Какви са методите за организиране на търсенията в Интернет?

Как се търси информация в каталози и бази данни?

Как се въвежда информация в каталози и бази данни?

Какво представляват интернет търсачките?

Как се формира информационна база данни в търсачките?

Откъде започва търсенето на информация в търсачките?

Какво е заявка?

Как се търси информация в търсачките?

Какво се разбира под релевантност на заявката?

Какво може да се направи в случай на много голям брой документи, открити при по-нататъшно търсене?

Какво представляват метатърсачките?

Каква е основната разлика между метатърсачките и конвенционалните търсачки?

Коя от следните системи ще бъде метатърсачка:

Кои са най-популярните местни търсачки?

Кои са най-популярните чужди търсачки?

Кои два компонента са важни при търсене на информация в Интернет?

Какви характеристики определят ефективността на търсачките при търсене на информация в Интернет?

Условия за ползване:
Права на интелектуална собственост върху материала - Информационен компютърни мрежи- Борисов Н.А., Лукин А.А. принадлежат на своя автор. Това ръководство / книга е публикувано само за информационни цели, без участие в търговско обращение. Цялата информация (включително "Тема 3. Търсене на информация в ИНТЕРНЕТ") се събира от отворени източници или се добавя от потребителите безплатно.
За пълното използване на публикуваната информация Администрацията на проекта на сайта силно препоръчва закупуването на книга / наръчник Информационни компютърни мрежи - Борисов Н.А., Лукин А.А. във всеки онлайн магазин.

Tag-block: Информационни компютърни мрежи - Борисов Н.А., Лукин А.А., 2015 г. Тема 3. Търсене на информация в ИНТЕРНЕТ.

(C) Сайт на правно хранилище 2011-2016

Три начина за търсене в Интернет

Интернет като цяло и в частност World Wide Web предоставят на абоната достъп до хиляди сървъри и милиони уеб страници, които съхраняват невъобразимо количество информация. Как да не се изгубите в този "информационен океан"? За да направите това, трябва да се научите как да търсите и намирате необходимата информация в мрежата.

Както вече споменахме, има три основни начина за намиране на информация в Интернет.

1. Посочване на адреса на страницата.Това е най-бързият метод за търсене, но може да се използва само ако адресът на документа е известен точно.

2. Навигация чрез хипервръзки.Това е най-малко удобният метод, тъй като може да се използва за търсене на документи, които са подобни по смисъл на текущия документ. Ако текущият документ е посветен например на музика, тогава с помощта на хипервръзките на този документ едва ли ще е възможно да стигнете до сайт, посветен на спорта.

3. Свързване със сървър за търсене (търсачка). Използването на търсачки е най-удобният начин за намиране на информация. В момента следните сървъри за търсене са популярни в рускоезичната част на Интернет: Yandex; Рамблер.

Има и други търсачки. Например, на сървъра за пощенска услуга mail.ru е внедрена ефективна система за търсене.

Сървъри за търсене

Най-достъпният и удобен начин за намиране на информация в World Wide Web е използването на търсачките. В същото време информацията може да се търси по каталози, както и по набор от ключови думи, характеризиращи търсения текстов документ.

Разгледайте по-подробно използването на сървъри за търсене. сървър за търсенесъдържа голям брой връзки към голямо разнообразие от документи и всички тези връзки са систематизирани в тематични директории. Например: спорт, филми, коли, игри, наука и т.н. Освен това тези връзки се задават от сървъра независимо, автоматично чрез редовно преглеждане на всички уеб страници, които се появяват в световната мрежа. Освен това сървърите за търсене предоставят на потребителя възможност за търсене на информация по ключови думи. След въвеждане на ключови думи сървърът за търсене започва да преглежда документи на други уеб сървъри и показва връзки към тези документи, в които са намерени посочените думи. Обикновено резултатите от търсенето се сортират в низходящ ред по специална оценка на документа, която показва колко добре даден документ отговаря на критериите за търсене или колко често се изисква в мрежата.

Език за заявки в търсачката

Група от ключови думи, формирани по определени правила - с помощта на езика на заявките, се нарича заявка към сървъра за търсене. Езиците за заявки за различните търсачки са много сходни. Можете да научите повече за това, като посетите секцията "Помощ" на желания сървър за търсене. Помислете за правилата за генериране на заявки на примера на търсачката Yandex.

Синтаксис на оператора Какво означава оператор Пример за заявка
интервал или & Логическо И (в рамките на изречението) Неподвижни протези
&& Логическо И (в рамките на документа) Видове && (Неподвижни протези)
| Логическо ИЛИ снимка | фотография | моментна снимка | фотографско изображение
+ Задължително присъствие на думата в намерения документ +да бъдеш или +да не бъдеш
() Групиране на думи (технология | производство) (сирене | извара)
~ Бинарен оператор И НЕ (в изречение) банки ~ закон
~~ или _ Двоичен оператор И НЕ (в рамките на документа) Пътеводител за Париж ~~ (агенция | обиколка)
/(nm) Разстояние с думи (минус (-) - назад, плюс (+) - напред) доставчици /2 кафе музика /(-2 4) свободни работни места за образование ~ /+1 студенти
« « Търсене по фраза „Неподвижни зъбни протези“ Еквивалент на: Фиксирани /+1 зъбни протези
&&/(nm) Разстояние в изречения (минус (-) - назад, плюс (+) - напред) медицина && /1 протези

Главна информация.

В момента Интернет обединява стотици милиони сървъри, които хостват милиарди различни сайтове и отделни файлове, съдържащи различни видове информация. Това е гигантско хранилище на информация. Има различни методи за търсене на информация в Интернет.

Търсене по известен адрес. Необходимите адреси се вземат от указатели. Знаейки адреса, просто го въведете адресна лентаБраузър.

www.gov.ru - сървър на руски държавни органи.

Изграждане на адрес от потребителя. Познавайки системата за генериране на интернет адреси, можете да конструирате адреси, когато търсите уеб сайтове.

Необходимо е да добавите тематичен или географски домейн към ключова дума (името на фирма, предприятие, организация или просто английско съществително) и интуицията трябва да бъде свързана.

Адреси на търговски уеб сайтове:

www.cnn.com (CNN World News),

www.sony.com SONY),

www.mtv.com (MTV музикални новини).

Адреси на учебни заведения:

www.ntu.edu (Национален университет на САЩ).

Адреси на регионални сървъри:

www.poland.net (Полша),

www.israil.net (Израел).

Интернет търсачки

За търсене на информация в Интернет са разработени специални системи за извличане на информация. Търсачките имат редовен адрес и се показват като уеб страница, съдържаща специални инструменти за организиране на търсенето (низ за търсене, тематичен каталог, връзки). За да извикате търсачка, просто въведете нейния адрес в адресната лента на браузъра.

Според метода на организиране на информацията системите за търсене на информация се разделят на два вида: класификация (рубикатори) и речник.

Рубрикаторите (класификаторите) са търсачки, които използват йерархична (дървовидна) организация на информацията. Когато търси информация, потребителят преглежда тематични заглавия, като постепенно стеснява полето за търсене (например, ако трябва да намерите значението на дадена дума, първо трябва да намерите речник в класификатора и след това да го намерите в него точна дума).

Системите за търсене в речници са мощни автоматични софтуерни и хардуерни системи. С тяхна помощ се преглежда (сканира) информация в интернет. Данните за местоположението на тази или онази информация се въвеждат в специални справочници-индекси. В отговор на заявката се извършва търсене в съответствие с низа на заявката. В резултат на това на потребителя се предлагат онези адреси (URL), където търсената дума или група от думи е намерена по време на сканирането. Като изберете някоя от предложените връзки, можете да отидете до намерения документ. Повечето съвременни търсачки са смесени.

Най-известните и популярни търсачки:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

Има системи, които са специализирани в търсенето информационни ресурсив различни посоки.

Търсете хора в интернет:

www.whowhere.ru www. bigfoot.com

Търсене по дискусионни групи (Usenet):

www.dejanews.com

Тематични търсачки:

Търсене софтуер:

Търсене във файлови архиви:

http://ftpseach.com city.ru, http://ftpsearch. licos.com

Каталози (тематични колекции от връзки с анотации):

http://www.atrus.ru

Често ефективното търсене на информация може да се извърши с помощта на регионални каталози - специализирани сървъри, съдържащи данни за предприятия или уеб ресурси на град или регион. Например за Санкт Петербург такъв каталог се намира на http://www.spb.ru.

Списък на IPS може да бъде намерен на www.monk. newmail.ru

По-подробен списък на търсачките и директориите е представен в таблица. 3.2.

Правила за изпълнение на заявки

Във всяка търсачка, в секцията Помощ, можете да получите информация как да търсите, как да съставите низ за заявка. По-долу е дадена информация за типичен, "среден" език за заявки.

Проста молба.

Въведете една дума, която определя темата за търсене. Например в търсачката Rambler.ru е достатъчно да въведете: автоматизация.

Намерени са документи, които съдържат думите, посочени в заявката. Разпознават се всички форми на руски думи, като правило буквите се игнорират.

Можете да използвате знака "*" или "?" в заявката. Знак "?" в ключовата дума се заменя един знак, на мястото на който може да се замени произволна буква, а знакът "*" е последователност от знаци.

Например автоматът за заявки* ще намери документи, които включват думите автоматичен, автоматичен и т.н.

Комплексно искане.

Често има нужда от комбиниране на ключови думи, за да се получи по-конкретна информация. В този случай се използват допълнителни свързващи думи, функции, оператори, символи, комбинации от оператори, разделени със скоби.

Например, заявката музика & (beatles | beatles) означава, че потребителят търси документи, съдържащи думите музика и beatles или музика и beatles.

Таблица 3.1 показва правилата за генериране на заявки, приети в системата Aport (http://www.aport.ru).

Таблица 3.1

Оператори за формиране на заявки

Оператор Синоними Коментирайте
И И & Заявката ще намери документи, съдържащи и двете ключови думи. Може да е написано, а може и да не е. Например заявката: компютърни науки и учебник е еквивалентна на учебник по компютърни науки
ИЛИ ИЛИ | Търси онези документи, които използват една от посочените думи или и двете думи едновременно
НЕ НЕ-~ Търсенето е ограничено до документи, които не съдържат думата, посочена след оператора
" " " " Двойните или единичните кавички ви позволяват да намерите фраза
Дата= дата:дата= Търсенето е ограничено до документи, които попадат в зададения интервал от дати Пример 1. валутна дата=01/02/2002-01/03/2002. Тази заявка ще върне документи, съдържащи думата "валута" и имащи дата между 1 февруари 2002 г. и 1 март 2002 г. Пример 2. date=01/03/2002 валута Пример 3. дата:<02/03/2002 валюта

Таблица 3.2

Списък на сървъри за търсене и директории

Адрес Описание
www.excite.com Търсачка с прегледи на възли и ръководства
www.alta-vista.com Сървър за търсене, налични са разширени възможности за търсене
www.hotbot.com сървър за търсене
www.poland.net www.israil.net Регионални сървъри за търсене на Полша, Израел
www.ifoseek.com Сървър за търсене (лесен за използване)
www.ipl.org Интернет публична библиотека, обществена библиотека, работеща като част от проекта World Village
www.wisewire.com WiseWire - организация на търсене с помощта на изкуствен интелект
www.webcrawler.com WebCrawler - сървър за търсене, лесен за използване
www.yahoo.com Уеб каталог и интерфейс за достъп до пълнотекстово търсене на сървъра на AltaVista
www.aport.ru Aport - сървър за търсене на руски език
www.yandex.ru Yandex - сървър за търсене на руски език
www.rambler.ru Rambler - сървър за търсене на руски език
Помощни ресурси в Интернет
www.yellow.com Интернет жълти страници
монах. newmail.ru Търсачки с различни профили
www.top200.ru Топ 200 уебсайта
www.allru.net
www.ru Каталог на руски интернет ресурси
www.allru.net/z09. htm Образователни ресурси
www.students.ru Руски студентски сървър
www.cdo.ru/index_new. аспид Център за дистанционно обучение
www.open. ак. Великобритания Open University UK
www.ntu.edu Национален университет на САЩ
www.translate.ru Електронен текстов преводач
www.pomorsu.ru/guide. библиотека.html Списък с връзки към нетни библиотеки
www.elibrary.ru Научна електронна библиотека
www.citforum.ru Електронна библиотека
www.infamed.com/psy Психологически тестове
www.pokoleniye.ru Уебсайт на федерацията за интернет образование
www.метод. people.ru Образователни ресурси
www.spb. www.osi.ru/ic/distant Дистанционно обучение по интернет
www.examen.ru Изпити и тестове
www.kbsu.ru/~book/ Учебник по информатика
мега. km.ru Енциклопедии и речници

Търсене на информация в Интернет: капани

Проблемите, които не лежат на повърхността, често се усещат само "в ретроспекция", след като определен етап от проучвателната работа е завършен и може би въз основа на неговите резултати вече е взето някакво решение. Какво пречи да направим ситуацията прозрачна от самото начало на работата на тази или онази система за извличане на информация (IPS)? Отговорът е съвсем прост: липсата на изчерпателна информация от този вид от страна на разработчика. Пряката последица от това е недостоверността на получените данни и тяхната неконтролирана загуба. Рядко се среща търсачка в мрежата, която да няма някои „недокументирани“ функции. Изглежда, че потребителят не се нуждае от толкова много информация, а именно:

как се попълва базата данни на IPS и какъв е нейният обем;

пълен набор от възможности на езика за търсене на системата;

основните характеристики на представянето на резултатите от търсенето, преди всичко алгоритъма за класиране на записи от списъка с отговори на заявка за търсене.

Уви, източникът на такава информация обикновено не е документ, достъпен от главната страница на сървъра за търсене, а публикации на отделни автори, разпръснати в мрежата, книги и компютърни списания. Причините за това състояние на нещата, очевидно, включват не само небрежността на разработчика, но и фактор, наречен маркетингова политика. Просто казано, предоставянето на търсачката на най-пълната информация за себе си не винаги има положителен ефект върху нейното класиране. Въпреки това, в някои случаи потребителят е напълно способен да вземе ситуацията под контрол. Често е възможно да разберете характеристиките на избраната услуга за търсене с помощта на тестване. Изграждането на специални тестови заявки, които бързо изясняват точно този аспект от работата на системата, който е най-важен за текущата задача, в много случаи се оказва нетривиално. Как да избегнем някои от проблемите при работа с IPS, ще посветим нашата дискусия. Като примери, илюстриращи презентацията, ще бъдат разгледани широко известни интернет търсачки.