Какво е

DuckDuckGo е доста добре позната търсачка с отворен код. програмен код. Сървърите се намират в САЩ. В допълнение към собствения си робот, търсачката използва резултатите от други източници: Yahoo, Bing, Wikipedia.

Колкото по-добре

DuckDuckGo се позиционира като най-доброто търсене на поверителност и поверителност. Системата не събира никакви данни за потребителя, не съхранява регистрационни файлове (няма история на търсенията), използва бисквиткимаксимално ограничено.

DuckDuckGo не събира и не споделя лична информация от потребителите. Това е нашата политика за поверителност.

Габриел Вайнберг, основател на DuckDuckGo

Защо ви трябва това

Всички големи търсачки се опитват да персонализират резултатите от търсенето въз основа на данни за човека пред монитора. Това явление се нарича "филтърен балон": потребителят вижда само онези резултати, които са в съответствие с неговите предпочитания или които системата счита за такива.

Формира обективна картина, която не зависи от предишното ви поведение в мрежата, и елиминира тематичното реклами в googleи "Yandex", въз основа на вашите заявки. С помощта на DuckDuckGo е лесно да се търси информация на чужди езици, докато Google и Yandex предпочитат по подразбиране сайтове на руски език, дори ако заявката е въведена на друг език.


Какво е

not Evil е система, която търси в анонимната мрежа Tor. За да го използвате, трябва да отидете в тази мрежа, например, като стартирате специализиран .

not Evil не е единствената търсачка по рода си. Има LOOK (търсене по подразбиране в браузъра Tor, достъпно от обикновения интернет) или TORCH (една от най-старите търсачки в мрежата Tor) и други. Спряхме се на not Evil поради безпогрешния намек за Google (само погледнете началната страница).

Колкото по-добре

Той търси къде на Google, Yandex и други търсачки е отказан достъп по принцип.

Защо ви трябва това

В мрежата Tor има много ресурси, които не могат да бъдат намерени в спазващия закона интернет. И техният брой ще расте със затягането на контрола на властите върху съдържанието в мрежата. Tor е вид мрежа в мрежата със своите социални мрежи, торент тракери, медии, платформи за търговия, блогове, библиотеки и т.н.

3. YaCy

Какво е

YaCy е децентрализирана търсачка, която работи на принципа на P2P мрежите. Всеки компютър, който има основен софтуерен модул, сканира интернет самостоятелно, тоест е аналог на робот за търсене. Получените резултати се събират в обща база данни, която се използва от всички участници в YaCy.

Колкото по-добре

Тук е трудно да се каже дали това е по-добро или по-лошо, тъй като YaCy е напълно различен подход за организиране на търсенето. Липсата на един сървър и компания собственик прави резултатите напълно независими от нечии предпочитания. Автономността на всеки възел изключва цензура. YaCy може да търси в дълбоката мрежа и неиндексирани обществени мрежи.

Защо ви трябва това

Ако сте поддръжник на отворен код и безплатен интернет, не се влияе от държавни агенции и големи корпорации, тогава YaCy е вашият избор. Може да се използва и за организиране на търсения в рамките на корпоративна или друга автономна мрежа. И въпреки че YaCy не е много полезен в ежедневието, той е достойна алтернатива на Google по отношение на процеса на търсене.

4. Пипл

Какво е

Pipl е система, предназначена за търсене на информация за конкретно лице.

Колкото по-добре

Авторите на Pipl твърдят, че техните специализирани алгоритми търсят по-ефективно от "обикновените" търсачки. По-специално профилите са с приоритет социални мрежи, коментари, списъци с участници и различни бази данни, където се публикува информация за хора, като бази данни със съдебни решения. Лидерството на Pipl в тази област се потвърждава от Lifehacker.com, TechCrunch и други публикации.

Защо ви трябва това

Ако трябва да намерите информация за човек, живеещ в САЩ, тогава Pipl ще бъде много по-ефективен от Google. Базите данни на руските съдилища очевидно са недостъпни за търсачката. Следователно той не се справя толкова добре с гражданите на Русия.

Какво е

FindSounds е друга специализирана търсачка. Търси в отворени източници различни звуци: къща, природа, коли, хора и т.н. Услугата не поддържа заявки на руски, но има впечатляващ списък с тагове на руски език, които можете да търсите.

Колкото по-добре

При издаването само на звуци и нищо повече. В настройките можете да зададете желания формат и качество на звука. Всички намерени звуци са достъпни за изтегляне. Има търсене по образец.

Защо ви трябва това

Ако трябва бързо да намерите звука на изстрел от мускет, удара на смучещ кълвач или вика на Хоумър Симпсън, тогава тази услуга е за вас. И ние избрахме това само от наличните заявки на руски език. На английски езикспектърът е още по-широк.

Сериозно, специализираната услуга предполага специализирана аудитория. Но ще ви бъде ли полезно и на вас?

Какво е

Wolfram|Alpha е изчислителна търсачка. Вместо връзки към статии, съдържащи ключови думи, той дава готов отговор на заявката на потребителя. Например, ако въведете „сравнете населението на Ню Йорк и Сан Франциско“ на английски във формата за търсене, тогава Wolfram|Alpha веднага ще покаже таблици и графики със сравнение.

Колкото по-добре

Тази услуга е по-добра от другите за намиране на факти и изчисляване на данни. Wolfram|Alpha натрупва и систематизира знанията, налични в мрежата от различни областивключително наука, култура и развлечения. Ако тази база данни съдържа готов отговор на заявка за търсене, системата го показва, ако не, изчислява и показва резултата. В този случай потребителят вижда само и нищо повече.

Защо ви трябва това

Ако сте например студент, анализатор, журналист или изследовател, можете да използвате Wolfram|Alpha, за да намерите и изчислите данни, свързани с вашите дейности. Услугата не разбира всички заявки, но непрекъснато се развива и става по-умна.

Какво е

Метатърсачката Dogpile показва комбиниран списък с резултати от търсачките. Google SERPs, Yahoo и други популярни системи.

Колкото по-добре

Първо, Dogpile показва по-малко реклами. Второ, услугата използва специален алгоритъм за намиране и показване най-добри резултатиот различни търсачки. Според разработчиците на Dogpile тяхната система генерира най-пълния проблем в целия Интернет.

Защо ви трябва това

Ако не можете да намерите информация в Google или друга стандартна търсачка, потърсете я в няколко търсачки едновременно с помощта на Dogpile.

Какво е

BoardReader е система за текстово търсене във форуми, услуги за въпроси и отговори и други общности.

Колкото по-добре

Услугата ви позволява да стесните полето за търсене до социални сайтове. Благодарение на специалните филтри можете бързо да намерите публикации и коментари, които отговарят на вашите критерии: език, дата на публикуване и име на сайта.

Защо ви трябва това

BoardReader може да бъде полезен за PR специалисти и други медийни специалисти, които се интересуват от мнението на медиите по определени въпроси.

Накрая

Животът на алтернативните търсачки често е мимолетен. Lifehacker попита бившия изпълнителен директор на украинския клон на Yandex Сергей Петренко за дългосрочните перспективи за подобни проекти.


Сергей Петренко

Бивш главен изпълнителен директор на Yandex.Ukraine.

Що се отнася до съдбата на алтернативните търсачки, тя е проста: да бъдат много нишови проекти с малка аудитория, следователно без ясни търговски перспективи или, обратно, с пълната яснота за тяхното отсъствие.

Ако погледнете примерите в статията, можете да видите, че такива търсачки или са специализирани в тясна, но търсена ниша, която може би само досега не е нараснала достатъчно, за да бъде забележима на радарите на Google или Yandex, или тестват оригинална хипотеза в класирането, която все още не е приложима в конвенционалното търсене.

Например, ако едно търсене в Tor изведнъж се окаже търсено, тоест поне процент от аудиторията на Google ще се нуждае от резултатите от там, тогава, разбира се, обикновените търсачки ще започнат да решават проблема как да намерете ги и ги покажете на потребителя. Ако поведението на аудиторията показва, че значителна част от потребителите в значителен брой заявки изглеждат по-подходящи резултати, данни, без да се вземат предвид фактори, които зависят от потребителя, тогава Yandex или Google ще започнат да дават такива резултати.

„Да бъдеш по-добър“ в контекста на тази статия не означава „да бъдеш по-добър във всичко“. Да, в много аспекти нашите герои са далеч от Yandex (дори далеч от Bing). Но всяка от тези услуги дава на потребителя нещо, което гигантите в индустрията за търсене не могат да предложат. Със сигурност и вие знаете подобни проекти. Споделете с нас - да обсъдим.

ПРОФЕСИОНАЛНО ТЪРСЕНЕ НА ИНФОРМАЦИЯ В ИНТЕРНЕТ

Търсенето в интернет е важен елемент от работата в мрежата. Точният брой уеб ресурси на съвременния Интернет едва ли е известен със сигурност на никого. Така или иначе сметката отива в милиарди. За да можете да използвате информацията, която ви е необходима в този конкретен момент, независимо дали за бизнес или за развлекателни цели, първо трябва да я намерите в този непрекъснато попълван океан от ресурси.

За да бъде успешно търсенето в Интернет, трябва да са изпълнени две условия: заявките да са добре формулирани и да се задават на подходящи места. С други думи, от една страна, от потребителя се изисква да може да преведе своите интереси за търсене на езика заявка за търсене, а от друга страна, добро познаване на търсачките, наличните инструменти за търсене, техните предимства и недостатъци, което ще ви позволи да изберете най-подходящите инструменти за търсене във всеки конкретен случай.

В момента няма нито един ресурс, който да отговаря на всички изисквания за търсене в Интернет. Следователно, със сериозен подход към търсенето, неизбежно трябва да използвате различни инструменти, като използвате всеки в най-подходящия случай.

Основен инструменти за търсене в интернетмогат да бъдат разделени на следните основни групи:

търсачки;

Уеб директории;

Справочни ресурси;

Локални програми за търсене в интернет.

Най-популярната търсачка етърсачки- така наречените интернет търсачки (Search Engines). Тримата лидери в световен мащаб са доста стабилни - това са Google, Yahoo! и Bing. Много страни добавят свои собствени локални търсачки, оптимизирани за местно съдържание към този списък. С тяхна помощ, теоретично, можете да намерите всяка конкретна дума на страниците на много милиони сайтове. От гледна точка на потребителя основният недостатък на търсачките е неизбежното присъствиеинформационен шумв резултатите. Така е прието да се наричат ​​резултати, които по една или друга причина са включени в списъка с резултати, които не отговарят на заявката.

Въпреки многото различия, всички интернет търсачки работят на сходни принципи и от техническа гледна точка се състоят от подобни подсистеми. Първата структурна част на търсачката - специални програми, използван за автоматично търсене и последващо индексиране на уеб страници. Такива програми обикновено се наричат ​​паяци или ботове. Те разглеждат кода на уеб страниците, намират връзки, разположени върху тях, и по този начин откриват нови уеб страници. Също така има алтернативен начинвключване на сайта в индекса. Много търсачки предлагат на собствениците на ресурси възможност сами да добавят сайт към своята база данни. Както и да е, тогава уеб страниците се изтеглят, анализират и индексират. В тях се подчертават структурни елементи, намират се ключови думи, определят се връзките им с други сайтове и уеб страници. Извършват се и други операции, резултатът от които е формирането на индексната база на търсачката. Тази база е вторият основен елемент на всяка търсачка. Понастоящем няма една абсолютно пълна индексна база данни, която да съдържа информация за цялото съдържание на Интернет. Тъй като различните търсачки използват различни програми за търсене на уеб страници и изграждат своя индекс с помощта на различни алгоритми, базите на индексите на търсачките могат да варират значително. Някои сайтове се индексират от няколко търсачки, но винаги има определен процент ресурси, включени в базата данни само на една търсачка. Фактът, че всяка търсачка има такава оригинална и незапокриваща се част от индекса, ви позволява да направите важно практическо заключение: ако използвате само една търсачка, дори и най-голямата, определено ще загубите определен процент полезни връзки .

Следващата част от интернет търсачката е същинската програма за търсене и сортиране. Тези програми решават две основни задачи: първо намират страници и файлове в базата данни, които съответстват на входящата заявка, и след това сортират получения масив от данни според различни критерии. Успехът в постигането на целите на търсенето до голяма степен зависи от ефективността на тяхната работа.

Последният елемент на интернет търсачката е потребителският интерфейс. В допълнение към изискванията за естетика и удобство, които са обичайни за всеки сайт, има още едно важно изискване към интерфейсите на търсачките: те трябва да предлагат различни инструменти за компилиране и прецизиране на заявки, както и сортиране и филтриране на резултатите. Предимствата на търсачките са отличното покритие на източниците, относително бързото актуализиране на съдържанието на базата данни и добър избор допълнителни функции.

Основният инструмент за работа с търсачките е заявката.

За търсене в интернет се използват и специални приложения, инсталирани на локалния компютър. Това могат да бъдат както прости програми, така и доста сложни комплекси за търсене и анализ на данни. Най-често срещаните плъгини за браузъри са плъгини за браузъри, панели на браузъри, предназначени да работят с конкретна услуга за търсене, и пакети за метатърсене с възможности за анализ на резултати.

Уеб директории - това са ресурси, в които сайтовете са разпределени по тематични категории. Ако потребителят работи с търсачките само чрез заявки, тогава каталогът има възможност да преглежда всички тематични секции. Втората основна разлика между каталозите и автоматичните търсачки е, че по правило хората директно участват в тяхното съдържание, които разглеждат ресурси и приписват сайта на една или друга категория. Уеб директориите обикновено се разделят на универсални и тематични. Universal се опитва да обхване възможно най-много теми. В тях можете да намерите всичко: от сайтове за поезия до компютърни ресурси. С други думи, те имат максимална широчина на търсене. Тематичните директории, от друга страна, се специализират в определена тема, осигурявайки, чрез намаляване на обхвата на ресурсите, максимална дълбочина на търсене.

Предимството на директориите е сравнително високото качество на ресурсите, тъй като всеки сайт в тях се разглежда и избира от човек. Тематичното групиране на сайтове ви позволява удобно да намирате сайтове с подобни теми. Този режим на работа е добър за откриване на нови сайтове за вас по интересуваща ви тема - по-точен е от използването на търсачка. Препоръчително е да използвате уеб директории за първо запознаване с всяка предметна област, както и за търсене на размити заявки - ще имате възможност да „скитате“ през секциите на директорията и по-точно да определите какво ви трябва.

Недостатъците на уеб директориите са известни. На първо място, това е бавно попълване на базата данни, тъй като включването на сайт в каталога изисква участието на човек. По отношение на ефективността уеб директорията не е съперник на търсачките. Освен това уеб директориите значително отстъпват на търсачките по отношение на размера на базата данни.

Когато говорим за търсене в интернет, не можем да пренебрегнем редица термини, които са тясно свързани с тази област и често се използват за описание и оценка на търсачките. Например:широчина и дълбочина търсене в интернет. Широкото търсене е търсене, което обхваща възможно най-много източници на информация. В същото време поне споменаването на конкретен сайт, който съответства на заявката, се счита за достатъчно. Дълбочината на търсене се отнася до детайлите на индексирането и последващото търсене на всеки конкретен ресурс. Например, много търсачки имат различни подходи за индексиране на различни сайтове. Големите и популярни сайтове се индексират в максимална степен, роботите се опитват да не пропуснат нито една страница от такъв ресурс. В същото време на други сайтове само главната страница и няколко страници със съдържание могат да бъдат индексирани. Тези обстоятелства, разбира се, влияят на последващото търсене. Дълбокото търсене работи на принципа „по-добре е да включите излишна информация в резултатите, отколкото да пропуснете всякакви данни, свързани с темата за търсене“.

Доста често се срещат понятия като напрглобални и местни търсене в интернет. Локалното търсене в Интернет взема предвид географското местоположение на потребителя и се дава предпочитание на резултати, които по някакъв начин са свързани с определена страна или населено място. Глобалното търсене игнорира тази информация и търси във всички налични ресурси.

Когато съставяте заявка в интернет търсачките, различни режимиТърсене. Типичните режими на търсене, открити на повечето интернет машини, включватпрости и разширени Търсене. Простото търсене ви позволява да посочите само една функция за търсене в една заявка. Разширеното търсене прави възможно създаването на заявка от няколко условия, като ги свързва с логически оператори.

Използват се различни методи за прецизиране на заявките за търсене.филтри . Филтрите са онези или други спомагателни средства за компилиране на заявка, които не са свързани със съдържателната страна на условията на заявката, но ограничават резултатите от търсенето до някакъв формален знак. Така например, когато се прилага филтър за тип файл при търсене, потребителят не предоставя на системата информация, свързана с предмета на заявката му, а просто ограничава получените резултати до конкретен тип файл, посочен в условието на заявката му.

За повечето потребители универсалните търсачки са основното и често единственото средство за търсене в Интернет. Те предлагат добро покритие на източниците, както и набор от инструменти, достатъчни за основни задачи за търсене.

Пазарът на универсални търсачки е доста голям. Опитахме се да анализираме най-известните търсачки и резултатите са представени под формата на таблица 1.

При избора на универсална търсачка важна роля играе качеството на ресурсите, намерени с нейна помощ. Можете да определите предпочитаната търсачка за конкретни задачи, като използвате „метода на маркера“. Същността му се състои в това, че първо се съставя определена тематична заявка за търсене, след което се анкетира група хора - експерти в тази област, за да се идентифицират най-добрите, според тях, интернет ресурси по избраната тема. Въз основа на данните от проучването се формира списък с маркерни сайтове, които гарантирано отговарят на заявката и съдържат висококачествена информация. След това заявката се изпраща до тестваните търсачки. Логиката на оценката е проста: колкото по-високо са разположени маркерните сайтове в резултатите от търсенето, толкова по-добре даден ресурс е подходящ за намиране на информация по тестова тема.



Говорете за това, което е в нашето време информационни технологиии безкрайното нарастване на количеството данни, достъпни както за отделния човек, така и за обществото, има много проблеми с обработката на информация и търсенето й - това вече е богохулство. Кой само не повдига тази тема. И за да не ви натоварвам със субективни и отчасти обективни преценки, събрани от различни източници на информация относно проблема, ще пристъпя директно към неговото решение. Нека поговорим за търсене днес. Тоест за програми и сериозни информационни системи, които търсят нужните ни документи и данни.

Надстройте „директно търсене“

Не толкова отдавна, когато дърветата бяха големи, а информацията дори в локална мрежанямаше толкова много предприятия, всяко търсене се извършваше чрез банално изброяване на шепа налични файлове и последователна проверка на техните имена и съдържание. Такова търсене се нарича директно и програмите (помощните програми), използващи технологията за директно търсене, традиционно присъстват във всички операционна системаи пакети с инструменти. Но дори мощността на съвременните компютри не е достатъчна за бързо и адекватно търсене в гигантски количества данни при директно търсене. Търсенето в няколкостотин документа на диск и търсенето в огромна библиотека и няколко дузини пощенски кутии са две различни неща. Следователно програмите за директно търсене днес очевидно избледняват на заден план - ако говорим за универсални инструменти.

Разбира се, в корпоративния сектор този тип търсене не е търсено от дълго време. Обемите не са еднакви. И следователно от много години, а напоследък недвусмислено, технологии, способни да извършват бързо и точно търсене на документи различни форматии от различни източници, повече от уместни. Не толкова отдавна "бащата" на Microsoft Бил Гейтс, завиждайки, очевидно, на феноменалния успех на интернет търсачката Google, на една от пресконференциите обяви желанието на софтуера (вече и не само) по всякакъв възможен начин да популяризира , развиват и задълбочават създаването на търсачки и технологии. Но преди създаването на някаква феноменална работеща програма от Microsoft или конкурентен сървър в Интернет, все още е твърде рано (MSN все още не достига Google). Затова се обръщаме към съществуващите разработки. Индекс, заявка, релевантност

В основата модерни технологииима два основни процеса. Първо, това е индексирането на наличната информация и обработката на заявката, последвано от извеждане на резултатите. Що се отнася до първото, всяка програма (било то настолна търсачка, корпоративна информационна система или интернет търсачка) създава своя собствена област за търсене. Тоест обработва документи и формира индекс на тези документи (организирана структура, която съдържа информация за обработваните данни). В бъдеще създаденият индекс се използва за работа - бързо получаване на списък с необходими документи според заявката. Освен това, въпреки че в никакъв случай не е просто от гледна точка на технологията, но е съвсем разбираемо обикновен потребител. Програмата обработва заявката (по ключова фраза) и показва списък с документи, които съдържат тази ключова фраза. Тъй като информацията се съдържа в структуриран индекс, обработката на заявката е много (десетки и стотици пъти!) По-бърза, отколкото в случай на директно търсене (изборът на документи се извършва не чрез изброяване на файлове, а чрез анализиране на текстова информация в индекс).

Програмата показва намерените документи в получения списък по релевантност - съответствието на документа с текста на заявката. В различни технологии, разбира се, има различни методитърсене и определяне на релевантността на документа (броя на "срещанията" на думата и нейната честота на споменаване в документа, съотношението на тези параметри към общия брой думи в документа, разстоянието между думите на заявката фраза в търсените файлове и т.н.). Въз основа на тези параметри се определя "теглото" на документа и в зависимост от него един или друг файл се появява в списъка с резултати на определена позиция. При търсенето в интернет ситуацията е още по-сложна. Всъщност в този случай трябва да се вземат предвид много други фактори (Page Rank Google е пример за това). Но това е тема за отделна статия, така че няма да докосваме интернет Преглед на търсачките

Тази статия обсъжда възможностите на няколко популярни програмитърсене, което може да се похвали както с прилична скорост, така и с добра функционалност. Но да се изфукаш във флаер е едно, а да се изправиш пред погледа на експерт е съвсем друго. И имаше нито много, нито малко експерти, пълен офис от любители да бърникат в софтуера за неговата използваемост. На тестовия компютър (Athlon 2,2 MHz, с оперативна памет 1 GB, 160 GB Seagate 7200 rpm IDE твърд диск и Windows система XP) беше инсталиран набор от програми: dtSearch Desktop, Snoop Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. За тестове беше съставена текстова база от документи във формати doc, txt и html с общ размер не повече, не по-малко, а 20 гигабайта. Група другари, под ръководството на вашия смирен слуга, тестваха, сравниха и споделиха своите субективни впечатления за всеки софтуер. Прочетете по-долу за обобщение на констатациите. dtSearchDesktop

Програма, която според разработчиците има претенциите да бъде най-бързата, удобна и най-добрата търсачка. Както, като цяло, и всички останали от този преглед. Интерфейсът на dtSearch е доста прост, но някои прозорци или раздели са донякъде претоварени с елементи, което създава впечатлението, че е трудно да се използва. Но всъщност няма специални трудности. Единственият наистина неприятен момент е липсата на поддръжка за софтуер на руски език (въпреки факта, че програмата може да търси документи на няколко езика, нейният интерфейс е изключително английски).

Но dtSearch е една от малкото програми, които могат да индексират уеб страници до "дълбочина", определена от потребителя (все пак, като се вземе предвид "допълнителната покупка" в комплекта за добавяне на dtSearch Spider). Това е в допълнение към поддържането на различни файлове на диска текстови форматии имейли от пощенска кутияперспектива. В същото време програмата не знае как да работи с бази данни, които са толкова вкусна хапка за търсачките поради големия обем информация, която съдържат и широкото разпространение в компаниите, а оттам и в корпоративните мрежи. Скоростта на индексиране на документите на dtSearch беше на ниво. Гледайки напред, ще кажа, че тази програма се справи с индексирането на дадено количество информация наравно с друг състезател - iSYS - и сподели второ място с него в списъка на най-много бързи системи. Тествайте 20 гигабайта информация, индексирана от dtSearch за 6 часа и 13 минути, създавайки индекс от 7,9 GB за нуждите на последващо търсене.

Що се отнася до възможностите за търсене, тук те са на ниво. Първо, dtSearch има морфологично търсене (търсене на дума във всичките й морфологични форми). Използвайки тази възможност, вие се освобождавате от, да речем, такива мисли като "в какъв случай е използвана определена дума в документа, от който се нуждая?". Използването на морфологично търсене е почти винаги оправдано, така че трябва да присъства във всяка професионална търсачка.

Звуковото търсене е нестандартна функция дори за професионални търсачки. Същността му се състои в това, че програмата ще търси думи, които звучат по същия начин като въведената от вас дума. И най-хубавото е, че тази функция работи и за руски език! Например, въвеждането на думата "ухо" в заявка за търсене ще доведе не само до думите "ухо", но и до "ухо".

Търсенето с коригиране на грешки е много важна функция. Използва се за търсене на думи, съдържащи синтактични грешки - те могат да бъдат или правописни грешки, или грешки в документи, получени с помощта на системи за разпознаване на символи, например. Прост пример е, че търсите думата клавиатура. Някой документ съдържа думата "клавиатура", очевидно е, че всъщност тази дума е "клавиатура", просто човек, който пише, когато пише. Сега, търсене с коригиране на грешки, това ще открие и включи документа с думата "клавиатура" в резултата. Също така в dtSearch има настройка, която ви позволява да определите степента на възможни грешни знаци.

Търсете с помощта на синоними. Тази функция използва списък със синоними за различни думи. Така например, като въведете думата "бърз", програмата ще намери и думите "високоскоростен" и други, които са синоними на думата "бърз", ако има такива, разбира се, присъстват в списъка със синоними . Готов списък със синоними не се доставя с програмата dtSearch, но е възможно да използвате списъците в Интернет (съответно е необходима връзка, което не винаги е удобно) или можете да създадете свой собствен списък с синоними.

В допълнение към изброените функции, dtSearch може да търси с помощта на фрази, състоящи се от думи, свързани с логически операции. На всяка дума в заявката може да бъде присвоено собствено "тегло", тоест значимост. Полезна опция е да използвате речник, състоящ се от маловажни думи, за да не ги вземате предвид при търсене, но този речник също е празен и ще трябва да го попълните сами.

След това помислете за възможностите на програмата, когато работите в мрежата. Всъщност dtSearch не предлага никакви специфични мрежови възможности. Въпреки това е напълно възможно да го използвате в мрежата. Като алтернатива можете да създадете някакъв индекс и да го поставите в публична (споделена) папка. Самата програма може да се инсталира за всеки потребител на компютър или да се постави в папка, отворена за публичен достъп, и създавайте преки пътища по специален начин за всеки потребител поотделно, като използвате параметри на командния ред, чиято цел е описана в помощния файл, доставен с програмата. Освен това има възможност автоматична инсталацияпрограми към мрежата с помощта на MSI файл. Това ще вземе предвид настройките за всеки свързан потребител.

Като цяло - добра програма от категорията на професионалните търсачки. Може да се класира за добра оценка, но спечелването на доверие и уважение от потребителите може да е трудно за dtSearch поради няколко фактора (не всичко е гладко с интерфейса, руските потребители са лишени, няма ярки функции за работа с мрежата) . Що се отнася до директното търсене на документи, програмата няма наслагвания с руски текст. Като нямаше нито с обявената морфология, нито с размито търсене. Системата доста адекватно намери необходимите документи както чрез проста заявка с една дума, така и чрез използване на няколко параграфа или всеки документ като ключова фраза.

Официален сайт:
Размер на разпространение: 23 MbSnoop Prof Deluxe

Въз основа на името можете да познаете, че в тази програма има поддръжка за руски език. Вече е хубаво. Що се отнася до интерфейса, като цяло той е малко необичаен, но много привлекателен на външен вид. Друго нещо е удобството. Много спорен критерий, но все пак вероятно решението с няколко прозореца не е най-добрият вариант (заявката се въвежда в един прозорец, резултатът се показва в друг и т.н.).

Bloodhound все още използва същите индекси за извършване на бързо търсене, но индексирането е много по-бавно от други програми. Това е много странно, особено като се има предвид, че способността му да обработва заявки за търсене е много слаба, което означава, че структурата на индекса не е сложна. Най-вероятно въпросът тук е в неоптимизираните алгоритми. Тази програма се оказа ясен аутсайдер на скоростта на индексиране и търсене: времето, прекарано за създаване на индекс, е шест пъти по-дълго от това на същите dtSearch и iSYS. Индексирането на 20 гигабайта текстове за хрътка доведе до 38 часа и 46 минути работа. И създадената "област за търсене" заемаше същия размер на твърдия диск като оригиналните данни с малък минус - 19 гигабайта.

Bloodhound може да бъде представен като алтернатива стандартно търсенена Windows едва ли може да направи повече. Фактът, че основната задача на Търсача - най-простото търсене на файлове, се показва не само от малък брой функции за анализиране на текста на заявките за търсене и разширено търсене по атрибути на файла, но дори и прозорец с резултати, който дава директни връзки към намерените файлове, както и към папки, съдържащи тези файлове. Прозорецът с резултати не е много информативен в смисъл, че можете да прочетете целия намерен файл само като го стартирате, тоест няма вградена програма за преглед на файлове. Но се дава извадка от файла, където е намерена търсената дума, като цяло такава схема на показване много напомня на интернет търсачките.

Говорейки за конкретните възможности за обработка на заявки за търсене, заслужава да се отбележи, че няма такова нещо като „търсене на текст“, максимумът, който може да се търси, е фраза, дори само защото няма многоредово поле за въвеждане на текст. Можете обаче също да анализирате въведената фраза и Bloodhound ни предлага стандартно търсене, зададено тук: логически операции, търсене по маска и търсене на цитати ... не много. В програмата има някои рудименти на морфологично търсене, но вероятно толкова сурово, че по-скоро пречи на правилната работа (по време на тестовете бяха забелязани много наслагвания с неправилно използване на морфологията).

Но програмата ви позволява да зададете атрибути на файла (дата на документа, име на файл, име на папка) при търсене и в тези заявки можете също да използвате същия набор за търсене. Също така можете да търсите съобщения, като посочите параметрите (От, Тема.... и т.н.).

И така, разбрахме самото търсене, какво друго е интересно за програмата, за която получи толкова много награди, според информация от официалния уебсайт? Трудно е да се каже какво е толкова специално за него, най-вероятно интерфейсът на Bloodhound е благоприятен за себе си (само външно, да не говорим за използваемостта).

Операциите с индекси са много стандартни, хубавото е възможността за актуализиране на индексите по график. Освен това индексите могат да се използват и онлайн. Оттук нататък трябва да сме по-конкретни.

Въпреки примитивността на заявките за търсене, програмата може да се използва за търсене на файлове, така че използването й може да бъде оправдано в мрежите. Макар и с голяма тежест, тъй като в голяма мрежа приоритетът е бързото търсене на данни чрез сложни заявки за търсене поради огромното количество информация - и очевидно има проблеми със скоростта на търсене и програмата. Трябва да кажа, че работата с мрежата в Bloodhound е обмислена както трябва. Отделно приложение е създадено специално за това - Bloodhound Server. Работи по същия начин като Bloodhound (те имат една търсачка), само за документи, хоствани на централен сървър или на споделени ресурси в корпоративна мрежа. Bloodhound Server създава нови индекси на споделени ресурси или използва вече създадени такива. Всеки потребител в корпоративната мрежа може да се свърже със сървъра Bloodhound и да го използва за достъп до всеки документ (намиращ се в текущия индекс) с помощта на интернет браузър. Съгласете се, такава схема е изключително удобна: оказва се, че файловете във вашата собствена мрежа могат да се търсят по същия начин като информация в Интернет чрез, например, Google.

Оценявайки всички предимства и недостатъци на тази програма, заключението предполага, че за корпоративните мрежи нейните възможности най-вероятно няма да бъдат достатъчни (въпреки добрата организация на мрежата), но за домашен компютър или дори за домашна мрежа, това е, по принцип може да пасне. Въпреки че нито скоростта на работа, нито възможностите за търсене вдъхват оптимизъм ...

Официален сайт на руски:
Размер на разпространение: 6 MbGoogle Desktop Search + GDS Enterprise

Разбира се, не можехме да пренебрегнем такъв виден разработчик. Името Google вече говори достатъчно. Хората, които от години използват най-мощната интернет търсачка, вероятно без никакво съмнение ще решат да инсталират точно тази търсачка на своя компютър. Все едно си мислите: Google на домашния ви компютър! Въпреки това, без да се поддаваме на провокации с широко популяризирана марка, нека се опитаме трезво и най-важното обективно да разгледаме възможностите на "настолната" търсачка от Google.

Първото нещо, което хваща окото ви, е липсата на собствена обвивка за програмата. Google Desktop Search все още е в прозореца на браузъра, съответно целият интерфейс на настолната версия отиде в софтуера от по-стария интернет брат. Дали това е добро или лошо е спорен въпрос: някой харесва минимализма в дизайна на тази търсачка и някой иска да види пълноценно приложение, пълно с всякакви бутони и т.н.

Какво хваща окото веднага след дизайна? И фактът, че същото това Google Desktop Search започва да индексира всичко на компютъра, без никакво търсене! И най-интересното е, че е невъзможно да изберете пътища за индексиране с помощта на Google Desktop Search. Ще трябва да изтеглите отделна програма (TweakGDS), която ще ви позволи леко да разширите настройки на googleРаботен плот, включително посочване на местата, необходими за индексиране. Въпреки че, докато разберете всичко, той вече ще индексира стандартния твърд диск, така че тази настройка е необходима повече при работа с големи количества данни, което е много важно, когато се използва в корпоративни мрежи (Enterprise версия). Не е факт обаче, че след изтеглянето на TweakGDS вашите проблеми ще бъдат решени. В крайна сметка се нуждае от Microsoft. NET Frameworkи Microsoft Scripting Runtime. Да... инсталацията, както и достъпът до настройките можеха да бъдат улеснени, въпреки че вероятно разработчиците могат да разберат: защо да пишете нещо ново, когато вече има готова търсачка, пренесена на локален компютъри оставете потребителя да се "наслади", а добре познатото име да направи още един шедьовър от "това". Хайде, да приключим с това лирично отклонение и да продължим към търсенето.

Що се отнася до анализа на заявките за търсене и издаването на резултати, всичко тук е абсолютно идентично с Google в Интернет: същата система за показване на резултати, същия стандартен набор от логически операции за заявки за търсене. Като цяло Google Desktop Search, като предишна програма, е предназначен изключително за търсене на файлове - разбира се, няма вътрешен преглед на тези файлове. Броят на файловите формати, поддържани от Google Desktop Search, е напълно достатъчен, а също така е хубаво, че търси в посетените интернет страници, като взема данни от кеша. Скоростите на търсене и индексиране са доста приемливи. Вярно, за домашна употреба. С впечатляващите 20 гигабайта текстове, Google Desktop Search се справи за 8 часа и 17 минути. Прекарайте няколко дни в обработка на информация от корпоративната мрежа на голямо предприятие, което не се усмихва на нито един системен администратор. Положителната страна е, че размерът на създадения индекс се оказа на нивото (4,5 GB) с друга търсачка, тествана в този преглед - SearchInform.

Голямо предимство (или пропуск - вие решавате) на Google Desktop Search е, че поддържа плъгини, които могат да променят много неща към по-добро. Друго нещо е, че свързването на плъгини и конфигурирането им усложнява задачата за инсталиране на търсачка толкова много, че започвате да се чудите дали всичко това е необходимо, когато можете да инсталирате нормална, пълноценна програма, в която всичко вече ще присъства. В крайна сметка, за да използвате всяка функция, ще трябва да инсталирате нов плъгин. Дори за да може програмата да работи напълно с архиви, е необходим отделен лосион. Той очарова и съблазнява безплатното използване на всички тези допълнителни модули. Въпреки това, ако не вземете предвид настолната версия на търсачката, тогава компетентното настройване на GDS Enterprise може да не е по силите ви - не напразно специалистите на Google предлагат своите услуги, за да настроят свои собствени софтуерза вашата мрежа само за $10 000.

Ако все пак овладеете процедурата за настройка и инсталиране (или платите $ 10 000 на екипа за бързо реагиране на Google), ще разберете, че сложността на инсталацията е повече от компенсирана от много гъвкави настройки, когато се използва в корпоративни мрежи. Важен аспект от работата на Google Desktop в корпоративна мрежа е използването групови политики, което дава възможност за задаване на предпочитания за всеки потребител.

Обобщавайки, трябва да се каже, че най-разумното използване на тази програма е домашен или работен компютър. Всъщност за обикновен компютър е достатъчно само да инсталирате програмата - тя сама ще свърши останалото (дори няма да ви пита за нищо).

Въпреки това, Google Desktop Search Enterprise ще бъде приемлив в случаите, когато има спешна нужда от гъвкави настройки на мрежовата политика за използване на търсачката, докато възможността за обработка на заявки за търсене ще бъде на второ място по важност, а времето (или парите) изразходвани за настройка на програмата ще бъдат на първо място.

Официален сайт:
Размер на разпространение с TweakGDS: 1,2 MbCopernic Desktop Search

Кликнете върху снимката, за да я увеличите

Интерфейсът на програмата предизвиква изключително положителни емоции - всичко е направено в съответствие с общоприетите стандарти, нищо излишно, с една дума, приятен дизайн. Ще бъде много лесно за начинаещ да разбере интерфейса на Copernic Desktop Search. Въпреки това е малко неудобно, че дизайнерите изрично създадоха интерфейса на програмата, като взеха предвид факта, че програмата ще работи в стандартната тема на Windows XP. Когато използвате същата класическа тема, програмата не изглежда толкова красива. Но това е по-скоро въпрос на вкус.

При първото стартиране програмата предлага създаване на индекси за търсене. Изглеждаше малко необичайно, че след като изберете папки за индексиране, програмата не предлага да натиснете бутон, като "Стартиране на индексирането", докато индексирането не стартира автоматично, само тогава беше забелязано, че Copernic се опитва да започне индексиране, когато компютърът е неактивен . Ще трябва да се разровите малко в опциите на програмата, за да настроите всичко както трябва. Трябва да се отбележи, че има доста широки възможности за персонализиране. автоматично създаванеиндекс: вграден планировчик, възможност за индексиране, докато компютърът е неактивен, във фонов режим, с нисък приоритет. Индексирането не беше твърде бързо - 10 часа 51 минути - това е по-бавно, отколкото в други търсачки (с изключение на Bloodhound, но Copernic е с порядък по-бърз от развитието на iSleuthHound Technologies.

Сега за структурата на индекса. Като цяло няма нищо особено в това. Възможно е да изберете типове файлове, както в обобщена форма, така и в подробна. Тоест, първоначално можете да изберете какво искате да индексирате - Документи, Изображения, Видео, Музика. В другия раздел на прозореца с опции ще бъде възможно да изберете конкретни типове файлове по разширение. Освен това можете да конфигурирате индекса по такъв начин, че например снимки с размер под 16x16 да не се индексират или звукови файлове с дължина под 10 секунди да не се индексират. В допълнение към индексирането на файлове от папки, Copernic може да работи с имейли и контакти от адресната книга на Microsoft Outlook и Microsoft Outlook Express, възможно е да индексирате Favorites и History от Internet Explorer.

Що се отнася до възможностите за търсене, тук те са много слаби. По време на тестовете дори беше разкрито, че програмата не търси документи в txt и html формати на руски, което ви позволява да ги намерите само по заглавия, а не по съдържание. Единственото нещо, което програмата предоставя за подобряване на ефективността на търсенето, е използването на стандартен комплектлогически операции и дори тогава тази възможност беше открита експериментално, тъй като не беше документирана. Между другото, помощта на програмата също не е наред - тя е достъпна само чрез интернет, което, разбирате, е много неудобно и в мрежата няма твърде много помощна информация. Очевидно разработчиците са решили, че простият интерфейс на програмата не предполага наличието на нормална помощ. Продължавайки разговора за възможностите за търсене, трябва да се отбележи, че въпреки лошия анализ на заявките, програмата предоставя интересна система за търсене - потребителят може да избере типа на файловете (изображения, видеоклипове, музика и т.н.), да въведе заявка за търсене и изберете атрибути, които са специфични за избрания тип файл. Например за звукови файлове, това могат да бъдат стойности от mp3 тагове (изпълнител, албум, дата и т.н.), за изображения, например, можете да изберете техния размер (по разделителна способност), като цяло всеки тип има свои собствени настройки. След търсене на определен тип файлове, програмата ще покаже много информативен списък в прозореца с резултати и ако вашата заявка включва файлове от друг тип, можете да ги отворите, като щракнете върху конкретна връзка.

Отделно си струва да споменем прозореца за показване на резултатите. Съдържанието на тези файлове се показва под списъка с намерени файлове (подобна схема често се използва в пощенски клиенти). Вярно е, че текстът може да се разглежда само в родния му формат и няма режим на показване на обикновен текст, което не винаги е удобно, тъй като отварянето на документ в този случай отнема повече време. Но тъй като Copernic може да търси изображения и музика, има възможност за преглед на тези мултимедийни файлове.

Основните принципи на тази програма са описани, сега нека видим какво може да ни предложи Copernic Desktop Search за работа с мрежата ... По принцип можете да гледате много дълго време, но едва ли ще видите нещо. С други думи, тази програма не е замислена като мрежова. Copernic Desktop Search е изключително домашна търсачка.

Очевидно единствената (най-логична) употреба на тази програма е домашен компютър. Тук той напълно ще се справи с всички прости заявки за търсене на потребители, състоящи се от една или две думи, намиране на необходимата информация и разделяне на търсенето по тип файл и поддръжка на мултимедийни файлове, заедно с фоново индексиране в режим с нисък приоритет, съчетано с приятен интерфейс, само дава сила на програмата да спечели доверие сред неопитни потребители.

Официален сайт
Размер на разпространение: 2.6 MbISYS Desktop

Кликнете върху снимката, за да я увеличите

Много мощна програма. По ниво на оборудване с всякакви функции тя е някъде близо до следващата търсачка SearchInform в списъка. В същото време размерът на инсталационния файл е повече от 40Mb! Трудно е да се каже какво може да се постави в такъв размер, защото същият SearchInform, с подобна функционалност, отнема 15Mb.

Процесът на инсталиране тук също не е много приятен или по-скоро дори процесът на инсталиране. Дори преди да изтеглите програмата, ще бъдете помолени да се регистрирате, в противен случай - нищо. След това интерфейсът. Направен е много добре, нищо излишно не хваща окото, все пак това са впечатленията на човек, който вече донякъде е свикнал с него. За начинаещ няма да е лесно да разбере къде и какво има, къде да кликне и къде най-накрая да търси. Силно препоръчително е да прочетете помощта преди да започнете работа - спестете много нерви и време. Освен всичко останало е и пълно отсъствиеПоддръжка на руски език в програмата. Не е добре. Освен това прозорците тук не са претоварени с контроли, но това се дължи на многомодулността и използването на допълнителни прозорци. Например, заявките за търсене се въвеждат чрез стартиране на една програма, а индексите се управляват с помощта на друга програма. Заявките за търсене също се въвеждат тук в отделни, появяващи се полета. Трудно е да се каже кое е по-добро - претоварен интерфейс или вездесъщ многопрозорец, по-скоро е въпрос на вкус.

Що се отнася до създаването на индекси, програмата предоставя опции за опростяване на процеса на задаване на опции за нов индекс. Тези функции включват няколко готови шаблониза създаване на индекси на Моите документи, Поща, Поща и документи, Конкретна папка, Папка с избрани типове файлове и т.н. Тези шаблони улесняват създаването на индекси на първия етап. Помощната програма за работа с индекси има не много добър интерфейс, който плаши известна сложност (това е много субективна оценка, честно казано), но ако я погледнете, тя предоставя много полезни опции и като цяло използването му прави не създава много трудности. ISYS Desktop може да индексира данни от различни източници на данни и също така предоставя много гъвкави настройки за такова индексиране. Между допълнителни функцииза индексиране: поддръжка на SQL, FTP, TRIM Context, WORLDOX 2002, скриптове. При създаване на индекс, ако сте избрали опцията „Папка с избор на типове файлове“, имате възможност да изберете типовете файлове, които да се индексират ръчно (по разширение). Трябва да се каже, че има просто огромен брой поддържани типове файлове, но няма да е възможно да добавите свой собствен тип (разширение) към съществуващия списък. Можете също така да отбележите наличието на планировчик за индексиране. ISYS Desktop отне 6 часа и 13 минути, за да създаде индекс и да обработи 20 гигабайта информация, като в крайна сметка показа добро време и размера на създадения файл - 7,9 GB.

Възможностите за търсене на тази програма не са лоши. Това, което се използва в ISYS, е много по-мощно от обичайната поддръжка за логически операции. От функциите за разширено търсене програмата предлага използването на синоними, филтър за сортиране (по път, име и дата на създаване на файла). Наборът от логически оператори е малко по-широк от стандартния набор. В допълнение към логическите операции, програмата ви позволява да работите с много други оператори, които по принцип могат да заменят някои видове търсене, например търсенето с парсинг може да бъде напълно заменено с помощта на специални оператори. Бях много изненадан, че програмата няма търсене по морфология. Това е сериозен пропуск, тъй като ефективността на търсенето се подобрява значително при използване на морфологичен анализ. Освен това няма списък със значими думи, но има обширен списък с незначещи думи. Също така декларирани такива функции в търсенето като "приблизително търсене" и "евристичен анализ".

ISYS предоставя избор от няколко вида заявки за търсене, а именно визуални. Това се прави с помощта на различни типове прозорци за въвеждане на заявки за търсене, но всъщност никой прозорец не ви позволява да използвате технологии, различни от изброените по-горе.

Резултатите от търсенето са много информативни, показват се като списък с документи, сортирани по уместност. По-долу е преглед на избрания документ. За разлика от Copernic Desktop Search, визуализацията тук е достъпна само под формата на обикновен текст, не беше възможно да се постигне показване на документи в родния формат, било то Word, Html или PDF, въпреки че по принцип това не е твърде критично. Програмата ви позволява да разделите намерените документи на групи според определени критерии (по подразбиране те са разделени по уместност). Можете също така да видите вече намерени документи, като изберете отделни папки (това е полезно, когато резултатът създава много голям брой документи).

Използването на програмата в корпоративна мрежа също е напълно оправдано, тъй като предоставя добри възможности за организиране на търсене в мрежата. Системата за търсене се основава на създаването на публичен индекс, който съдържа индексирани данни от публични мрежови ресурси.

Всъщност програмата от ISYS заслужава внимание, поне да се запознаете с нея. Тази програма е зрял проект с голямо количествофункции (не винаги и не за всеки, разбира се, те са необходими, но все пак). Шансовете програмата да има някои подобрения по отношение на обработката на заявки за търсене не са известни, но този моментможе да се препоръча за почти универсална употреба. И като се има предвид, че все още е твърде тежък за домашни системи, основните места за инсталирането му са корпоративните мрежи.

Официален сайт:
Размер на разпространение: 40 MbSearchInform

Кликнете върху снимката, за да я увеличите

Вероятно не си струва да започнете веднага с описание на интерфейса SearchInform. Първо трябва да опишем процеса на инсталиране или по-скоро една от неговите подробности: няма да можете да инсталирате програмата без интернет връзка. Факт е, че преди първото стартиране програмата изисква регистрация на потребител (безплатно) и изпраща всички въведени данни на сървъра. Очевидно разработчиците трябваше да предприемат такива мерки в борбата срещу пиратството, но това не се отрази положително на лекотата на инсталиране.

Интерфейсът на програмата е направен в съответствие с всички общоприети правила, но на пръв поглед е малко тромав. Използвайки програмата за първи път, изглежда, че е твърде сложна, понякога не е лесно да запомните в кое меню или раздел е желаната опция, но при по-продължителна употреба интерфейсът вече не изглежда толкова ужасно сложен. Основното нещо е първо да прочетете помощта.

След като се занимавате малко с интерфейса, можете да започнете да създавате индекс. Самият процес е много прост и скоростта на индексиране, дори и на око, е много по-висока от всички други търсачки от прегледа. Ясните тестови числа показват, че SearchInform е два пъти по-бърз от dtSearch и iSYS по отношение на скоростта на индексиране! Програмата индексира предоставените данни в размер на 20 гигабайта за рекордно време - 3 часа 17 минути. А размерът на създадения индекс се оказа най-малкият 4,4 GB - със 100 мегабайта по-малко от този на Google Desktop Search.

Програмата поддържа, в допълнение към обикновените файлове и папки, също индексиране на имейли, свързване и индексиране на бази данни (!) И други външни източници (DMS, CRM), веднага при индексиране можете да посочите речник за морфологично търсене и всички атрибути могат да бъдат индексирани файлове. След като създадете индекс, когато се опитвате да извършите първото пробно търсене на документи, може да стигнете до известно объркване: „тук има два вида търсене, но кой ми трябва?“. Както споменахме по-рано, основното е да прочетете помощта, тогава всичко ще стане ясно. Програмата наистина може да извършва два вида търсене - търсене по фраза и търсене на документи, които са подобни по съдържание на текста на заявката.

Описанието на всички основни функции за анализиране на заявка за търсене беше дадено по-горе, така че сега ще изброим само възможностите за търсене, предоставени от тази програма. Нека започнем с търсене по фраза: разбира се, морфологично търсене, търсене на цитати, логически операции, търсене на синтактичен анализ на дума (търсене по началото на думата, по края, по средната част или пълно съвпадение), смесено търсене на цитати (когато всички думи от заявката трябва да присъстват в документа, но не непременно във въведения ред), търсене за корекция на грешки, използване на синоними, „търсене почти в цитат“ (търсене на въведената фраза като цитат, но може да има и други думи между въведените думи) и др. Някои от изброените опции имат свои специфични настройки. Освен това е възможно да използвате речник на незначими думи и програмата вече има готов списък с тези думи, можете да използвате и речник на приоритетни думи за търсене (разбира се, ще трябва да го попълните себе си).

Тук по принцип прегледахме накратко всички основни характеристики на търсенето по фраза.

Нека да преминем към разглеждането на характеристиките на тази програма - търсенето на подобни документи. Разработчиците твърдят, че това в никакъв случай не е просто търсене на текст, това е точно "търсене на подобни" - така го описват навсякъде, но добре, можете да го наричате както искате - основното е. Кратко търсене в Интернет може бързо да разкрие, че така нареченото „подобно търсене“ е ново развитие в областта на текстовия анализ. Тази система ви позволява да намирате текстове, които са сходни по семантично съдържание. Най-приятното беше, че след провеждане на тестови заявки за търсене се оказа, че теорията е напълно съвместима с практиката! Програмата наистина търси подобни по съдържание документи и ги показва в списък, сортиран по процент на сходство.

След това нека да разгледаме какво предлага SearchInform (по-специално неговата корпоративна версия SearchInform Corporate) за работа в корпоративна мрежа. Има два типа приложения: страна на сървъра и страна на потребителя. Сървърната част самостоятелно обработва зададените индекси и потребителите могат да ги използват за търсене в зависимост от предоставените им права за достъп. Потребителите могат да бъдат конфигурирани автоматично чрез влизане. Windows записи(казвайки професионален език, SearchInform използва Windows NTFS удостоверяване) или ръчно (потребителите ще трябва да се добавят отделно). На всеки потребител може да бъде разрешен или отказан достъп до определени индекси, можете също да комбинирате потребители в групи. Като цяло мрежовите настройки на SearchInform изпреварват Google по отношение на гъвкавостта, а Snoop Server по отношение на удобството и простотата.

Официален сайт:
Размер на разпространение: 14,7 Mb Сравнение на скоростта на индексиране

Система за търсенеВреме за индексиранеРазмер на индекса
Bloodhound Pro Deluxe 4.538 часа 46 минути19 GB
Isys Desktop 7.06 часа 13 минути7,9 GB
DtSearch 7.06 часа 3 минути8,6 GB
Google Desktop Search Enterprise8 часа 17 минути4,5 GB
Copernic Desktop Търсене*10 часа 51 минути7 GB
SearchInform 1.5.023 часа 17 минути4,4 GB

* Повечето от .html и .txt документи, съдържащи руски текст, въпреки че са индексирани, не могат да бъдат намерени, освен по техните имена.

Всички програми заслужават внимание.

Въз основа на тестовете и внимателното изследване на всяка програма, представена в прегледа, могат да се направят определени заключения. Така че Google Desktop Search Copernic Desktop Search е доста подходящ за неопитен потребител като система за търсене на домашна информация. Те вършат добра работа с прости заявки, не натоварват много потребителя с настройки и освен това са напълно безплатни. Опитът на Google да навлезе на пазара на корпоративни търсачки все още не е напълно оправдан: за пълноценна работа програмата трябва да бъде окачена с допълнителни модули и далеч не е лесна за настройка. Следователно, говорейки имената на Desktop Search, че Copernic, че Google оставят след себе си ниша от "десктоп" търсачки.

Вярно е, че по-мощните решения - dtSearch, iSYS и SearchInform също не са готови и предлагат на потребителите своите "настолни" версии. Но на разумна цена, за разлика от безплатния софтуер на Google и Copernic. Разбира се, трябва да платите за мощност, скорост и функционалност. Но разработчиците на dtSearch, iSYS и SearchInform правят основния си фокус, разбира се, върху корпоративния сектор. Работа в мрежа, функционалност, индексиране и скорост на търсене - това е, което отличава тези продукти от техните "конкуренти". Според резултатите от теста беше определен фаворитът - SearchInform. Програмата предоставя възможност за търсене на подобни документи, има най-висока скорост на индексиране и търсене и има добър набор от функции.

Намирането на правилната и актуална информация в интернет понякога е много трудно. Количеството информационен боклук в мрежата расте като снежна топка и понякога е просто невъзможно да стигнете до данните, от които наистина се нуждаете, като използвате традиционните Yandex и Google. Книгата, която държите в ръцете си ще повиши многократно ефективността на вашето търсене на информация в Интернет. Описва техники, сайтове за търсене и програми за специализирано извличане на информация. Разглеждат се съвременни разновидности на интернет търсене: универсално търсене, вертикално търсене, системи за метатърсене, изграждане на персонални търсачки, търсене на аудиовизуално съдържание, търсене в скрития Интернет. За всички разгледани системи са дадени техните характеристики и съвети за най-ефективно използване.

Въведение

Търсенето в интернет е важен елемент от работата в мрежата. Точният брой уеб ресурси на съвременния Интернет едва ли е известен със сигурност на никого. Така или иначе сметката отива в милиарди. За да можете да използвате информацията, която ви е необходима в този конкретен момент, независимо дали за бизнес или за развлекателни цели, първо трябва да я намерите в този непрекъснато попълван океан от ресурси. Това никак не е лесна задача, тъй като информацията в съвременната мрежа не е структурирана, което създава проблеми при намирането й. Неслучайно интернет търсачките се превърнаха в своеобразни „прозорци“ в това информационно пространство.

Малко вероятно е сред интернет потребителите да има хора, които никога не са използвали големи универсални търсачки. Имената Google, Yandex и няколко други големи машини са на устните на всички. Те се справят чудесно с дневни задачиТърсене в интернет и често потребителите дори не се опитват да търсят заместител. В същото време броят на интернет търсачките в наше време е хиляди. Причините за такова разнообразие от алтернативни машини имат различни корени. Някои проекти се опитват да се конкурират директно с лидерите на световния пазар чрез внимателна работа с национални интернет ресурси. Други предлагат възможности за заявки, които не се намират в добре познатите търсачки. Значителен брой алтернативни машини са специализирани в търсене на определена предметна област или определен тип съдържание, постигайки впечатляващи резултати при решаването на тези проблеми. Както и да е, включването на такива търсачки в собствения арсенал на потребителя от инструменти за търсене в Интернет може значително да подобри качеството му. Тук обаче има един нюанс: трябва да знаете за такива машини и да можете да използвате техните възможности.

Предполагаме, че читателите на тази книга вече са доста запознати с техниката на търсене с помощта на универсални търсачки. Толкова добри, че усетиха ограниченията, свързани с употребата им. Най-вероятно такива хора вече са се опитали да търсят и прилагат определени допълнителни инструменти. Печатното слово не заобикаля темата за търсене в Интернет: периодично се появяват както статии, така и книги. Но героите, които имат, като правило, са едни и същи - няколко водещи универсални търсачки. Нашата книга е различна по това, че се опитва да покрие пълния набор от съвременни решения за търсене. Тук ще намерите описания и препоръки за използване на най-добрите съвременни услуги, фокусирани върху решаването на най-често срещаните задачи за търсене. Тази книга е за хора, които работят много в интернет и използват мрежата, за да намерят информацията, от която се нуждаят - независимо дали става дума за бизнес, обучение или хоби.

За да бъде успешно търсенето в Интернет, трябва да са изпълнени две условия: заявките да са добре формулирани и да се задават на подходящи места. С други думи, от потребителя се изисква, от една страна, да може да преведе своите интереси за търсене на езика на заявката за търсене, а от друга страна, добро познаване на търсачките, наличните инструменти за търсене, техните предимства и недостатъци, които ще позволят да се изберат най-подходящите инструменти за търсене във всеки конкретен случай.

В момента няма нито един ресурс, който да отговаря на всички изисквания за търсене в Интернет. Следователно, със сериозен подход към търсенето, неизбежно трябва да използвате различни инструменти, като използвате всеки в най-подходящия случай.

Глава 1

Универсални интернет търсачки

Универсалните интернет търсачки са основното и най-известно средство за търсене в интернет. Такива търсачки осигуряват максимално покритие на различни ресурси. Това е универсалният тип, който включва най-големите и популярни търсачки. Това са наистина мощни решения с много функции и инструменти, за които много потребители често не знаят. Разбирането на характеристиките и възможностите на универсалното търсене ви позволява да откриете силните страни и слаби странитакива системи и съзнателно избират най-ефективните инструменти за търсене.

Пазарът на универсални търсачки е доста голям. В тази глава ще разгледаме само най-мощните машини, които могат адекватно да работят със заявки на руски език. Главата започва с истории за лидерите на руското търсене - системите Google.ru и Yandex. За всяка от тези търсачки са написани книги и много статии. Ще се съсредоточим върху основните характеристики, които имат значение за крайния потребител и ще се опитаме да идентифицираме техните силни страни.

Те са придружени от нова търсачка, разработена от Microsoft Corporation - системата Bing, която досега беше забележимо лишена от внимание, както и полезна и доста мощна търсачка Exalead, чието предимство е добра поддръжкатърсене в европейски интернет ресурси. Тази система- все още е рядък гост в арсенала за търсене на нашите потребители, така че се разглежда по-подробно от останалите.

В тази глава, когато преглеждате Google системии Yandex, ще се съсредоточим само върху възможностите за търсене в мрежата, а търсенето в специализирани бази данни на тези проекти се обсъжда в следващите глави за търсене на изображения и видео. За други универсални търсачки информация за мултимедийно търсене се дава веднага след запознаване с тях.

Тъй като трима от четиримата герои на тази глава са от чужд произход, веднага отбелязваме, че анализираме само възможностите на техните руски версии. Факт е, че някои функции на чужди системи, особено експериментални, често са достъпни само в оригиналните, като правило, англоезични версии на услугите.

Google

Търсачката Google заслужено се счита за световен лидер в съвременното интернет търсене. Основан през 1998г Googleи до днес остава сред водещите създатели на тенденции в областта на интернет търсенето и уеб услугите.

Разработчиците на Google винаги са се отличавали с повишено внимание към подобряването на алгоритмите на тяхната търсачка, както и разумен консерватизъм в областта потребителски интерфейс. Възможностите за съставяне на заявка в Google могат да се нарекат класически, а начините за показване на резултатите от търсенето също се превърнаха в един вид стандарт. Наскоро Google Developersнаправи големи промени в тези области - най-голямата търсачка започна да изглежда твърде старомодна на фона на младите конкуренти.

Google разполага с една от най-големите индексни бази в света, която предоставя широко покритие на източници на информация. Информацията за индекса на Google е обобщена в няколко вертикални бази. В допълнение към най-известната уеб база данни, има няколко мултимедийни бази данни (снимки, видеоклипове), които работят с източници на подходяща информация и съобщения в RSS емисии, базата данни за новини, както и базата данни за блогове, която индексира онлайн дневници. Освен това Google предлага широка гама от допълнителни ресурси, сред които си струва да се отбележи услуга за карти, директория със сайтове и услуга за въпроси и отговори. Тези ресурси могат да се разглеждат и като инструменти за търсене.

В уеб базата данни Google предлага прости и разширени режими на търсене за компилиране на заявка. Само в режим на просто търсене от допълнителните инструменти виртуална клавиатура. Разширеното търсене предлага повече опции. Тъй като формата за разширено търсене е достъпна в почти всички продукти за търсене на Google, нека се спрем на нея по-подробно (фиг. 1.1).

Яндекс

Официално представена на широката публика през 1997 г., търсачката Yandex се развива успешно и десет години по-късно за първи път е сред десетте най-големи търсачки в света. В руския сегмент на Интернет той постигна водеща позиция, която няма да се откаже, въпреки нарастващата конкуренция. Отличителни черти на Yandex от началото на неговото съществуване са собствените му оригинални алгоритми за определяне на уместността на резултатите от търсенето, гъвкави инструменти за работа с текст на заявка и отчитане на особеностите на морфологията на руския език при обработката им.

Yandex разчита на собствените си индексни бази данни. В допълнение към търсенето в уеб документи, системата предлага добър избор от специализирани ресурси и допълнителни услуги. В момента Yandex работи с изображения, видеоклипове, новини, блогове и речници. Мощни възможности за търсене също са вградени в нашата собствена картографска услуга и в системата за търсене на продукти. Освен това Yandex поддържа свой собствен каталог от уебсайтове. Силна страна Yandex е разработена програма за локално търсене, което е особено важно за нашите потребители. Yandex предоставя достъп до своите бази данни на разработчици на трети страни. В резултат на това много руски проекти за алтернативно търсене в Интернет използват ресурсите на Yandex по един или друг начин. В допълнение към обичайната система за търсене се предлага и съкратена версия на Yandex, достъпна на ya.ru. Интерфейсът на тази версия се състои само от поле за въвеждане на заявка и бутон за стартиране на търсенето.

Търсенето на уеб документи предлага както прости, така и разширени режими на търсене. Простото търсене не предоставя никакви филтри, което се компенсира от възможността за автоматично анализиране на заявки на естествен език, уверена обработка на относително дълги заявки и система за автоматично завършване на заявки. Максималната дължина на заявката е четиридесет думи.

Формата за разширено търсене за съставяне на заявка предлага само едно поле. Логическите оператори, свързващи думите за заявка, се препоръчва да се въвеждат ръчно, добре. Yandex има доста подробен език за заявки. Останалите инструменти за формуляри за разширено търсене са различни филтри (1.4).

Bing

Историята на търсенето в Интернет от Microsoft не е лесна за извикване. Услугите, последователно предлагани на обществеността, многократно променят алгоритмите, използваните бази данни и, разбира се, имената. До началото на 2000-те търсачката нямаше собствени бази данни и работеше с външни индекси от AltaVista, Inktomi и Looksmart. Оригиналното име MSN Search се използва до 2006 г., а след това за няколко години смяната на имената на търсачката се превърна в традиция за Microsoft.

Заедно с окончателния преход към търсене в собствените си индекси, MSN Search беше преименуван първо на Windows LiveLive Search. И накрая, в началото на лятото на 2009 г. Live Search беше заменено от новия проект за търсене Bing.

„Bing ще предостави различен начин за разглеждане на информацията в интернет и ще помогне на потребителите да вземат важни решения“, с такова изявление започва прессъобщението на Microsoft за пускането на Bing. Стремежите на разработчиците бяха разбираеми: търсачките на Microsoft, въпреки всички усилия, на Запад постоянно отстъпваха по популярност на лидерите - Google и Yahoo!. Ако говорим за рускоезичните версии на предишни проекти за търсене на Microsoft, тогава по отношение на броя и качеството на намерените връзки те са много по-ниски от големите руски търсачки. В опит да настигнат конкурентите, разработчиците на Bing разчитат на подобряване на качеството на търсенето и въвеждането на нови технологии, много от които са придобити заедно с фирмите, които са ги създали.

трябва да бъде отбелязано че Руска версия Bing, подобно на повечето други локализирани версии, няма редица допълнителни функции, като търсене в магазини. Тъй като те всъщност работят само на север. Америка, няма смисъл да се спираме подробно на тях.

Exalead

Една от характеристиките на Европа, включително в областта на търсенето в интернет, е големият брой национални езици. Търсачка, която претендира да бъде лидер в Европа, е просто длъжна да индексира добре националните сегменти на Интернет и да обработва качествено заявки на много европейски езици, както на най-големите, така и на по-рядко срещаните. Именно в тази област европейското развитие може да получи сериозно развитие конкурентно предимствов сравнение с мощни задгранични конкуренти. В момента системата Exalead сериозно претендира за ролята на такава европейска търсачка. Този проект е разработен като част от изследователската програма Quaere, финансирана от Европейския съюз.

Exalead има свои собствени индексни бази данни. Основните ресурси за търсене на системата са бази данни с уеб документи, изображения, видео и новини. начална страница Exalead предлага възможност персонализиране. На тази страница можете да поставите връзки към любимите си сайтове - те ще се показват като графични миниатюри-екранни снимки. Вярно е, че за това ще трябва да регистрирате акаунт безплатно, както и да разрешите на браузъра да съхранява бисквитки Exalead.

Exalead Web Search предлага прости и разширени режими на търсене. Формата за разширено търсене, подобно на Bing, се отваря директно на страницата за издаване Обърнете внимание, че Exalead предлага не само позната форма с набор от допълнителни полета, но сложно падащо меню, което действа като съветник за прецизиране на заявката (Фиг. 1.7). Когато изберете един или друг елемент в менюто на съветника, към низа на заявката се добавят нови елементи и, ако е необходимо, оператори и специални знаци.

Въведение

В момента Интернет обединява стотици милиони сървъри, които хостват милиарди различни сайтове и отделни файлове, съдържащи различни видове информация. Това е гигантско хранилище на информация. Има различни методи за търсене на информация в Интернет.

Търсене по известен адрес.Необходимите адреси се вземат от указатели. Знаейки адреса, просто го въведете адресна лентаБраузър.

Пример 1. www.gov.ru - сървърът на държавните органи на Русия.

Изграждане на адрес от потребителя.Познавайки системата за генериране на интернет адреси, можете да конструирате адреси, когато търсите уеб сайтове.

Необходимо е да добавите тематичен или географски домейн към ключова дума (името на фирма, предприятие, организация или просто английско съществително) и интуицията трябва да бъде свързана.

Пример 2 Адреси на търговски уеб страници:

www.samsung.com SAMSUNG),

www.mtv.com (MTV музикални новини).

Пример 3. Адреси на учебни заведения:

www.ntu.edu (Национален университет на САЩ).

Търсачкиинтернет

За търсене на информация в Интернет са разработени специални системи за извличане на информация. Търсачките имат редовен адрес и се показват като уеб страница, съдържаща специални инструменти за организиране на търсенето (низ за търсене, тематичен каталог, връзки). За да извикате търсачка, просто въведете нейния адрес в адресната лента на браузъра.

Според статистическата услуга LiveInternet.ru разпределението на търсачките в Русия е приблизително следното:

2) Google - 35,0%

3) Търсене в Mail.ru - 8,3%

4) Rambler - 0,9%

Според метода на организиране на информацията системите за търсене на информация се разделят на два вида: класификация (рубикатори) и речник.

Рубрикатори (класификатори)- търсачки, които използват йерархична (дървовидна) организация на информацията. Когато търси информация, потребителят преглежда тематични заглавия, като постепенно стеснява полето за търсене (например, ако трябва да намерите значението на дума, първо трябва да намерите речник в класификатора и след това да намерите правилната дума в него).



Търсачки на речнициса мощни автоматични софтуерни и хардуерни системи. С тяхна помощ се преглежда (сканира) информация в интернет. Данните за местоположението на тази или онази информация се въвеждат в специални справочници-индекси. В отговор на заявката се извършва търсене в съответствие с низа на заявката. В резултат на това на потребителя се предлагат тези адреси (URL), където търсената дума или група от думи е намерена по време на сканирането. Като изберете някоя от предложените връзки, можете да отидете до намерения документ. Повечето съвременни търсачки са смесени.

Най-известните и популярни търсачки:

Има системи, които са специализирани в търсенето информационни ресурсив различни посоки.

https://my.mail.ru

https://ru-ru.facebook.com

https://twitter.com

https://www.tumblr.com

https://www.instagram.com и др.

Тематични търсачки:

Търсене на софтуер:

Каталози (тематични колекции от връзки с анотации):

http://www.atrus.ru

Правила за изпълнение на заявки

Във всяка търсачка, в секцията Помощ, можете да получите информация как да търсите, как да съставите низ за заявка. По-долу е дадена информация за типичен, "среден" език за заявки.

Проста заявка

Въведете една дума, която определя темата за търсене. Например в търсачката Rambler.ru е достатъчно да въведете: автоматизация.

Намерени са документи, които съдържат думите, посочени в заявката. Разпознават се всички форми на руски думи, като правило буквите се игнорират.

Можете да използвате знака "*" или "?" в заявката. Знак "?" в ключовата дума се заменя един знак, на мястото на който може да се замени произволна буква, а знакът "*" е последователност от знаци.

Например автоматът за заявки* ще намери документи, които включват думите автоматичен, автоматичен и т.н.

Комплексно искане

Често има нужда от комбиниране ключови думиза по-конкретна информация. В този случай се използват допълнителни свързващи думи, функции, оператори, символи, комбинации от оператори, разделени със скоби.

Например, заявката music & (beatles beatles) означава, че потребителят търси документи, съдържащи думите музика и beatles или музика и beatles.

Списък на сървъри за търсене и директории

Адрес Описание
www.excite.com Търсачка с прегледи на възли и ръководства
www.alta-vista.com Сървър за търсене, налични са разширени възможности за търсене
www.hotbot.com сървър за търсене
www.ifoseek.com Сървър за търсене (лесен за използване)
www.ipl.org Интернет публична библиотека, обществена библиотека, работеща като част от проекта World Village
www.wisewire.com WiseWire - организация на търсене с помощта на изкуствен интелект
www.webcrawler.com WebCrawler - сървър за търсене, лесен за използване
www.yahoo.com Уеб каталог и интерфейс за достъп до пълнотекстово търсене на сървъра на AltaVista
www.aport.ru Aport - сървър за търсене на руски език
www.yandex.ru Yandex - сървър за търсене на руски език
www.rambler.ru Rambler - сървър за търсене на руски език
Помощни ресурси в Интернет
www.yellow.com Интернет жълти страници
monk.newmail.ru Търсачки с различни профили
www.top200.ru Топ 200 уебсайта
www.allru.net
www.ru Каталог на руски интернет ресурси
www.allru.net/z09.htm Образователни ресурси
www.students.ru Руски студентски сървър
www.cdo.ru/index_new.asp Център за дистанционно обучение
www.open.ac.uk Open University UK
www.ntu.edu Национален университет на САЩ
www.translate.ru Електронен текстов преводач
www.pomorsu.ru/guide.library.html Списък с връзки към нетни библиотеки
www.elibrary.ru Научна електронна библиотека
www.citforum.ru Електронна библиотека
www.infamed.com/psy Психологически тестове
www.pokoleniye.ru Уебсайт на федерацията за интернет образование
www.metod.narod.ru Образователни ресурси
www.spb.osi.ru/ic/distant Дистанционно обучение по интернет
www.examen.ru Изпити и тестове
www.kbsu.ru/~book/ Учебник по информатика
Mega.km.ru Енциклопедии и речници

Професионално търсене на информация в интернет

Търсенето на информация е едно от най-разпространените и в същото време най-много предизвикателни задачис които всеки потребител трябва да се справя в мрежата. Въпреки това, ако за обикновен член на мрежовата общност познаването на ефективни методи за извличане на информация е желано, но далеч не е задължително качество, то за информационните професионалисти способността за бързо навигиране в интернет ресурсите и намиране на необходимите източници е един от основни квалификационни умения.

Причината за трудностите, които възникват при извличането на информация в Интернет, се определя от два основни фактора. Първо, броят на източниците в мрежата е изключително голям. В края на 2001 г. най-грубите оценки сочат приблизителна цифра от 7,5 милиарда документа, разположени на сървъри по целия свят. Второ, количеството информация в мрежата е не само колосално по обем, но и изключително динамично. За половин минута, която сте прекарали в четене на първите редове на този раздел, около стотина нови или променени документа се появиха във виртуалната вселена, десетки бяха преместени на нови адреси и единици престанаха да съществуват завинаги. Интернет никога не "спи", както никога не "спи" нашата планета, по която непрекъснато се търкаля вълна от човешка бизнес дейност в точно съответствие със смяната на часовите зони.

За разлика от стабилната и контролирана колекция от документи в библиотеката, в мрежата имаме работа с гигантски и постоянно променящ се информационен масив, търсенето на данни в който е много, много сложен процес. Ситуацията често много напомня на добре познатата задача за намиране на игла в купа сено и понякога информация с голяма стойност остава непотърсена единствено поради трудността да се намери.

Повечето от потребителите на global компютърни мрежи. И любителите, и професионалистите често използват едни и същи инструменти. Резултатите от търсенията и времето, отделено за тях, обаче се различават в много голяма степен.

Целта на този раздел е да се запознаете в детайли с инструментите и методите за извличане на информация и да развиете устойчиви умения за професионално търсене в мрежата на всички видове данни: от текстове във всякакъв формат до видео и анимация.