چیست؟

DuckDuckGo یک موتور جستجوی متن باز نسبتاً شناخته شده است. کد منبع. سرورها در ایالات متحده آمریکا قرار دارند. این موتور جستجو علاوه بر ربات خود، از نتایج منابع دیگر استفاده می کند: یاهو، بینگ، ویکی پدیا.

بهتر

DuckDuckGo خود را به عنوان جستجوی نهایی حریم خصوصی و حریم خصوصی قرار می دهد. این سیستم هیچ اطلاعاتی در مورد کاربر جمع آوری نمی کند، گزارش ها را ذخیره نمی کند (بدون سابقه جستجو)، استفاده می کند بیسکویت هاحداکثر محدود است.

DuckDuckGo اطلاعات شخصی کاربران را جمع آوری یا به اشتراک نمی گذارد. این سیاست حفظ حریم خصوصی ما است.

گابریل واینبرگ، بنیانگذار DuckDuckGo

چرا شما به این نیاز دارید

همه موتورهای جستجوی اصلی سعی می‌کنند نتایج جستجو را بر اساس داده‌های مربوط به شخص مقابل مانیتور شخصی‌سازی کنند. این پدیده «حباب فیلتر» نامیده می‌شود: کاربر فقط نتایجی را می‌بیند که با ترجیحات او مطابقت داشته باشند یا سیستم آن‌ها را چنین در نظر بگیرد.

تصویری عینی ایجاد می کند که به رفتار گذشته شما در وب بستگی ندارد و موضوعی را حذف می کند تبلیغات گوگلو "Yandex" بر اساس درخواست شما. با کمک DuckDuckGo، جستجوی اطلاعات به زبان های خارجی آسان است، در حالی که گوگل و یاندکس به طور پیش فرض سایت های روسی زبان را ترجیح می دهند، حتی اگر پرس و جو به زبان دیگری وارد شده باشد.


چیست؟

not Evil سیستمی است که شبکه Tor ناشناس را جستجو می کند. برای استفاده از آن باید به این شبکه بروید، مثلاً با راه اندازی یک .

نه ایول تنها موتور جستجو در نوع خود نیست. LOOK (جستجوی پیش‌فرض در مرورگر Tor، قابل دسترسی از اینترنت معمولی) یا TORCH (یکی از قدیمی‌ترین موتورهای جستجو در شبکه Tor) و موارد دیگر وجود دارد. ما به دلیل اشارات غیرقابل انکار به گوگل (فقط به صفحه شروع نگاه کنید) روی نه شیطان اکتفا کردیم.

بهتر

او به دنبال جایی است که گوگل، یاندکس و سایر موتورهای جستجو اصولاً از دسترسی آنها محروم هستند.

چرا شما به این نیاز دارید

منابع زیادی در شبکه Tor وجود دارد که نمی توان آنها را در اینترنت مطیع قانون یافت. و با تشدید کنترل مقامات بر محتویات وب، تعداد آنها افزایش خواهد یافت. Tor نوعی شبکه درون وب با شبکه های اجتماعی، ردیاب های تورنت، رسانه ها، پلتفرم های معاملاتی، وبلاگ ها، کتابخانه ها و غیره.

3. YaCy

چیست؟

YaCy یک موتور جستجوی غیرمتمرکز است که بر اساس اصل شبکه های P2P کار می کند. هر کامپیوتری که یک اصلی دارد ماژول نرم افزار، اینترنت را به تنهایی اسکن می کند، یعنی آنالوگ یک ربات جستجوگر است. نتایج به‌دست‌آمده در یک پایگاه داده مشترک جمع‌آوری می‌شوند که توسط همه شرکت‌کنندگان YaCy استفاده می‌شود.

بهتر

در اینجا نمی توان گفت که آیا این بهتر است یا بدتر، زیرا YaCy رویکرد کاملاً متفاوتی برای سازماندهی جستجو است. فقدان یک سرور و شرکت مالک، نتایج را کاملاً مستقل از ترجیحات هر کسی می کند. استقلال هر گره از سانسور خارج می شود. YaCy قادر به جستجو در وب عمیق و شبکه های عمومی غیر نمایه شده است.

چرا شما به این نیاز دارید

اگر طرفدار متن باز هستید و اینترنت رایگان، تحت تأثیر سازمان های دولتی و شرکت های بزرگ قرار نگرفته اند، پس YaCy انتخاب شماست. همچنین می توان از آن برای سازماندهی جستجوها در یک شرکت یا شبکه مستقل دیگر استفاده کرد. و اگرچه YaCy در زندگی روزمره چندان کاربردی نیست، اما از نظر فرآیند جستجو، جایگزین مناسبی برای گوگل است.

4. پیپل

چیست؟

Pipl سیستمی است که برای جستجوی اطلاعات در مورد یک شخص خاص طراحی شده است.

بهتر

نویسندگان Pipl ادعا می کنند که الگوریتم های تخصصی آنها کارآمدتر از موتورهای جستجوی معمولی جستجو می کنند. به طور خاص، پروفایل ها در اولویت هستند شبکه های اجتماعی، نظرات، لیست های شرکت کنندگان و پایگاه های اطلاعاتی مختلفی که اطلاعات مربوط به افراد در آنها منتشر می شود، مانند پایگاه های داده تصمیمات دادگاه. رهبری Pipl در این زمینه توسط Lifehacker.com، TechCrunch و سایر نشریات تایید شده است.

چرا شما به این نیاز دارید

اگر نیاز به یافتن اطلاعاتی در مورد شخصی که در ایالات متحده زندگی می کند دارید، Pipl بسیار کارآمدتر از Google خواهد بود. ظاهراً پایگاه های داده دادگاه های روسیه برای موتور جستجو غیرقابل دسترسی است. بنابراین، او به خوبی با شهروندان روسیه کنار نمی آید.

چیست؟

FindSounds یکی دیگر از موتورهای جستجوی تخصصی است. منابع باز را برای صداهای مختلف جستجو می کند: خانه، طبیعت، اتومبیل، مردم و غیره. این سرویس از درخواست ها به زبان روسی پشتیبانی نمی کند، اما لیست قابل توجهی از برچسب های روسی زبان وجود دارد که می توانید آنها را جستجو کنید.

بهتر

در صدور فقط صداها و نه بیشتر. در تنظیمات می توانید فرمت و کیفیت صدای دلخواه را تنظیم کنید. همه صداهای یافت شده برای دانلود در دسترس هستند. جستجوی الگو وجود دارد.

چرا شما به این نیاز دارید

اگر می خواهید به سرعت صدای شلیک تفنگ، ضربه دارکوب مکنده یا فریاد هومر سیمپسون را بیابید، پس این سرویس برای شما مناسب است. و ما این را فقط از پرس و جوهای موجود به زبان روسی انتخاب کردیم. در زبان انگلیسیطیف حتی گسترده تر است.

به طور جدی، یک سرویس تخصصی مستلزم یک مخاطب تخصصی است. اما آیا برای شما هم مفید خواهد بود؟

چیست؟

Wolfram|Alpha یک موتور جستجوی محاسباتی است. به جای پیوند به مقالات حاوی کلمات کلیدی، به درخواست کاربر پاسخ آماده می دهد. به عنوان مثال، اگر در فرم جستجو "مقایسه جمعیت نیویورک و سانفرانسیسکو" را به زبان انگلیسی وارد کنید، Wolfram|Alpha بلافاصله جداول و نمودارها را با مقایسه نمایش می دهد.

بهتر

این سرویس نسبت به سایرین برای یافتن حقایق و محاسبه داده ها بهتر است. Wolfram|Alpha دانش موجود در وب را از آن انباشته و منظم می کند مناطق مختلفاز جمله علم، فرهنگ و سرگرمی. اگر این پایگاه داده حاوی یک پاسخ آماده برای یک عبارت جستجو باشد، سیستم آن را نشان می دهد، اگر نه، نتیجه را محاسبه و نمایش می دهد. در این حالت کاربر فقط می بیند و نه بیشتر.

چرا شما به این نیاز دارید

اگر برای مثال دانشجو، تحلیلگر، روزنامه نگار یا محقق هستید، می توانید از Wolfram|Alpha برای یافتن و محاسبه داده های مربوط به فعالیت های خود استفاده کنید. این سرویس همه درخواست ها را درک نمی کند، اما دائما در حال تکامل و هوشمندتر شدن است.

چیست؟

موتور Metasearch Dogpile لیست ترکیبی از نتایج موتورهای جستجو را نمایش می دهد. SERP های گوگل، یاهو و سایر سیستم های محبوب.

بهتر

اول، Dogpile تبلیغات کمتری را نمایش می دهد. در مرحله دوم، این سرویس از یک الگوریتم ویژه برای یافتن و نمایش استفاده می کند بالاترین امتیازهااز موتورهای جستجوی مختلف به گفته توسعه دهندگان Dogpile، سیستم آنها کامل ترین مشکل را در کل اینترنت ایجاد می کند.

چرا شما به این نیاز دارید

اگر نمی توانید اطلاعاتی را در گوگل یا موتورهای جستجوی استاندارد دیگر پیدا کنید، با استفاده از Dogpile آن را در چندین موتور جستجو به طور همزمان جستجو کنید.

چیست؟

BoardReader یک سیستم جستجوی متن برای انجمن ها، خدمات پرسش و پاسخ و سایر جوامع است.

بهتر

این سرویس به شما اجازه می دهد تا فیلد جستجو را به سایت های اجتماعی محدود کنید. به لطف فیلترهای ویژه، می توانید به سرعت پست ها و نظراتی را پیدا کنید که با معیارهای شما مطابقت دارند: زبان، تاریخ انتشار و نام سایت.

چرا شما به این نیاز دارید

BoardReader می تواند برای متخصصان روابط عمومی و سایر متخصصان رسانه که به نظر رسانه های جمعی در مورد موضوعات خاص علاقه مند هستند مفید باشد.

سرانجام

عمر موتورهای جستجوی جایگزین اغلب زودگذر است. لایف هکر از سرگئی پترنکو مدیر عامل سابق شعبه اوکراینی شرکت Yandex در مورد چشم انداز بلندمدت چنین پروژه هایی سوال کرد.


سرگئی پترنکو

مدیر عامل سابق Yandex.Ukraine.

در مورد سرنوشت موتورهای جستجوی جایگزین، ساده است: پروژه های بسیار خاص با مخاطبان کوچک، بنابراین، بدون چشم انداز تجاری روشن، یا، برعکس، با وضوح کامل عدم وجود آنها.

اگر به نمونه‌های مقاله نگاه کنید، می‌بینید که چنین موتورهای جستجو یا در یک جایگاه باریک اما پرتقاضا تخصص دارند، که شاید فقط تا کنون، آنقدر رشد نکرده است که در رادارهای گوگل یا یاندکس قابل توجه باشد. یا در حال آزمایش یک فرضیه اصلی در رتبه بندی هستند که هنوز در جستجوی متعارف قابل اجرا نیست.

به عنوان مثال، اگر جستجوی Tor به طور ناگهانی مورد تقاضا قرار گیرد، یعنی حداقل درصدی از مخاطبان گوگل به نتایج از آنجا نیاز داشته باشند، مطمئناً موتورهای جستجوی معمولی شروع به حل این مشکل می کنند که چگونه آنها را پیدا کنید و به کاربر نشان دهید. اگر رفتار مخاطب نشان دهد که بخش قابل توجهی از کاربران در تعداد قابل توجهی از پرس و جوها به نظر می رسد نتایج مرتبط تری دارند، داده هایی بدون در نظر گرفتن عواملی که به کاربر بستگی دارد، Yandex یا Google شروع به ارائه چنین نتایجی خواهند کرد.

«بهتر بودن» در متن این مقاله به معنای «بهتر بودن در همه چیز» نیست. بله، از بسیاری جهات قهرمانان ما از Yandex دور هستند (حتی از Bing). اما هر یک از این خدمات چیزی را به کاربر می دهد که غول های صنعت جستجو نمی توانند ارائه دهند. حتما شما هم پروژه های مشابه را می شناسید. با ما به اشتراک بگذارید - بیایید بحث کنیم.

جستجوی حرفه ای برای اطلاعات در اینترنت

جستجوی اینترنتی یک عنصر مهم در کار بر روی وب است. تعداد دقیق منابع وب اینترنت مدرن به سختی برای کسی مشخص است. در هر صورت این صورت حساب میلیاردی می شود. برای اینکه بتوانید از اطلاعات مورد نیاز در این لحظه خاص، چه برای اهداف تجاری یا سرگرمی، استفاده کنید، ابتدا باید آن را در این اقیانوس دائماً پر از منابع پیدا کنید.

برای موفقیت آمیز بودن جستجوی اینترنتی، دو شرط باید رعایت شود: پرس و جوها باید به خوبی فرمول بندی شوند و در مکان های مناسب پرسیده شوند. به عبارت دیگر، کاربر باید از یک طرف بتواند علایق جستجوی خود را به زبان ترجمه کند پرس و جو جستجوو از طرفی شناخت خوب موتورهای جستجو، ابزارهای جستجوی موجود، مزایا و معایب آن ها که به شما امکان می دهد در هر مورد خاص مناسب ترین ابزار جستجو را انتخاب کنید.

در حال حاضر، هیچ منبع واحدی وجود ندارد که تمام الزامات جستجوی اینترنتی را برآورده کند. بنابراین، با رویکرد جدی به جستجو، ناگزیر باید از ابزارهای مختلفی استفاده کنید که از هر کدام در مناسب ترین حالت استفاده کنید.

اصلی ابزارهای جستجوی اینترنتیرا می توان به گروه های اصلی زیر تقسیم کرد:

موتورهای جستجو؛

دایرکتوری های وب؛

منابع مرجع؛

برنامه های محلی برای جستجو در اینترنت.

محبوب ترین موتور جستجو استموتورهای جستجو- به اصطلاح موتورهای جستجوی اینترنتی (موتورهای جستجو). سه رهبر برتر در مقیاس جهانی کاملاً پایدار هستند - اینها گوگل، یاهو هستند! و بینگ بسیاری از کشورها موتورهای جستجوی محلی خود را که برای محتوای محلی بهینه شده اند به این لیست اضافه می کنند. با کمک آنها، از نظر تئوری، می توانید هر کلمه خاصی را در صفحات میلیون ها سایت پیدا کنید. از دید کاربر، عیب اصلی موتورهای جستجو حضور اجتناب ناپذیر استنویز اطلاعاتدر نتایج به این صورت مرسوم است که نتایجی را که به دلایلی در فهرست نتایجی که با پرس و جو مطابقت ندارند، قرار می گیرند، فراخوانی می کنند.

با وجود تفاوت های زیاد، همه موتورهای جستجوی اینترنتی بر اساس اصول مشابهی کار می کنند و از نقطه نظر فنی از زیرسیستم های مشابهی تشکیل شده اند. اولین بخش ساختاری موتور جستجو - برنامه های ویژه، برای جستجوی خودکار و نمایه سازی بعدی صفحات وب استفاده می شود. چنین برنامه هایی معمولاً عنکبوت یا ربات نامیده می شوند. آنها به کد صفحات وب نگاه می کنند، پیوندهای موجود در آنها را پیدا می کنند و در نتیجه صفحات وب جدیدی را کشف می کنند. نیز وجود دارد راه جایگزیندرج سایت در فهرست بسیاری از موتورهای جستجو به صاحبان منابع این فرصت را می دهند که به تنهایی یک سایت را به پایگاه داده خود اضافه کنند. به هر حال، صفحات وب دانلود، تجزیه و تحلیل و فهرست بندی می شوند. عناصر ساختاری در آنها برجسته می شود، کلمات کلیدی پیدا می شوند، پیوندهای آنها با سایر سایت ها و صفحات وب مشخص می شود. عملیات دیگری نیز انجام می شود که نتیجه آن تشکیل پایگاه شاخص موتور جستجو است. این پایه دومین عنصر اصلی هر موتور جستجو است. در حال حاضر، هیچ پایگاه فهرستی کاملاً کاملی وجود ندارد که حاوی اطلاعاتی در مورد تمام محتوای اینترنت باشد. از آنجایی که موتورهای جستجوی مختلف از برنامه های مختلف جستجوی صفحات وب استفاده می کنند و فهرست خود را با استفاده از الگوریتم های مختلف ایجاد می کنند، پایگاه های فهرست موتورهای جستجو می توانند به طور قابل توجهی متفاوت باشند. برخی از سایت ها توسط چندین موتور جستجو ایندکس می شوند، اما همیشه درصد مشخصی از منابع در پایگاه داده تنها یک موتور جستجو وجود دارد. این واقعیت که هر موتور جستجو دارای چنین بخش اصلی و غیرهمپوشانی از ایندکس است به شما امکان می دهد یک نتیجه عملی مهم بگیرید: اگر فقط از یک موتور جستجو استفاده کنید، حتی از بزرگترین موتور جستجو، قطعا درصد مشخصی از لینک های مفید را از دست خواهید داد. .

بخش بعدی موتور جستجوی اینترنت، برنامه جستجو و مرتب سازی واقعی است. این برنامه‌ها دو کار اصلی را حل می‌کنند: اول، صفحات و فایل‌هایی را در پایگاه داده که با درخواست ورودی مطابقت دارند پیدا می‌کنند و سپس آرایه داده‌های حاصل را بر اساس معیارهای مختلف مرتب می‌کنند. موفقیت در دستیابی به اهداف جستجو تا حد زیادی به اثربخشی کار آنها بستگی دارد.

آخرین عنصر یک موتور جستجوی اینترنتی، رابط کاربری است. علاوه بر الزامات معمول برای زیبایی شناسی و راحتی برای هر سایت، رابط های موتورهای جستجو یک نیاز مهم دیگر نیز دارند: آنها باید ابزارهای مختلفی را برای جمع آوری و اصلاح پرس و جوها و همچنین مرتب سازی و فیلتر کردن نتایج ارائه دهند. از مزایای موتورهای جستجو می توان به پوشش عالی منابع، به روز رسانی نسبتا سریع محتوای پایگاه داده و یک انتخاب خوب ویژگی های اضافی.

ابزار اصلی کار با موتورهای جستجو یک پرس و جو است.

برای جستجوی اینترنتی، از برنامه های ویژه نصب شده بر روی رایانه محلی نیز استفاده می شود. اینها می توانند هم برنامه های ساده و هم مجموعه های پیچیده جستجو و تحلیل داده ها باشند. رایج‌ترین افزونه‌های مرورگر، افزونه‌های مرورگر، پنل‌های مرورگر طراحی‌شده برای کار با یک سرویس جستجوی خاص و بسته‌های متاجستجو با قابلیت تجزیه و تحلیل نتایج هستند.

دایرکتوری های وب - اینها منابعی هستند که در آنها سایت ها بر اساس دسته بندی های موضوعی توزیع می شوند. اگر کاربر فقط از طریق پرس و جو با موتورهای جستجو کار کند، کاتالوگ توانایی مشاهده کل بخش های موضوعی را دارد. دومین تفاوت اساسی بین کاتالوگ ها و موتورهای جستجوی خودکار این است که معمولاً افرادی مستقیماً در محتوای آنها شرکت می کنند که منابع را مشاهده می کنند و سایت را به دسته بندی دیگری نسبت می دهند. دایرکتوری های وب معمولا به دو دسته جهانی و موضوعی تقسیم می شوند. یونیورسال سعی می کند تا حد امکان موضوعات بیشتری را پوشش دهد. شما می توانید هر چیزی را در آنها بیابید: از سایت های مربوط به شعر گرفته تا منابع رایانه ای. به عبارت دیگر، آنها حداکثر وسعت جستجو را دارند. از سوی دیگر، دایرکتوری های موضوعی در یک موضوع خاص تخصص دارند و با کاهش وسعت پوشش منابع، حداکثر عمق جستجو را فراهم می کنند.

مزیت دایرکتوری ها کیفیت نسبتاً بالای منابع است، زیرا هر سایت در آن توسط یک شخص مشاهده و انتخاب می شود. گروه بندی موضوعی سایت ها به شما این امکان را می دهد که سایت هایی با موضوعات مشابه را به راحتی پیدا کنید. این حالت عملکرد برای کشف سایت های جدید برای شما در مورد موضوع مورد علاقه خوب است - دقیق تر از استفاده از موتور جستجو است. توصیه می شود برای اولین آشنایی با هر زمینه موضوعی و همچنین جستجوی پرس و جوهای فازی از دایرکتوری های وب استفاده کنید - این فرصت را خواهید داشت که در بخش های دایرکتوری "سرگردان" شوید و با دقت بیشتری آنچه را که نیاز دارید تعیین کنید.

معایب دایرکتوری های وب شناخته شده است. اول از همه، این یک پر کردن آهسته پایگاه داده است، زیرا گنجاندن یک سایت در کاتالوگ نیاز به مشارکت یک شخص دارد. از نظر کارایی، فهرست وب رقیبی برای موتورهای جستجو نیست. علاوه بر این، دایرکتوری های وب از نظر اندازه پایگاه داده به طور قابل توجهی از موتورهای جستجو پایین تر هستند.

وقتی صحبت از جستجوی اینترنتی می شود، نمی توان تعدادی از اصطلاحاتی را که ارتباط نزدیکی با این حوزه دارند و اغلب برای توصیف و ارزیابی موتورهای جستجو به کار می روند، نادیده گرفت. مثلا:وسعت و عمق جستجوی اینترنتی، جستجو در اینترنت. جستجوی گسترده جستجویی است که تا حد امکان منابع اطلاعاتی را جمع آوری می کند. در عین حال، حداقل ذکر یک سایت خاص که با پرس و جو مطابقت دارد کافی تلقی می شود. عمق جستجو به جزئیات نمایه سازی و جستجوی بعدی هر منبع خاص اشاره دارد. به عنوان مثال، بسیاری از موتورهای جستجو رویکردهای متفاوتی برای فهرست بندی سایت های مختلف دارند. سایت های بزرگ و محبوب به حداکثر میزان ایندکس می شوند، ربات ها سعی می کنند حتی یک صفحه از چنین منبعی را از دست ندهند. در عین حال، در سایت های دیگر، فقط صفحه اصلی و چند صفحه از محتوا را می توان ایندکس کرد. این شرایط البته بر جستجوی بعدی تأثیر می گذارد. جستجوی عمیق بر اساس این اصل کار می کند که "بهتر است اطلاعات اضافی در نتایج گنجانده شود تا اینکه داده های مرتبط با موضوع جستجو را از دست بدهیم."

بسیار رایج است که با مفاهیمی مانندجهانی و محلی جستجوی اینترنتی، جستجو در اینترنت. جستجوی اینترنتی محلی موقعیت جغرافیایی کاربر را در نظر می گیرد و به نتایجی که به نوعی به یک کشور یا محل خاص مربوط می شوند، اولویت می دهد. یک جستجوی جهانی این اطلاعات را نادیده می گیرد و همه منابع موجود را جستجو می کند.

هنگام کامپایل یک پرس و جو در موتورهای جستجوی اینترنتی، حالت های مختلفجستجو کردن. حالت‌های جستجوی معمولی که در اکثر ماشین‌های اینترنتی یافت می‌شوند عبارتند ازساده و گسترده جستجو کردن. جستجوی ساده به شما امکان می دهد تنها یک ویژگی جستجو را در یک جستجو مشخص کنید. جستجوی پیشرفته امکان ایجاد یک پرس و جو از چندین شرط را با پیوند دادن آنها با عملگرهای منطقی فراهم می کند.

روش های مختلفی برای اصلاح پرس و جوهای جستجو استفاده می شود.فیلترها . فیلترها به آن دسته یا سایر ابزارهای کمکی برای کامپایل یک پرس و جو می گویند که به سمت محتوای شرایط پرس و جو مربوط نمی شود، اما نتایج جستجو را به نشانه های رسمی محدود می کند. بنابراین، به عنوان مثال، هنگام اعمال فیلتر نوع فایل هنگام جستجو، کاربر اطلاعات مربوط به موضوع درخواست خود را در اختیار سیستم قرار نمی دهد، بلکه فقط نتایج به دست آمده را به نوع فایل خاصی که در شرایط درخواست وی مشخص شده است محدود می کند.

برای اکثر کاربران، موتورهای جستجوی جهانی اصلی ترین و اغلب تنها ابزار جستجوی اینترنتی هستند. آنها پوشش خوبی از منابع و همچنین مجموعه ای از ابزارهای کافی برای کارهای اصلی جستجو را ارائه می دهند.

بازار موتورهای جستجوی جهانی بسیار بزرگ است. ما سعی کردیم معروف ترین موتورهای جستجو را تجزیه و تحلیل کنیم و نتایج در قالب جدول 1 ارائه شده است.

هنگام انتخاب یک موتور جستجوی جهانی، کیفیت منابع یافت شده با کمک آن نقش مهمی ایفا می کند. شما می توانید موتور جستجوی ترجیحی را برای کارهای خاص با استفاده از "روش نشانگر" تعیین کنید. ماهیت آن در این واقعیت نهفته است که در ابتدا یک جستجوی موضوعی خاص جمع آوری می شود و پس از آن گروهی از افراد - متخصصان در این زمینه برای شناسایی بهترین منابع اینترنتی در مورد موضوع انتخاب شده نظرسنجی می شوند. بر اساس داده‌های نظرسنجی، فهرستی از سایت‌های نشانگر تشکیل می‌شود که تضمین می‌شوند مرتبط با پرس و جو هستند و حاوی اطلاعات با کیفیت بالا هستند. سپس درخواست به موتورهای جستجوی تست شده ارسال می شود. منطق ارزیابی ساده است: هر چه سایت‌های نشانگر بالاتر در نتایج جستجو قرار گیرند، یک منبع خاص برای یافتن اطلاعات در مورد یک موضوع آزمایشی مناسب‌تر است.



در مورد آنچه در زمان ما است صحبت کنید فناوری اطلاعاتو رشد بی پایان حجم داده های موجود هم برای یک فرد و هم برای جامعه ، مشکلات زیادی در پردازش اطلاعات و جستجوی آن وجود دارد - این قبلاً کفرگویی است. که فقط این موضوع را مطرح نمی کند. و برای اینکه شما را با قضاوت های ذهنی و تا حدی عینی جمع آوری شده از منابع اطلاعاتی مختلف در مورد مشکل بار نکنم، مستقیماً به حل آن خواهم پرداخت. بیایید امروز در مورد جستجو صحبت کنیم. یعنی در مورد برنامه ها و سیستم های اطلاعاتی جدی که اسناد و داده های مورد نیاز ما را جستجو می کنند.

ارتقاء "جستجوی مستقیم"

نه چندان دور، زمانی که درختان بزرگ بودند و اطلاعات حتی در شبکه محلیتعداد زیادی شرکت وجود نداشت، هر جستجوی با شمارش پیش پا افتاده تعداد انگشت شماری از پرونده های موجود و بررسی مداوم نام و محتوای آنها انجام شد. چنین جستجویی مستقیم نامیده می شود و برنامه ها (ابزارها) با استفاده از فناوری جستجوی مستقیم به طور سنتی در همه وجود دارند سیستم های عاملو بسته های ابزار اما، حتی قدرت کامپیوترهای مدرن برای جستجوی سریع و کافی در مقادیر عظیم داده در طول جستجوی مستقیم کافی نیست. جستجوی چند صد سند روی یک دیسک و جستجو در یک کتابخانه عظیم و چندین ده صندوق پستی دو چیز متفاوت هستند. بنابراین، امروزه برنامه های جستجوی مستقیم به وضوح در پس زمینه محو می شوند - اگر در مورد ابزارهای جهانی صحبت می کنیم.

البته، در بخش شرکتی، این نوع جستجو برای مدت طولانی مورد تقاضا نبوده است. حجم ها یکسان نیست. و بنابراین، برای چندین سال، و اخیراً بدون تردید، فناوری هایی قادر به انجام جستجوی سریع و دقیق برای اسناد هستند. فرمت های مختلفو از منابع مختلف، بیش از مرتبط. چندی پیش، "پدر" مایکروسافت، بیل گیتس، با حسادت ظاهراً به موفقیت خارق العاده موتور جستجوی اینترنتی گوگل، در یکی از کنفرانس های مطبوعاتی تمایل این نرم افزار (در حال حاضر و نه تنها) را به هر طریق ممکن برای تبلیغ اعلام کرد. ، توسعه و تعمیق ایجاد موتورهای جستجو و فناوری. اما قبل از ایجاد هر برنامه کاری خارق العاده از مایکروسافت یا یک سرور رقابتی در اینترنت، هنوز خیلی زود است (MSN هنوز از گوگل فاصله دارد). بنابراین به تحولات موجود روی می آوریم. فهرست، پرس و جو، ارتباط

در هسته فن آوری های مدرندو فرآیند اساسی وجود دارد. اولاً، نمایه سازی اطلاعات موجود و پردازش درخواست و به دنبال آن خروجی نتایج است. در مورد اول، هر برنامه ای (خواه یک موتور جستجوی رومیزی باشد، یک سیستم اطلاعات شرکتی یا یک موتور جستجوی اینترنتی) منطقه جستجوی خود را ایجاد می کند. یعنی اسناد را پردازش می کند و نمایه ای از این اسناد را تشکیل می دهد (یک ساختار سازمان یافته که حاوی اطلاعاتی در مورد داده های پردازش شده است). در آینده، این شاخص ایجاد شده است که برای کار استفاده می شود - به سرعت لیستی از اسناد لازم را طبق درخواست به دست می آورید. علاوه بر این، اگرچه از نظر فناوری به هیچ وجه ساده نیست، اما کاملاً قابل درک است کاربر معمولی. این برنامه درخواست را پردازش می کند (بر اساس عبارت کلیدی) و لیستی از اسناد حاوی این عبارت کلیدی را نمایش می دهد. از آنجایی که اطلاعات در یک نمایه ساختاریافته قرار دارند، پردازش پرس و جو بسیار (ده ها و صدها بار!) سریعتر از جستجوی مستقیم است (انتخاب سند نه با شمارش فایل ها، بلکه با تجزیه و تحلیل اطلاعات متنی در متن انجام می شود. فهرست مطالب).

این برنامه اسناد یافت شده را در لیست حاصل با توجه به ارتباط - مطابقت سند با متن درخواست نمایش می دهد. در فن آوری های مختلف، البته، وجود دارد روش های مختلفجستجو و تعیین ارتباط سند (تعداد "تکرار" کلمه و تعداد دفعات ذکر آن در سند، نسبت این پارامترها به تعداد کل کلمات در سند، فاصله بین کلمات درخواست عبارت در فایل های جستجو شده و غیره). بر اساس این پارامترها، "وزن" سند تعیین می شود و بسته به آن، یک یا فایل دیگری در لیست نتایج در یک موقعیت خاص ظاهر می شود. در مورد جستجوی اینترنتی، وضعیت حتی پیچیده تر است. در واقع، در این مورد، بسیاری از عوامل دیگر را باید در نظر گرفت (Page Rank Google نمونه ای از این مورد است). اما این یک موضوع برای یک مقاله جداگانه است، بنابراین ما به اینترنت دست نخواهیم داد مروری بر موتورهای جستجو

این مقاله احتمالات چندین مورد را مورد بحث قرار می دهد برنامه های محبوبجستجو، که می تواند هم از سرعت مناسب و هم عملکرد خوب برخوردار باشد. اما خودنمایی در یک بروشور یک چیز است، اما ایستادن در برابر نگاه یک متخصص چیز دیگری است. و نه متخصصان بسیار و نه تعداد کمی وجود داشت، دفتر کاملی از عاشقان برای سرهم بندی نرم افزار برای قابلیت استفاده آن. در رایانه آزمایشی (Athlon 2.2 مگاهرتز، با حافظه دسترسی تصادفی 1 گیگابایت، 160 گیگابایت سیگیت 7200 دور در دقیقه هارد IDE و سیستم ویندوز XP) مجموعه ای از برنامه ها نصب شد: dtSearch Desktop، Snoop Prof Deluxe، Google Desktop Search، SearchInform، Copernic Desktop Search، ISYS Desktop. برای آزمایش، یک پایه متنی از اسناد در قالب‌های doc، txt و html با حجم کلی نه بیشتر، نه کمتر، بلکه 20 گیگابایت گردآوری شد. گروهی از رفقا با راهنمایی بنده حقیر، نظرات خود را در مورد هر نرم افزار تست، مقایسه و به اشتراک گذاشتند. برای خلاصه ای از یافته ها در زیر بخوانید. dtSearchDesktop

برنامه ای که به گفته توسعه دهندگان، ادعا می کند سریع ترین، راحت ترین و بهترین موتور جستجو است. همانطور که، به طور کلی، و بقیه این بررسی. رابط کاربری dtSearch بسیار ساده است، اما برخی از پنجره‌ها یا تب‌ها تا حدودی مملو از عناصر هستند، که این تصور را به وجود می‌آورد که استفاده از آن دشوار است. اما در واقع هیچ مشکل خاصی وجود ندارد. تنها لحظه واقعاً ناخوشایند عدم پشتیبانی از نرم افزار زبان روسی است (علیرغم این واقعیت که این برنامه می تواند اسناد را به چندین زبان جستجو کند، رابط آن منحصراً انگلیسی است).

اما dtSearch یکی از معدود برنامه هایی است که می تواند صفحات وب را با "عمق" مشخص شده توسط کاربر ایندکس کند (البته با در نظر گرفتن "خرید اضافی" در کیت الحاقی dtSearch Spider). این علاوه بر پشتیبانی از فایل های روی دیسک مختلف است فرمت های متنیو ایمیل از صندوق پستیچشم انداز در عین حال، این برنامه نمی داند چگونه با پایگاه های داده کار کند، که به دلیل حجم زیادی از اطلاعات موجود در آنها و توزیع گسترده در شرکت ها و در نتیجه در شبکه های شرکتی، لقمه خوشمزه ای برای موتورهای جستجوگر هستند. سرعت نمایه سازی اسناد dtSearch تا حد مجاز بود. با نگاهی به آینده، می گویم که این برنامه با نمایه سازی مقدار معینی از اطلاعات همتراز با یک شرکت کننده دیگر - iSYS - کنار آمد و مقام دوم را با او در لیست بیشترین ها به اشتراک گذاشت. سیستم های سریع. 20 گیگابایت اطلاعات dtSearch ایندکس شده را در 6 ساعت و 13 دقیقه تست کنید و برای نیازهای جستجوی بعدی نمایه ای 7.9 گیگابایتی ایجاد کنید.

در مورد قابلیت های جستجو، آنها در اینجا به اندازه کافی هستند. اول، dtSearch یک جستجوی صرفی دارد (جستجوی یک کلمه در تمام اشکال صرفی آن). با استفاده از این فرصت، خود را از افکاری مانند "در چه موردی از کلمه خاصی در سند مورد نیاز من استفاده شده است؟" رها می کنید. استفاده از جستجوی مورفولوژیکی تقریباً همیشه موجه است، بنابراین باید در هر موتور جستجوی حرفه ای وجود داشته باشد.

جستجوی صدا یک ویژگی غیر استاندارد حتی برای موتورهای جستجوی حرفه ای است. ماهیت آن در این واقعیت نهفته است که برنامه به دنبال کلماتی می گردد که صدایی مشابه کلمه ای که وارد کرده اید می کند. و بهترین بخش این است که این ویژگی برای زبان روسی نیز کار می کند! به عنوان مثال، تایپ کلمه "گوش" در یک عبارت جستجو نه تنها کلمات "گوش"، بلکه "گوش" را نیز به همراه خواهد داشت.

جستجوی تصحیح خطا یک ویژگی بسیار مهم است. برای جستجوی کلمات حاوی خطاهای نحوی استفاده می شود - مثلاً اینها می توانند اشتباهات تایپی یا خطاهایی در اسناد به دست آمده با استفاده از سیستم های تشخیص کاراکتر باشند. یک مثال ساده این است که شما به دنبال کلمه صفحه کلید هستید. برخی از اسناد حاوی کلمه "صفحه کلید" است، بدیهی است که در واقع این کلمه "صفحه کلید" است، فقط شخصی که در حال تایپ کردن است. اکنون، جستجوی تصحیح خطا، این سند را با کلمه "صفحه کلید" در نتیجه شناسایی کرده و شامل می شود. همچنین در dtSearch تنظیماتی وجود دارد که به شما امکان می دهد درجه کاراکترهای اشتباه احتمالی را تعیین کنید.

جستجو با استفاده از مترادف. این ویژگی از فهرستی از مترادف های کلمات مختلف استفاده می کند. به عنوان مثال، برنامه با وارد کردن کلمه "سریع" کلمات "سرعت بالا" و موارد دیگری را که مترادف کلمه "سریع" هستند نیز پیدا می کند، البته اگر وجود داشته باشد در لیست مترادف ها وجود دارد. . لیست آماده ای از مترادف ها با برنامه dtSearch ارائه نشده است، با این حال، می توان از لیست ها در اینترنت استفاده کرد (بر این اساس، اتصال لازم است، که همیشه راحت نیست)، یا می توانید لیست خود را ایجاد کنید. مترادف ها

علاوه بر ویژگی های فهرست شده، dtSearch می تواند با استفاده از عبارات متشکل از کلمات مرتبط با عملیات منطقی جستجو کند. به هر کلمه در پرس و جو می توان "وزن" خود را، یعنی اهمیت، اختصاص داد. یک گزینه مفید این است که از دیکشنری متشکل از کلمات بی اهمیت استفاده کنید تا در هنگام جستجو به آنها توجه نشود، اما این دیکشنری نیز خالی است و باید خودتان آن را پر کنید.

در مرحله بعد، هنگام کار روی شبکه، امکانات برنامه را در نظر بگیرید. در واقع، dtSearch هیچ قابلیت شبکه خاصی را ارائه نمی دهد. با این حال، استفاده از آن در شبکه کاملاً ممکن است. همچنین، می توانید مقداری فهرست ایجاد کنید و آن را در یک پوشه عمومی (اشتراک گذاری شده) قرار دهید. خود برنامه را می توان برای هر کاربر بر روی رایانه نصب کرد یا آن را در پوشه ای که برای آن باز شده است قرار داد دسترسی عمومیو با استفاده از پارامترهای خط فرمان به روشی خاص برای هر کاربر به طور جداگانه میانبر ایجاد کنید که هدف آن در فایل راهنمای ارائه شده به همراه برنامه توضیح داده شده است. همچنین امکان وجود دارد نصب اتوماتیکبرنامه ها به شبکه با استفاده از یک فایل MSI. این تنظیمات برای هر کاربر متصل را در نظر می گیرد.

به طور کلی - یک برنامه خوب از دسته موتورهای جستجوی حرفه ای. ممکن است واجد شرایط رتبه بندی خوب باشد، با این حال، به دست آوردن اعتماد و احترام از سوی کاربران ممکن است به دلیل چندین عامل برای dtSearch دشوار باشد (همه چیز با رابط یکنواخت نیست، کاربران روسی محروم هستند، هیچ ویژگی روشنی برای کار با شبکه وجود ندارد) . در مورد جستجوی مستقیم اسناد، برنامه با متن روسی همپوشانی نداشت. همانطور که هیچ کدام با مورفولوژی اعلام شده، یا با جستجوی فازی وجود نداشت. این سیستم به اندازه کافی اسناد لازم را هم با یک درخواست ساده در یک کلمه و هم با استفاده از چند پاراگراف یا هر سند به عنوان یک عبارت کلیدی پیدا کرد.

سایت رسمی:
اندازه توزیع: 23 MbSnoop Prof Deluxe

بر اساس نام، می توانید حدس بزنید که پشتیبانی از زبان روسی در این برنامه وجود دارد. در حال حاضر خوب است. در مورد رابط، به طور کلی، تا حدودی غیر معمول است، اما از نظر ظاهری بسیار جذاب است. چیز دیگر راحتی است. یک معیار بسیار بحث برانگیز، اما هنوز، احتمالا، راه حل چند پنجره ای بهترین گزینه نیست (درخواست در یک پنجره وارد می شود، نتیجه در پنجره دیگر نمایش داده می شود، و غیره).

Bloodhound همچنان از همان شاخص ها برای انجام جستجوهای سریع استفاده می کند، اما نمایه سازی بسیار کندتر از سایر برنامه ها است. این بسیار عجیب است، به خصوص با توجه به اینکه توانایی آن برای پردازش پرس و جوهای جستجو بسیار ضعیف است، به این معنی که ساختار ایندکس پیچیده نیست. به احتمال زیاد، نکته در اینجا در الگوریتم های بهینه نشده است. معلوم شد که این برنامه یک بیگانه آشکار از سرعت نمایه سازی و جستجو است: زمان صرف شده برای ایجاد یک نمایه شش برابر بیشتر از همان dtSearch و iSYS است. نمایه سازی 20 گیگابایت متون برای یک سگ خونی منجر به 38 ساعت و 46 دقیقه کار شد. و "منطقه جستجو" ایجاد شده به اندازه داده های اصلی با منهای کوچک - 19 گیگابایت، همان اندازه روی هارد دیسک را اشغال کرد.

Bloodhound می تواند به عنوان یک جایگزین ارائه شود جستجوی استاندارددر ویندوز، به سختی می تواند کارهای بیشتری انجام دهد. این واقعیت که وظیفه اصلی Bloodhound ساده‌ترین جستجوی فایل‌ها است، نه تنها با تعداد کمی از توابع برای تجزیه و تحلیل متن عبارت‌های جستجو و جستجوی پیشرفته با ویژگی‌های فایل نشان داده می‌شود، بلکه حتی یک پنجره نتایج که پیوندهای مستقیم به فایل‌ها را می‌دهد نشان می‌دهد. فایل های یافت شده و همچنین پوشه های حاوی این فایل ها. پنجره نتایج خیلی آموزنده نیست به این معنا که شما می توانید کل فایل پیدا شده را فقط با اجرای آن بخوانید، یعنی نمایشگر فایل داخلی ندارد. اما گزیده ای از فایل آورده شده است، جایی که کلمه جستجو شده پیدا شد، به طور کلی، چنین طرح نمایشی بسیار یادآور موتورهای جستجوی اینترنتی است.

در مورد امکانات خاص برای پردازش پرس و جوهای جستجو، شایان ذکر است که چیزی به نام "جستجوی متن" وجود ندارد، حداکثر چیزی که می توان جستجو کرد یک عبارت است، اگر فقط به این دلیل که فیلد ورودی متن چند خطی وجود ندارد. با این حال، شما همچنین می توانید عبارت وارد شده را تجزیه و تحلیل کنید، و Bloodhound یک مجموعه جستجوی استاندارد را در اینجا به ما ارائه می دهد: عملیات منطقی، جستجو با ماسک و جستجوی نقل قول ... زیاد نیست. برخی از مقدمات جستجوی مورفولوژیکی در برنامه وجود دارد، اما احتمالاً آنقدر خام است که بیشتر در کار صحیح اختلال ایجاد می کند (در طول آزمایش ها، همپوشانی های زیادی با استفاده نادرست از مورفولوژی مشاهده شد).

اما این برنامه به شما اجازه می دهد تا در هنگام جستجو ویژگی های فایل (تاریخ سند، نام فایل، نام پوشه) را مشخص کنید و در این کوئری ها نیز می توانید از همان مجموعه جستجو استفاده کنید. همچنین، می توانید با تعیین پارامترهای (از، موضوع .... و غیره) پیام ها را جستجو کنید.

بنابراین، ما خود جستجو را فهمیدیم، چه چیز دیگری در مورد برنامه جالب است، که طبق اطلاعات وب سایت رسمی جوایز زیادی برای آن دریافت کرد؟ به سختی می توان گفت که چه چیزی در مورد آن بسیار خاص است، به احتمال زیاد، رابط Bloodhound برای خودش مناسب است (فقط از نظر ظاهری، بدون ذکر قابلیت استفاده).

عملیات با ایندکس ها بسیار استاندارد هستند، نکته خوب امکان به روز رسانی شاخص ها بر اساس یک برنامه است. علاوه بر این، فهرست ها را می توان به صورت آنلاین نیز استفاده کرد. از این به بعد باید دقیق تر باشیم.

با وجود بدوی بودن پرس و جوهای جستجو، می توان از این برنامه برای جستجوی فایل ها استفاده کرد، بنابراین استفاده از آن در شبکه ها قابل توجیه است. اگرچه با کشش زیادی، از آنجایی که در یک شبکه بزرگ اولویت جستجوی سریع داده ها با استفاده از عبارت های جستجوی پیچیده به دلیل حجم عظیم اطلاعات است - و به وضوح مشکلاتی در سرعت جستجو و برنامه وجود دارد. باید بگویم که کار با شبکه در Bloodhound آنطور که باید فکر شده است. یک برنامه جداگانه به طور خاص برای این طراحی شده است - سرور Bloodhound. این به همان روشی که فقط Bloodhound کار می کند (آنها یک موتور جستجو دارند)، فقط برای اسناد میزبانی شده روی سرور مرکزی یا منابع مشترک در شبکه شرکتی. سرور Bloodhound فهرست های جدیدی را در منابع مشترک ایجاد می کند یا از منابعی که قبلا ایجاد شده است استفاده می کند. هر کاربر در شبکه شرکتی می‌تواند به سرور Bloodhound متصل شود و از آن برای دسترسی به هر سند (واقع در فهرست فعلی) با استفاده از مرورگر اینترنت استفاده کند. موافقم، چنین طرحی بسیار راحت است: معلوم می شود که فایل های موجود در شبکه خود را می توان به همان روشی که اطلاعات موجود در اینترنت را از طریق، به عنوان مثال، Google جستجو کرد.

با ارزیابی تمام مزایا و معایب این برنامه، نتیجه گیری به خودی خود نشان می دهد که برای شبکه های شرکتی به احتمال زیاد قابلیت های آن کافی نخواهد بود (با وجود سازماندهی خوب کار با شبکه)، اما برای یک کامپیوتر خانگی یا حتی برای یک شبکه خانگی، در اصل، ممکن است مناسب باشد. اگرچه نه سرعت کار و نه قابلیت های جستجو باعث ایجاد خوش بینی نمی شود ...

سایت رسمی به زبان روسی:
اندازه توزیع: 6 مگابایت Google Desktop Search + GDS Enterprise

البته ما نمی توانستیم چنین توسعه دهنده برجسته ای را نادیده بگیریم. نام Google در حال حاضر به خوبی صحبت می کند. افرادی که سال ها از قدرتمندترین موتور جستجوی اینترنتی استفاده می کنند، احتمالاً بدون شک تصمیم خواهند گرفت که این موتور جستجوی خاص را روی رایانه خود نصب کنند. مثل این است که فکر کنید: گوگل در رایانه خانگی شما! با این حال، بدون تسلیم شدن به تحریکات با یک نام تجاری گسترده، بیایید سعی کنیم هوشیارانه و مهمتر از همه عینی، امکانات موتور جستجوی "رومیزی" گوگل را در نظر بگیریم.

اولین چیزی که توجه شما را جلب می کند عدم وجود پوسته مخصوص برنامه است. جستجوی دسکتاپ گوگل هنوز در پنجره مرورگر است، به ترتیب، کل رابط نسخه دسکتاپ به نرم افزار برادر بزرگتر اینترنت رفت. خوب یا بد بودن این موضوع قابل بحث است: شخصی مینیمالیسم در طراحی این موتور جستجو را دوست دارد و کسی می خواهد یک برنامه کامل پر از انواع دکمه ها و غیره را ببیند.

چه چیزی بلافاصله بعد از طراحی نظر شما را جلب می کند؟ و این واقعیت که همین جستجوی دسکتاپ گوگل شروع به فهرست کردن همه چیز در رایانه می کند، بدون هیچ تقاضایی برای آن! و آنچه جالبتر است، انتخاب مسیرهای نمایه سازی با استفاده از جستجوی دسکتاپ گوگل غیرممکن است. شما باید یک برنامه جداگانه (TweakGDS) دانلود کنید که به شما امکان می دهد کمی گسترش دهید تنظیمات گوگلدسکتاپ، از جمله تعیین مکان های لازم برای نمایه سازی. اگرچه، در حالی که همه چیز را متوجه می‌شوید، از قبل هارد دیسک استاندارد را ایندکس می‌کند، بنابراین این تنظیم هنگام کار با مقادیر زیاد داده بیشتر مورد نیاز است، که هنگام استفاده در شبکه‌های شرکتی (نسخه Enterprise) بسیار مهم است. با این حال، این یک واقعیت نیست که پس از دانلود TweakGDS، مشکلات شما حل شود. بالاخره به مایکروسافت نیاز دارد. چارچوب خالصو Microsoft Scripting Runtime. بله... نصب و همچنین دسترسی به تنظیمات می‌توانست آسان‌تر شود، اگرچه، احتمالاً، توسعه‌دهندگان می‌توانند درک کنند: چرا وقتی یک موتور جستجوی آماده وجود دارد، چیزی جدید بنویسید و آن را به آن منتقل کنید. کامپیوتر محلیو اجازه دهید کاربر «لذت برد» و نام معروف شاهکاری دیگر از «این» بسازد. بیایید، بیایید این انحراف غزلی را تمام کنیم و به جستجو برویم.

در مورد تجزیه و تحلیل پرس و جوهای جستجو و صدور نتایج، همه چیز در اینجا کاملاً مشابه Google در اینترنت است: همان سیستم برای نمایش نتایج، همان مجموعه استاندارد عملیات منطقی برای جستجوهای جستجو. به طور کلی، جستجوی دسکتاپ گوگل، مانند برنامه قبلی، منحصراً برای جستجوی فایل ها طراحی شده است - البته برای این فایل ها نمایشگر داخلی وجود ندارد. تعداد فرمت‌های فایل پشتیبانی شده توسط Google Desktop Search کاملاً کافی است، و همچنین خوب است که صفحات اینترنتی بازدید شده را جستجو می‌کند و داده‌ها را از حافظه پنهان می‌گیرد. سرعت جستجو و نمایه سازی کاملا قابل قبول است. درست است، برای استفاده خانگی. با 20 گیگابایت متن قابل توجه، جستجوی دسکتاپ گوگل در 8 ساعت و 17 دقیقه مدیریت شد. چند روز را صرف پردازش اطلاعات از شبکه شرکتی یک شرکت بزرگ کنید که به هیچ مدیر سیستمی لبخند نمی‌زند. از جنبه مثبت: اندازه شاخص ایجاد شده در سطح (4.5 گیگابایت) با موتور جستجوی دیگری که در این بررسی آزمایش شده است - SearchInform است.

یک مزیت بزرگ (یا حذف - شما تصمیم می‌گیرید) جستجوی دسکتاپ Google این است که از افزونه‌هایی پشتیبانی می‌کند که می‌توانند تغییرات زیادی برای بهتر شدن داشته باشند. نکته دیگر این است که اتصال پلاگین ها و پیکربندی آنها کار نصب یک موتور جستجو را چنان پیچیده می کند که شما شروع به تعجب می کنید که آیا همه اینها زمانی که بتوانید یک برنامه معمولی و کامل را نصب کنید که همه چیز در آن وجود دارد لازم است یا خیر. پس از همه، برای استفاده از هر ویژگی، باید یک افزونه جدید نصب کنید. حتی برای اینکه برنامه به طور کامل با آرشیو کار کند، یک لوسیون جداگانه لازم است. مجذوب و مجذوب تمام این ماژول های اضافی است. با این حال، اگر نسخه دسکتاپ موتور جستجو را در نظر نگیرید، ممکن است راه اندازی GDS Enterprise به درستی در اختیار شما نباشد - بیهوده نیست که متخصصان Google خدمات خود را برای راه اندازی خدمات خود ارائه می دهند. نرم افزاربرای شبکه شما فقط با 10000 دلار.

با این وجود، اگر به روش نصب و راه اندازی تسلط داشته باشید (یا 10000 دلار به تیم پاسخ سریع Google بپردازید)، متوجه خواهید شد که پیچیدگی نصب بیش از حد با تنظیمات بسیار انعطاف پذیر در هنگام استفاده در شبکه های شرکتی جبران می شود. یکی از جنبه های مهم کار Google Desktop در یک شبکه شرکتی، استفاده از آن است سیاست های گروه، که امکان تنظیم تنظیمات ترجیحی برای هر کاربر را فراهم می کند.

به طور خلاصه باید گفت که معقول ترین کاربرد این برنامه کامپیوتر خانگی یا محل کار است. در واقع، برای یک رایانه معمولی، فقط کافی است برنامه را نصب کنید - بقیه کارها را خودش انجام می دهد (حتی در مورد چیزی از شما سؤال نمی کند).

با این حال، Google Desktop Search Enterprise در مواردی که نیاز فوری به تنظیمات خط مشی شبکه انعطاف پذیر برای استفاده از موتور جستجو وجود دارد، قابل قبول خواهد بود، در حالی که توانایی پردازش پرس و جوهای جستجو از نظر اهمیت و زمان (یا پول) در رتبه دوم قرار دارد. صرف راه اندازی برنامه در درجه اول قرار می گیرد.

سایت رسمی:
اندازه توزیع با TweakGDS: 1.2 MbCopernic Desktop Search

برای بزرگنمایی روی عکس کلیک کنید

رابط برنامه احساسات بسیار مثبت را برمی انگیزد - همه چیز مطابق با استانداردهای پذیرفته شده عمومی انجام می شود، هیچ چیز اضافی نیست، در یک کلام، یک طراحی دلپذیر. درک رابط کاربری Copernic Desktop Search برای یک مبتدی بسیار آسان خواهد بود. اگرچه، تا حدودی شرم آور است که طراحان به صراحت رابط برنامه را ایجاد کردند، با در نظر گرفتن این واقعیت که این برنامه در قالب استاندارد ویندوز XP کار می کند. هنگام استفاده از همان تم کلاسیک، برنامه چندان زیبا به نظر نمی رسد. اما این بیشتر سلیقه ای است.

در اولین شروع، برنامه ایجاد نمایه هایی برای جستجو را ارائه می دهد. تا حدودی غیرعادی به نظر می رسید که پس از انتخاب پوشه ها برای نمایه سازی، برنامه پیشنهاد نمی کند هیچ دکمه ای را فشار دهید، مانند "شروع نمایه سازی"، در حالی که نمایه سازی به طور خودکار شروع نمی شود، تنها پس از آن متوجه شد که کوپرنیک سعی می کند زمانی که کامپیوتر بیکار است، فهرست بندی را شروع کند. . شما باید کمی در گزینه های برنامه حفاری کنید تا همه چیز به درستی تنظیم شود. لازم به ذکر است که گزینه های نسبتاً گسترده ای برای سفارشی سازی وجود دارد. ایجاد خودکار index: زمانبندی داخلی، امکان ایندکس کردن در حالی که رایانه بیکار است، در پس زمینه، با اولویت کم. نمایه سازی خیلی سریع نبود - 10 ساعت و 51 دقیقه - این سرعت کندتر از سایر موتورهای جستجو است (به جز Bloodhound، اما Copernic یک مرتبه سریعتر از توسعه فناوری iSleuthHound است.

حال در مورد ساختار شاخص. به طور کلی، چیز خاصی در مورد آن وجود ندارد. امکان انتخاب انواع فایل هم به صورت کلی و هم به صورت تفصیلی وجود دارد. یعنی در ابتدا می توانید آنچه را که می خواهید فهرست کنید - اسناد، تصاویر، فیلم ها، موسیقی را انتخاب کنید. در برگه دیگر پنجره گزینه ها، امکان انتخاب انواع فایل های خاص بر اساس پسوند وجود خواهد داشت. علاوه بر این، می‌توانید ایندکس را به گونه‌ای پیکربندی کنید که برای مثال، تصاویر با اندازه کمتر از ۱۶×۱۶ ایندکس نشوند یا فایل‌های صوتی کمتر از ۱۰ ثانیه ایندکس نشوند. علاوه بر ایندکس کردن فایل‌ها از پوشه‌ها، کوپرنیک می‌تواند با ایمیل‌ها و مخاطبین از دفترچه آدرس Microsoft Outlook و Microsoft Outlook Express کار کند، امکان فهرست‌بندی Favorites و History از Internet Explorer وجود دارد.

در مورد قابلیت های جستجو، آنها در اینجا بسیار ضعیف هستند. در طول آزمایشات، حتی مشخص شد که این برنامه اسناد را با فرمت‌های txt و html به زبان روسی جستجو نمی‌کند و به شما امکان می‌دهد آنها را فقط با عنوان و به هیچ وجه با محتوا پیدا کنید. تنها چیزی که این برنامه برای بهبود کارایی جستجو ارائه می دهد استفاده از آن است مجموعه استانداردعملیات منطقی، و حتی پس از آن، این امکان به صورت تجربی کشف شد، زیرا مستند نبود. به هر حال، کمک برنامه نیز درست نیست - فقط از طریق اینترنت در دسترس است، که، می بینید، بسیار ناخوشایند است و اطلاعات کمک زیادی در شبکه وجود ندارد. ظاهراً توسعه دهندگان تصمیم گرفتند که رابط کاربری ساده این برنامه به معنای وجود کمک معمولی نیست. در ادامه گفتگو در مورد قابلیت های جستجو، لازم به ذکر است که علیرغم تحلیل ضعیف پرس و جوها، این برنامه یک سیستم جستجوی جالب ارائه می دهد - کاربر می تواند نوع فایل ها (تصاویر، فیلم ها، موسیقی و غیره) را انتخاب کند، پرس و جو را جستجو کنید و ویژگی هایی را انتخاب کنید که مخصوص نوع فایل انتخابی هستند. به عنوان مثال، برای فایل های صوتی، اینها می توانند مقادیری از برچسب های mp3 (هنرمند، آلبوم، تاریخ و غیره) باشند، برای تصاویر، به عنوان مثال، می توانید اندازه آنها را (بر اساس وضوح) انتخاب کنید، به طور کلی، هر نوع تنظیمات خاص خود را دارد. پس از جستجوی نوع خاصی از فایل ها، برنامه یک لیست بسیار آموزنده را در پنجره نتایج نمایش می دهد و اگر درخواست شما شامل فایل هایی از انواع دیگر باشد، می توانید با کلیک بر روی یک لینک خاص، آنها را باز کنید.

به طور جداگانه، لازم به ذکر است که پنجره نمایش نتایج. محتویات این فایل ها در زیر لیست فایل های یافت شده نمایش داده می شود (از طرحی مشابه اغلب در آن استفاده می شود مشتریان پست الکترونیکی). درست است، متن را فقط می توان در قالب اصلی خود مشاهده کرد، و هیچ حالت نمایش متن ساده ای وجود ندارد، که همیشه راحت نیست، زیرا باز کردن یک سند در این مورد زمان بیشتری می برد. اما با توجه به اینکه کوپرنیک می تواند تصاویر و موسیقی را جستجو کند، امکان مشاهده این فایل های چند رسانه ای وجود دارد.

اصول اولیه این برنامه توضیح داده شده است، حالا ببینیم Copernic Desktop Search می تواند برای کار با شبکه به ما ارائه دهد ... در اصل، شما می توانید برای مدت طولانی تماشا کنید، اما بعید است چیزی ببینید. به عبارت دیگر این برنامه به صورت شبکه ای در نظر گرفته نشده است. Copernic Desktop Search منحصراً یک موتور جستجوی خانگی است.

بدیهی است که تنها (منطقی ترین) استفاده از این برنامه است کامپیوتر خانگی. در اینجا به طور کامل با تمام پرس و جوهای جستجوی ساده کاربران متشکل از یک یا دو کلمه کنار می آید، اطلاعات لازم را پیدا می کند و جستجوها را بر اساس انواع فایل ها و پشتیبانی از فایل های چند رسانه ای به همراه نمایه سازی پس زمینه در حالت اولویت پایین پیدا می کند. ، همراه با رابط کاربری دلپذیر، فقط به برنامه قدرت می دهد تا در بین کاربران بی تجربه اعتماد کسب کند.

سایت رسمی
اندازه توزیع: 2.6 MbISYS Desktop

برای بزرگنمایی روی عکس کلیک کنید

یک برنامه بسیار قدرتمند از نظر سطح تجهیزات با انواع عملکردها، نزدیک به موتور جستجوی SearchInform بعدی در لیست است. در عین حال حجم فایل نصبی بیش از 40 مگابایت است! سخت است بگوییم چه چیزی می تواند در چنین اندازه هایی قرار گیرد، زیرا همان SearchInform، با عملکرد مشابه، 15 مگابایت طول می کشد.

فرآیند نصب در اینجا نیز چندان خوشایند نیست، یا بهتر است بگوییم حتی فرآیند نصب نیست. حتی قبل از دانلود برنامه، از شما خواسته می شود که ثبت نام کنید، در غیر این صورت - هیچ چیز. بعد، رابط. بسیار زیبا ساخته شده است ، هیچ چیز اضافی چشم را جلب نمی کند ، با این حال ، این برداشت های شخصی است که قبلاً تا حدودی به او عادت کرده است. برای یک مبتدی آسان نخواهد بود که بفهمد کجا و چیست، کجا کلیک کند و در نهایت کجا جستجو کند. به شدت توصیه می شود قبل از شروع کار راهنما را بخوانید - در اعصاب و زمان زیادی صرفه جویی کنید. علاوه بر هر چیز دیگری، این نیز هست غیبت کاملپشتیبانی از زبان روسی در برنامه. خوب نیست. علاوه بر این، پنجره‌های اینجا با کنترل‌ها پر نشده‌اند، اما این به قیمت چند ماژول و استفاده از پنجره‌های اضافی تمام شد. به عنوان مثال، درخواست های جستجو با اجرای یک برنامه وارد می شوند و فهرست ها با استفاده از برنامه دیگری مدیریت می شوند. عبارات جستجو نیز در اینجا در کادرهای ظاهری جداگانه وارد می شوند. سخت است که بگوییم کدام بهتر است - اینترفیس بیش از حد بارگذاری شده یا چند پنجره ای همه جا حاضر، بلکه یک موضوع سلیقه ای است.

در مورد ایجاد نمایه ها، این برنامه گزینه هایی را برای ساده سازی فرآیند تنظیم گزینه ها برای یک نمایه جدید ارائه می دهد. این ویژگی ها شامل چندین مورد است قالب های آمادهبرای ایجاد نمایه در My Documents، Mail، Mail and Documents، Specific Folder، Folder with Select File Types و غیره. این الگوها ایجاد نمایه در مرحله اول را آسان می کنند. ابزار کار با ایندکس ها رابط نه چندان خوبی دارد که پیچیدگی ها را از بین می برد (این یک ارزیابی بسیار ذهنی است، صادقانه بگویم)، اما اگر به آن نگاه کنید، گزینه های مفید زیادی را ارائه می دهد و به طور کلی استفاده از آن باعث نمی شود سختی بسیار ISYS Desktop می‌تواند داده‌ها را از منابع داده‌های مختلف فهرست‌بندی کند و همچنین تنظیمات انعطاف‌پذیر بسیاری را برای این فهرست‌سازی فراهم می‌کند. در میان ویژگی های اضافیبرای نمایه سازی: پشتیبانی از SQL، FTP، TRIM Context، WORLDOX 2002، اسکریپت ها. هنگام ایجاد نمایه، اگر گزینه «پوشه با انتخاب انواع فایل» را انتخاب کرده باشید، این امکان را دارید که انواع فایل هایی را که قرار است ایندکس شوند به صورت دستی (بر اساس پسوند) انتخاب کنید. باید گفت که تعداد زیادی از انواع فایل های پشتیبانی شده وجود دارد، اما اضافه کردن نوع (پسوند) خود به لیست موجود امکان پذیر نخواهد بود. همچنین می توانید به وجود یک زمانبندی نمایه سازی توجه کنید. ISYS Desktop 6 ساعت و 13 دقیقه طول کشید تا یک فهرست ایجاد کند و 20 گیگابایت اطلاعات را پردازش کند، در نهایت زمان خوبی را نشان داد و حجم فایل ایجاد شده - 7.9 گیگابایت.

قابلیت جستجوی این برنامه بد نیست. آنچه در ISYS استفاده می شود بسیار قدرتمندتر از پشتیبانی معمول برای عملیات منطقی است. از ویژگی های جستجوی پیشرفته، این برنامه استفاده از مترادف ها، فیلتر مرتب سازی (بر اساس مسیر، نام و تاریخ ایجاد فایل) را ارائه می دهد. مجموعه عملگرهای منطقی تا حدودی گسترده تر از مجموعه استاندارد است. علاوه بر عملیات منطقی، این برنامه به شما امکان می دهد با بسیاری از اپراتورهای دیگر کار کنید، که در اصل، می توانند جایگزین برخی از انواع جستجو شوند، به عنوان مثال، جستجو با تجزیه را می توان با استفاده از عملگرهای ویژه به طور کامل جایگزین کرد. من بسیار تعجب کردم که این برنامه جستجوی با استفاده از مورفولوژی ندارد. این یک حذف جدی است، زیرا کارایی جستجو هنگام استفاده از تجزیه و تحلیل مورفولوژیکی بسیار بهبود می یابد. علاوه بر این، لیستی از کلمات مهم وجود ندارد، اما فهرست گسترده ای از کلمات غیر معنی دار وجود دارد. همچنین توابعی در جستجو به عنوان "جستجوی تقریبی" و "تحلیل اکتشافی" اعلام شد.

ISYS انتخابی از انواع مختلفی از پرس و جوهای جستجو، یعنی موارد بصری را فراهم می کند. این کار با استفاده از انواع مختلف پنجره ها برای وارد کردن عبارت های جستجو انجام می شود، با این حال، در واقع، هیچ پنجره ای به شما اجازه نمی دهد از فناوری هایی غیر از موارد ذکر شده در بالا استفاده کنید.

نتایج جستجو بسیار آموزنده هستند و به عنوان لیستی از اسناد مرتب شده بر اساس ارتباط نمایش داده می شوند. در زیر پیش نمایشی از سند انتخاب شده است. برخلاف جستجوی دسکتاپ کوپرنیک، پیش‌نمایش در اینجا فقط به صورت متن ساده در دسترس است، امکان نمایش اسناد در قالب اصلی، ورد، Html یا PDF وجود ندارد، اگرچه در اصل این خیلی مهم نیست. این برنامه به شما امکان می دهد اسناد پیدا شده را با توجه به معیارهای خاصی به گروه ها تقسیم کنید (به طور پیش فرض ، آنها بر اساس ارتباط تقسیم می شوند). همچنین می‌توانید اسنادی را که قبلاً پیدا شده‌اند، با انتخاب پوشه‌های جداگانه مشاهده کنید (این کار زمانی مفید است که نتیجه تعداد بسیار زیادی سند ایجاد کند).

استفاده از این برنامه در یک شبکه شرکتی نیز کاملاً موجه است، زیرا فرصت های خوبی برای سازماندهی جستجوهای شبکه فراهم می کند. سیستم جستجو بر اساس ایجاد یک نمایه عمومی است که حاوی داده های نمایه شده از منابع شبکه عمومی است.

در واقع برنامه ISYS لااقل آشنایی با آن شایسته توجه است. این برنامه یک پروژه بالغ با مقدار زیادیتوابع (البته نه همیشه و نه برای همه، آنها مورد نیاز هستند، اما هنوز هم). شانس اینکه برنامه از نظر پردازش پرس و جوهای جستجو پیشرفت هایی داشته باشد مشخص نیست، اما این لحظهمی توان آن را برای استفاده تقریباً جهانی توصیه کرد. و با توجه به اینکه هنوز برای سیستم های خانگی بسیار سنگین است، مکان های اصلی نصب آن شبکه های شرکتی است.

سایت رسمی:
اندازه توزیع: 40 MbSearchInform

برای بزرگنمایی روی عکس کلیک کنید

احتمالاً ارزش ندارد که فوراً با توضیح رابط SearchInform شروع کنید. ابتدا باید فرآیند نصب یا بهتر است بگوییم یکی از جزئیات آن را شرح دهیم: بدون اتصال به اینترنت نمی توانید برنامه را نصب کنید. واقعیت این است که قبل از اولین راه اندازی، برنامه نیاز به ثبت نام کاربر (رایگان) دارد و تمام داده های وارد شده را به سرور ارسال می کند. ظاهراً توسعه دهندگان مجبور بودند چنین اقداماتی را در مبارزه با دزدی دریایی انجام دهند ، اما این تأثیر مثبتی بر سهولت نصب نداشت.

رابط برنامه مطابق با تمام قوانین پذیرفته شده ساخته شده است، با این حال، در نگاه اول، تا حدودی دست و پا گیر است. با استفاده از برنامه برای اولین بار، به نظر می رسد که بیش از حد پیچیده است، گاهی اوقات به راحتی نمی توان به خاطر آورد که گزینه مورد نظر در کدام منو یا تب قرار دارد، با این حال، با استفاده طولانی تر، رابط کاربری دیگر چندان پیچیده به نظر نمی رسد. نکته اصلی این است که ابتدا راهنما را بخوانید.

پس از کمی پرداختن به رابط، می توانید شروع به ایجاد یک فهرست کنید. این فرآیند به خودی خود بسیار ساده است و سرعت نمایه سازی، حتی با چشم، بسیار بالاتر از سایر موتورهای جستجوی بررسی است. پاک کردن اعداد تست نشان می دهد که SearchInform از نظر سرعت ایندکس دو برابر سریعتر از dtSearch و iSYS است! این برنامه داده های ارائه شده را در حجم 20 گیگابایت در زمان رکورد - 3 ساعت و 17 دقیقه ایندکس کرد. و اندازه شاخص ایجاد شده کوچکترین 4.4 گیگابایت - 100 مگابایت کمتر از جستجوی دسکتاپ Google است.

این برنامه علاوه بر فایل‌ها و پوشه‌های معمولی، فهرست‌بندی ایمیل‌ها، اتصال و نمایه‌سازی پایگاه‌های داده (!) و سایر منابع خارجی (DMS، CRM) را پشتیبانی می‌کند، بلافاصله هنگام نمایه‌سازی، می‌توانید یک فرهنگ لغت را برای جستجوی مورفولوژیکی مشخص کنید، و همه ویژگی‌ها می‌توانند فایل های ایندکس شوند. پس از ایجاد یک نمایه، هنگام تلاش برای انجام اولین جستجوی آزمایشی برای اسناد، می توانید به سردرگمی برسید: "دو نوع جستجو وجود دارد، اما به کدام یک نیاز دارم؟". همانطور که قبلا ذکر شد، نکته اصلی خواندن راهنما است، سپس همه چیز روشن می شود. این برنامه واقعاً قادر به انجام دو نوع جستجو است - جستجوی عبارت و جستجوی اسنادی که از نظر محتوایی مشابه متن درخواست هستند.

شرح تمام توابع اصلی برای تجزیه و تحلیل یک عبارت جستجو در بالا ارائه شد، بنابراین اکنون ما فقط قابلیت های جستجوی ارائه شده توسط این برنامه را لیست می کنیم. بیایید با جستجوی عبارت شروع کنیم: البته، جستجوی مورفولوژیکی، جستجوی نقل قول، عملیات منطقی، جستجوی تجزیه کلمه (جستجو بر اساس ابتدای کلمه، تا پایان، قسمت میانی یا مطابقت کامل)، جستجوی نقل قول مختلط (زمانی که تمام کلمات از پرس و جو باید در سند وجود داشته باشد، اما نه لزوما به ترتیب وارد شده، جستجوهای تصحیح خطا، استفاده از مترادف ها، "جستجوی تقریبا نقل قول" (جستجوی عبارت وارد شده به عنوان نقل قول، اما ممکن است موارد دیگر وجود داشته باشد. کلمات بین کلمات وارد شده) و غیره برخی از گزینه های ذکر شده تنظیمات خاص خود را دارند. علاوه بر این، امکان استفاده از فرهنگ لغات بی اهمیت نیز وجود دارد و برنامه از قبل فهرست آماده ای از این کلمات را دارد، همچنین می توانید از فرهنگ لغات اولویت دار برای جستجو استفاده کنید (البته باید آن را پر کنید. خودت).

در اینجا، در اصل، ما به طور خلاصه تمام ویژگی های اصلی جستجوی عبارت را بررسی کردیم.

بیایید به بررسی ویژگی های این برنامه برویم - جستجوی اسناد مشابه. توسعه دهندگان ادعا می کنند که این به هیچ وجه یک جستجوی متنی ساده نیست، این دقیقاً یک "جستجوی مشابه" است - همه جا آن را اینگونه توصیف می کنند، اما بسیار خوب، می توانید آن را هر طور که دوست دارید نام ببرید - نکته اصلی این است. یک جستجوی کوتاه در اینترنت می تواند به سرعت نشان دهد که به اصطلاح "جستجوی مشابه" یک پیشرفت جدید در زمینه تجزیه و تحلیل متن است. این سیستم به شما امکان می دهد متن هایی را پیدا کنید که از نظر محتوای معنایی مشابه هستند. خوشایندترین چیز این بود که پس از انجام پرس و جوهای جستجوی آزمایشی، معلوم شد که این نظریه کاملاً با عمل سازگار است! این برنامه واقعاً اسناد مشابه از نظر محتوا را جستجو می کند و آنها را در یک لیست، مرتب شده بر اساس درصد شباهت، نمایش می دهد.

در مرحله بعد، بیایید به آنچه SearchInform ارائه می دهد (به ویژه نسخه شرکتی آن SearchInform Corporate) برای کار در یک شبکه شرکتی نگاه کنیم. دو نوع برنامه وجود دارد: سمت سرور و سمت کاربر. بخش سرور به طور مستقل ایندکس های مشخص شده را پردازش می کند و کاربران بسته به حقوق دسترسی اختصاص داده شده به آنها می توانند از آنها برای جستجو استفاده کنند. کاربران را می توان به طور خودکار با استفاده از لاگین پیکربندی کرد. ورودی های ویندوز(گفتن زبان حرفه ای، SearchInform از احراز هویت NTFS ویندوز استفاده می کند) یا به صورت دستی (کاربران باید جداگانه اضافه شوند). هر کاربر می تواند اجازه داشته باشد یا از دسترسی به نمایه های خاصی محروم شود، همچنین می توانید کاربران را در گروه ها ترکیب کنید. به طور کلی تنظیمات شبکه SearchInform از نظر انعطاف پذیری از گوگل و از نظر راحتی و سادگی از Snoop Server جلوتر است.

سایت رسمی:
اندازه توزیع: 14.7 مگابایت مقایسه سرعت نمایه سازی

سیستم جستجوزمان نمایه سازیاندازه شاخص
Bloodhound Pro Deluxe 4.538 ساعت 46 دقیقه19 گیگابایت
Isys Desktop 7.06 ساعت 13 دقیقه7.9 گیگابایت
DtSearch 7.06 ساعت 3 دقیقه8.6 گیگابایت
Google Desktop Search Enterprise8 ساعت 17 دقیقه4.5 گیگابایت
جستجوی دسکتاپ کوپرنیک*10 ساعت 51 دقیقه7 گیگابایت
SearchInform 1.5.023 ساعت 17 دقیقه4.4 گیگابایت

* بیشتر اسناد html و txt حاوی متن روسی، اگرچه نمایه شده بودند، جز با نام آنها یافت نشد.

همه برنامه ها قابل توجه هستند.

بر اساس آزمایشات و بررسی دقیق هر برنامه ارائه شده در بررسی، می توان نتیجه گیری های خاصی را انجام داد. بنابراین، Google Desktop Search Copernic Desktop Search برای یک کاربر بی تجربه به عنوان سیستم جستجوی اطلاعات خانه کاملاً مناسب است. آنها با درخواست های ساده کار خوبی انجام می دهند، کاربر را با تنظیمات بارگذاری نمی کنند و علاوه بر این، کاملا رایگان هستند. تلاش گوگل برای ورود به بازار موتورهای جستجوی شرکتی هنوز به شدت توجیه نشده است: برای کار کامل، برنامه باید با ماژول های اضافی آویزان شود و راه اندازی آن بسیار آسان نیست. بنابراین، با گفتن نام Desktop Search، آن Copernic، که Google در پشت سر خود یک طاقچه از موتورهای جستجوی "رومیزی" را به جا می گذارند.

راه‌حل‌های واقعی و قدرتمندتر - dtSearch، iSYS و SearchInform نیز غیرمعمول نیستند و نسخه‌های «دسک‌تاپ» خود را به کاربران ارائه می‌دهند. اما با قیمت مناسب، بر خلاف نرم افزار رایگان گوگل و کوپرنیک. البته برای قدرت، سرعت و عملکرد باید هزینه پرداخت کنید. اما توسعه دهندگان dtSearch، iSYS و SearchInform تمرکز اصلی خود را، البته، بر روی بخش شرکتی قرار می دهند. شبکه، عملکرد، نمایه سازی و سرعت جستجو - این چیزی است که این محصولات را از "رقبا" خود متمایز می کند. با توجه به نتایج آزمایش، مورد علاقه مشخص شد - SearchInform. این برنامه امکان جستجوی اسناد مشابه را فراهم می کند، بالاترین سرعت نمایه سازی و جستجو را دارد و مجموعه ای از ویژگی های خوبی دارد.

یافتن اطلاعات مناسب و به روز در اینترنت گاهی بسیار دشوار است. حجم زباله های اطلاعاتی در وب مانند یک گلوله برفی در حال افزایش است و گاهی اوقات دسترسی به داده هایی که واقعاً با استفاده از Yandex و Google به آن نیاز دارید به سادگی غیرممکن است. کتابی که در دست دارید، کارایی جستجوی اطلاعات شما در اینترنت را چندین برابر می کند. این تکنیک ها، سایت های جستجو و برنامه هایی را برای بازیابی اطلاعات تخصصی توصیف می کند. انواع مدرن جستجوی اینترنتی در نظر گرفته می شود: جستجوی جهانی، جستجوی عمودی، سیستم های متاجستجو، ساخت موتورهای جستجوی شخصی، جستجوی محتوای سمعی و بصری، جستجو در اینترنت پنهان. برای تمام سیستم های در نظر گرفته شده، ویژگی ها و نکات آنها برای کارآمدترین استفاده ارائه شده است.

مقدمه

جستجوی اینترنتی یک عنصر مهم در کار بر روی وب است. تعداد دقیق منابع وب اینترنت مدرن به سختی برای کسی مشخص است. در هر صورت این صورت حساب میلیاردی می شود. برای اینکه بتوانید از اطلاعات مورد نیاز در این لحظه خاص، چه برای اهداف تجاری یا سرگرمی، استفاده کنید، ابتدا باید آن را در این اقیانوس دائماً پر از منابع پیدا کنید. این به هیچ وجه کار آسانی نیست، زیرا اطلاعات موجود در وب مدرن ساختاری ندارند، که در یافتن آن مشکل ایجاد می کند. تصادفی نیست که موتورهای جستجوی اینترنتی به نوعی "پنجره" در این فضای اطلاعاتی تبدیل شده اند.

بعید است که در بین کاربران اینترنت افرادی وجود داشته باشند که هرگز از موتورهای جستجوی جهانی بزرگ استفاده نکرده باشند. نام گوگل، یاندکس و چند ماشین بزرگ دیگر بر لبان همه است. آنها عالی عمل می کنند وظایف روزانهجستجوی اینترنتی، و اغلب کاربران حتی سعی نمی کنند به دنبال جایگزینی بگردند. در عین حال، تعداد موتورهای جستجوی اینترنتی در زمان ما به هزاران می رسد. دلایل چنین تنوعی از ماشین های جایگزین ریشه های مختلفی دارد. برخی از پروژه ها با کار دقیق با منابع اینترنتی ملی سعی در رقابت مستقیم با رهبران بازار جهانی دارند. برخی دیگر ویژگی های پرس و جو را ارائه می دهند که در موتورهای جستجوی شناخته شده یافت نمی شوند. تعداد قابل توجهی از ماشین های جایگزین در جستجوی یک موضوع خاص یا نوع خاصی از محتوا تخصص دارند و به نتایج چشمگیر در حل این مشکلات دست می یابند. به هر حال، گنجاندن چنین موتورهای جستجو در زرادخانه ابزارهای جستجوی اینترنتی خود کاربر می تواند کیفیت آن را به میزان قابل توجهی بهبود بخشد. با این حال، در اینجا یک تفاوت وجود دارد: شما باید در مورد چنین ماشین هایی بدانید و بتوانید از قابلیت های آنها استفاده کنید.

ما فرض می کنیم که خوانندگان این کتاب قبلاً با تکنیک جستجو با استفاده از موتورهای جستجوی جهانی کاملاً آشنا هستند. آنقدر خوب که محدودیت های مربوط به استفاده از آنها را احساس کردند. به احتمال زیاد، چنین افرادی قبلاً سعی کرده اند ابزارهای اضافی خاصی را جستجو کرده و اعمال کنند. کلمه چاپ شده موضوع جستجوی اینترنتی را دور نمی زند: هر دو مقاله به صورت دوره ای ظاهر می شوند و کتاب ها منتشر می شوند. اما قهرمانانی که آنها دارند، به عنوان یک قاعده، یکسان هستند - چندین موتور جستجوی جهانی پیشرو. کتاب ما از این جهت متفاوت است که سعی می کند طیف کاملی از راه حل های جستجوی مدرن را پوشش دهد. در اینجا توضیحات و توصیه هایی برای استفاده از بهترین خدمات مدرن متمرکز بر حل رایج ترین کارهای جستجو را خواهید یافت. این کتاب برای افرادی است که زیاد روی اینترنت کار می‌کنند و از وب برای یافتن اطلاعات مورد نیازشان استفاده می‌کنند - چه کسب‌وکار، چه مطالعه یا یک سرگرمی.

برای موفقیت آمیز بودن جستجوی اینترنتی، دو شرط باید رعایت شود: پرس و جوها باید به خوبی فرمول بندی شوند و در مکان های مناسب پرسیده شوند. به عبارت دیگر، کاربر باید از یک سو بتواند علایق جستجوی خود را به زبان جستجوی جستجو ترجمه کند و از سوی دیگر، دانش کافی از موتورهای جستجو، ابزارهای جستجوی موجود، مزایا و مزیت های آن ها را داشته باشد. معایب، که امکان انتخاب مناسب ترین ابزار جستجو را در هر مورد خاص فراهم می کند.

در حال حاضر، هیچ منبع واحدی وجود ندارد که تمام الزامات جستجوی اینترنتی را برآورده کند. بنابراین، با رویکرد جدی به جستجو، ناگزیر باید از ابزارهای مختلفی استفاده کنید که از هر کدام در مناسب ترین حالت استفاده کنید.

فصل 1

موتورهای جستجوی اینترنتی جهانی

موتورهای جستجوی اینترنتی جهانی اصلی ترین و شناخته شده ترین ابزار جستجوی اینترنتی هستند. چنین موتورهای جستجو حداکثر پوشش منابع مختلف را فراهم می کنند. این نوع جهانی است که شامل بزرگترین و محبوب ترین موتورهای جستجو می شود. اینها راه حل های واقعا قدرتمندی با ویژگی ها و ابزارهای زیادی هستند که بسیاری از کاربران اغلب درباره آن ها نمی دانند. درک ویژگی ها و قابلیت های جستجوی جهانی به شما امکان می دهد تا نقاط قوت و طرف های ضعیفچنین سیستم هایی و آگاهانه موثرترین ابزارهای جستجو را انتخاب می کنند.

بازار موتورهای جستجوی جهانی بسیار بزرگ است. در این فصل، ما تنها قدرتمندترین ماشین‌هایی را که می‌توانند به اندازه کافی با پرس‌و‌جوها به زبان روسی کار کنند، بررسی می‌کنیم. این فصل با داستان هایی در مورد رهبران جستجوی روسی - سیستم های Google.ru و Yandex باز می شود. کتاب ها و مقالات زیادی در مورد هر یک از این موتورهای جستجو نوشته شده است. ما بر روی ویژگی های اصلی که برای کاربر نهایی مهم است تمرکز خواهیم کرد و همچنین سعی خواهیم کرد نقاط قوت آنها را شناسایی کنیم.

آنها با توسعه جستجوی جدید توسط شرکت مایکروسافت همراه هستند - سیستم Bing که تاکنون به طور قابل توجهی از توجه محروم شده است، و همچنین یک موتور جستجوی مفید و کاملا قدرتمند Exalead، که مزیت آن است. پشتیبانی خوبجستجو در منابع اینترنتی اروپا این سیستم- هنوز یک مهمان نادر در زرادخانه جستجوی کاربران ما است، بنابراین با جزئیات بیشتری نسبت به سایرین در نظر گرفته می شود.

در این فصل هنگام بررسی سیستم های گوگلو Yandex، ما فقط بر روی قابلیت های جستجوی وب تمرکز خواهیم کرد و جستجو در پایگاه های داده تخصصی این پروژه ها در فصل های بعدی در مورد جستجوی تصویر و ویدیو مورد بحث قرار گرفته است. برای سایر موتورهای جستجوی جهانی، اطلاعات مربوط به جستجوی چند رسانه ای بلافاصله پس از آشنایی با آنها ارائه می شود.

از آنجایی که سه قهرمان از چهار قهرمان این فصل منشأ خارجی دارند، بلافاصله متذکر می شویم که ما فقط در حال تجزیه و تحلیل احتمالات نسخه روسی آنها هستیم. واقعیت این است که برخی از عملکردهای سیستم های خارجی، به ویژه سیستم های آزمایشی، اغلب فقط در نسخه های اصلی، به عنوان یک قاعده، خدمات انگلیسی زبان در دسترس هستند.

گوگل

موتور جستجوی گوگل به شایستگی به عنوان رهبر جهانی در جستجوی اینترنتی مدرن شناخته می شود. در سال 1998 تاسیس شد گوگلتا به امروز یکی از پیشروان در زمینه جستجوی اینترنتی و خدمات وب باقی مانده است.

توسعه دهندگان گوگل همیشه با توجه بیشتر به بهبود الگوریتم های موتور جستجوی خود و همچنین محافظه کاری منطقی در این زمینه متمایز بوده اند. رابط کاربری. امکانات کامپایل کوئری در گوگل را می توان کلاسیک نامید و روش های نمایش نتایج جستجو نیز به نوعی استاندارد شده است. به تازگی توسعه دهندگان گوگلتغییرات عمده ای در این زمینه ها ایجاد کرد - بزرگترین موتور جستجو در برابر پس زمینه رقبای جوان بسیار قدیمی به نظر می رسد.

گوگل یکی از بزرگترین پایگاه های شاخص در جهان را دارد که پوشش گسترده ای از منابع اطلاعاتی را ارائه می دهد. اطلاعات فهرست گوگل در چندین پایه عمودی خلاصه شده است. علاوه بر معروف ترین پایگاه داده وب، چندین پایگاه داده چندرسانه ای (تصاویر، ویدیوها) وجود دارد که با منابع اطلاعات و پیام های مرتبط در فیدهای RSS، پایگاه خبری اخبار، و همچنین پایگاه داده Blogs که دفترچه خاطرات شبکه را نمایه می کند، کار می کنند. علاوه بر این، گوگل طیف گسترده ای از منابع اضافی را ارائه می دهد که از جمله آنها می توان به خدمات نقشه، فهرست سایت ها و سرویس پرسش و پاسخ اشاره کرد. این منابع را می توان به عنوان ابزار جستجو نیز در نظر گرفت.

در پایگاه داده وب، گوگل حالت های جستجوی ساده و پیشرفته را برای کامپایل یک پرس و جو ارائه می دهد. فقط در حالت جستجوی ساده، از ابزارهای اضافی صفحه کلید مجازی. جستجوی پیشرفته گزینه های بیشتری را ارائه می دهد. از آنجایی که فرم جستجوی پیشرفته تقریباً در تمام محصولات جستجوی Google موجود است، بیایید با جزئیات بیشتری در مورد آن صحبت کنیم (شکل 1.1).

Yandex

موتور جستجوی Yandex که به طور رسمی در سال 1997 به عموم مردم ارائه شد، با موفقیت توسعه یافت و ده سال بعد، برای اولین بار در بین ده موتور جستجوی بزرگ جهان قرار گرفت. در بخش روسی اینترنت، او به موقعیتی پیشرو دست یافته است که با وجود رقابت فزاینده، قرار نیست از آن دست بکشد. ویژگی های متمایز Yandex از ابتدای پیدایش آن، الگوریتم های اصلی خود برای تعیین ارتباط نتایج جستجو، ابزارهای انعطاف پذیر برای کار با متن پرس و جو و در نظر گرفتن ویژگی های مورفولوژی زبان روسی در هنگام پردازش آنها بوده است.

Yandex به پایگاه داده های شاخص خود متکی است. این سیستم علاوه بر جستجو در اسناد وب، مجموعه خوبی از منابع تخصصی و خدمات اضافی را ارائه می دهد. Yandex در حال حاضر با تصاویر، فیلم ها، اخبار، وبلاگ ها و فرهنگ لغت کار می کند. قابلیت های جستجوی قدرتمندی نیز در سرویس نقشه برداری خود و در سیستم جستجوی محصول تعبیه شده است. علاوه بر این، Yandex کاتالوگ وب سایت های خود را حفظ می کند. نقطه قوت Yandex یک برنامه جستجوی محلی توسعه یافته است که به ویژه برای کاربران ما مهم است. Yandex دسترسی به پایگاه های داده خود را برای توسعه دهندگان شخص ثالث فراهم می کند. در نتیجه، بسیاری از پروژه های جستجوی اینترنتی جایگزین روسی از منابع Yandex به هر طریقی استفاده می کنند. علاوه بر سیستم جستجوی معمول، نسخه کوتاه شده Yandex نیز ارائه شده است که در ya.ru موجود است. رابط این نسخه فقط از یک فیلد ورودی پرس و جو و یک دکمه شروع جستجو تشکیل شده است.

جستجوی اسناد وب هر دو حالت جستجوی ساده و پیشرفته را ارائه می دهد. جستجوی ساده هیچ فیلتری را ارائه نمی دهد، که با توانایی تجزیه خودکار جستارهای زبان طبیعی، پردازش مطمئن پرس و جوهای نسبتا طولانی و یک سیستم تکمیل خودکار پرس و جو جبران می شود. حداکثر طول پرس و جو چهل کلمه است.

فرم جستجوی پیشرفته برای نوشتن یک پرس و جو فقط یک فیلد را ارائه می دهد. عملگرهای منطقی که کلمات پرس و جو را پیوند می دهند پیشنهاد می شود که به صورت دستی وارد شوند، خوب است. Yandex یک زبان پرس و جو نسبتاً دقیق دارد. بقیه ابزارهای فرم جستجوی پیشرفته فیلترهای مختلف هستند (1.4).

بینگ

تماس با تاریخچه جستجوی اینترنتی مایکروسافت آسان نیست. خدماتی که به طور مداوم به عموم ارائه می شود، بارها الگوریتم ها، پایگاه های داده استفاده شده و البته نام ها را تغییر داده است. تا اوایل دهه 2000، موتور جستجو پایگاه داده های خود را نداشت و با نمایه های خارجی AltaVista، Inktomi و Looksmart کار می کرد. نام اصلی MSN Search تا سال 2006 مورد استفاده قرار می گرفت و سپس برای چندین سال تغییر نام موتورهای جستجو برای مایکروسافت به یک سنت تبدیل شد.

همراه با انتقال نهایی به جستجو در فهرست های خود، جستجوی MSN ابتدا به جستجوی Windows LiveLive تغییر نام داد. سرانجام، در اوایل تابستان 2009، جستجوی زنده با پروژه جدید جستجوی بینگ جایگزین شد.

بیانیه مطبوعاتی مایکروسافت در مورد راه اندازی بینگ با چنین بیانیه ای آغاز شد: "بینگ روشی متفاوت برای نگاه کردن به اطلاعات در اینترنت ارائه می دهد و به کاربران در تصمیم گیری های مهم کمک می کند." آرزوهای توسعه دهندگان قابل درک بود: موتورهای جستجوی مایکروسافت، با وجود تمام تلاش ها، در غرب به طور مداوم از نظر محبوبیت نسبت به رهبران - گوگل و یاهو پایین تر بودند. اگر در مورد نسخه‌های روسی زبان پروژه‌های جستجوی قبلی مایکروسافت صحبت کنیم، از نظر تعداد و کیفیت پیوندهای یافت شده، آنها بسیار پایین‌تر از موتورهای جستجوی بزرگ روسی بودند. توسعه دهندگان بینگ در تلاش برای عقب افتادن از رقبا بر بهبود کیفیت جستجو و معرفی فناوری های جدید تکیه کرده اند که بسیاری از آنها همراه با شرکت هایی که آنها را ایجاد کرده اند خریداری شده اند.

لازم به ذکر است که نسخه روسیبینگ، مانند اکثر نسخه‌های بومی‌سازی شده دیگر، فاقد تعدادی ویژگی اضافی مانند جستجوی فروشگاه است. از آنجایی که آنها در واقع فقط در شمال کار می کنند. آمریکا، منطقی نیست که با جزئیات در مورد آنها صحبت کنیم.

Exalead

یکی از ویژگی های اروپا از جمله در زمینه جستجوی اینترنتی، تعداد زیاد زبان های ملی است. موتور جستجویی که ادعا می‌کند در اروپا پیشتاز است، به سادگی باید بخش‌های ملی اینترنت را به خوبی فهرست‌بندی کند و درخواست‌ها را به زبان‌های اروپایی متعدد، هم بزرگ‌ترین و هم کمتر رایج‌تر، با کیفیت بالا پردازش کند. در این زمینه است که توسعه اروپا می تواند جدی باشد مزیت رقابتیدر مقایسه با رقبای قدرتمند خارج از کشور. سیستم Exalead در حال حاضر به طور جدی ادعای نقش یک چنین موتور جستجوی اروپایی را دارد. این پروژه به عنوان بخشی از برنامه تحقیقاتی Quaere با بودجه اتحادیه اروپا توسعه یافته است.

Exalead پایگاه داده های شاخص خود را دارد. منابع اصلی جستجوی سیستم پایگاه داده های اسناد وب، تصاویر، فیلم ها و اخبار است. صفحه شروع Exalead این فرصت را ارائه می دهد شخصی سازی. در این صفحه، می توانید پیوندهایی به سایت های مورد علاقه خود قرار دهید - آنها به عنوان تصاویر کوچک گرافیکی - تصاویر نمایش داده می شوند. درست است، برای این کار باید یک حساب کاربری رایگان ثبت کنید، و همچنین به مرورگر اجازه دهید کوکی های Exalead را ذخیره کند.

Exalead Web Search حالت های جستجوی ساده و پیشرفته را ارائه می دهد. فرم جستجوی پیشرفته، مانند Bing، مستقیماً در صفحه شماره باز می‌شود. توجه داشته باشید که Exalead نه فقط یک فرم آشنا با مجموعه‌ای از فیلدهای اضافی، بلکه یک منوی کشویی پیچیده را ارائه می‌کند که به عنوان جادوگری برای اصلاح پرس و جو عمل می‌کند (شکل 1). 1.7). هنگامی که یک مورد را در منوی جادوگر انتخاب می کنید، عناصر جدید به رشته پرس و جو و در صورت لزوم عملگرها و کاراکترهای ویژه اضافه می شوند.

مقدمه

در حال حاضر، اینترنت صدها میلیون سرور را متحد می کند که میزبان میلیاردها سایت مختلف و فایل های فردی حاوی انواع مختلف اطلاعات هستند. این یک مخزن غول پیکر از اطلاعات است. روش های مختلفی برای جستجوی اطلاعات در اینترنت وجود دارد.

جستجو بر اساس آدرس شناخته شدهآدرس های مورد نیاز از دایرکتوری ها گرفته شده است. با دانستن آدرس، فقط آن را وارد کنید نوار آدرسمرورگر.

مثال 1. www.gov.ru - سرور مقامات دولتی روسیه.

ساخت آدرس توسط کاربربا دانستن سیستم تولید آدرس اینترنتی، می توانید آدرس هایی را هنگام جستجوی وب سایت ها بسازید.

اضافه کردن یک دامنه موضوعی یا جغرافیایی به یک کلمه کلیدی (نام شرکت، شرکت، سازمان یا یک اسم ساده انگلیسی) ضروری است و شهود باید متصل باشد.

مثال 2 آدرس صفحات وب تجاری:

www.samsung.com سامسونگ),

www.mtv.com (اخبار موسیقی ام تی وی).

مثال 3. آدرس موسسات آموزشی:

www.ntu.edu (دانشگاه ملی ایالات متحده).

موتورهای جستجواینترنت

برای جستجوی اطلاعات در اینترنت، سیستم های بازیابی اطلاعات ویژه ای ایجاد شده است. موتورهای جستجو دارای یک آدرس منظم هستند و به عنوان یک صفحه وب حاوی ابزارهای ویژه برای سازماندهی جستجو (رشته جستجو، کاتالوگ موضوعی، پیوندها) نمایش داده می شوند. برای فراخوانی یک موتور جستجو کافیست آدرس آن را در نوار آدرس مرورگر وارد کنید.

طبق سرویس آمار LiveInternet.ru، توزیع موتورهای جستجو در روسیه تقریباً به شرح زیر است:

2) Google - 35.0٪

3) جستجوی Mail.ru - 8.3٪

4) Rambler - 0.9٪

با توجه به روش سازماندهی اطلاعات، سیستم های بازیابی اطلاعات به دو نوع طبقه بندی (rubricators) و فرهنگ لغت تقسیم می شوند.

روبریکاتورها (طبقه بندی)- موتورهای جستجویی که از سازماندهی سلسله مراتبی (درخت مانند) اطلاعات استفاده می کنند. هنگام جستجوی اطلاعات، کاربر به عناوین موضوعی نگاه می کند و به تدریج فیلد جستجو را محدود می کند (به عنوان مثال، اگر باید معنای یک کلمه را پیدا کنید، ابتدا باید یک فرهنگ لغت را در طبقه بندی کننده پیدا کنید و سپس کلمه مناسب را پیدا کنید. در آن).



موتورهای جستجوی فرهنگ لغتسیستم های نرم افزاری و سخت افزاری خودکار قدرتمندی هستند. با کمک آنها، اطلاعات در اینترنت مشاهده می شود (اسکن). داده های مربوط به مکان این یا آن اطلاعات در کتاب های مرجع ویژه وارد می شود. در پاسخ به درخواست، جستجو مطابق با رشته پرس و جو انجام می شود. در نتیجه، آدرس‌هایی (URL) به کاربر ارائه می‌شود که کلمه یا گروهی از کلمات جستجو شده در زمان اسکن پیدا شده است. با انتخاب هر یک از لینک های پیشنهادی می توانید به سند پیدا شده بروید. بیشتر موتورهای جستجوی مدرن ترکیبی هستند.

معروف ترین و محبوب ترین موتورهای جستجو:

سیستم هایی وجود دارند که در جستجو تخصص دارند منابع اطلاعاتدر جهات مختلف

https://my.mail.ru

https://ru-ru.facebook.com

https://twitter.com

https://www.tumblr.com

https://www.instagram.com و غیره

موتورهای جستجوی موضوع:

جستجوی نرم افزار:

کاتالوگ ها (مجموعه های موضوعی پیوندها با حاشیه نویسی):

http://www.atrus.ru

قوانین اجرای پرس و جو

در هر موتور جستجو، در بخش راهنما، می توانید اطلاعاتی در مورد نحوه جستجو، نحوه نوشتن یک رشته کوئری دریافت کنید. در زیر اطلاعاتی در مورد یک زبان پرس و جو معمولی و "متوسط" آمده است.

درخواست ساده

یک کلمه که موضوع جستجو را تعریف می کند وارد کنید. به عنوان مثال، در موتور جستجوی Rambler.ru، کافی است وارد کنید: اتوماسیون.

اسنادی یافت می شوند که حاوی کلمات مشخص شده در درخواست هستند. همه اشکال کلمات روسی به رسمیت شناخته می شوند، به عنوان یک قاعده، مورد حروف نادیده گرفته می شود.

می توانید از کاراکتر "*" یا "?" در پرس و جو استفاده کنید. امضاء کردن "؟" در کلمه کلیدی، یک کاراکتر جایگزین می شود که به جای آن می توان هر حرفی را جایگزین کرد و کاراکتر "*" دنباله ای از کاراکترها است.

به عنوان مثال، Query automaton* اسنادی را پیدا می کند که شامل کلمات خودکار، خودکار و غیره است.

پرس و جو پیچیده

اغلب نیاز به ترکیب وجود دارد کلید واژه هابرای اطلاعات دقیق تر در این مورد، از کلمات پیوند دهنده اضافی، توابع، عملگرها، نمادها، ترکیبی از عملگرها که با براکت جدا شده اند استفاده می شود.

به عنوان مثال، query music & (beatles beatles) به این معنی است که کاربر به دنبال اسنادی است که حاوی کلمات موسیقی و بیتلز یا موسیقی و بیتلز باشد.

لیست سرورها و دایرکتوری های جستجو

نشانی شرح
www.excite.com موتور جستجو با بررسی گره ها و راهنماها
www.alta-vista.com سرور جستجو، قابلیت های جستجوی پیشرفته در دسترس است
www.hotbot.com سرور جستجو
www.ifoseek.com سرور جستجو (استفاده آسان)
www.ipl.org کتابخانه عمومی اینترنتی، یک کتابخانه عمومی که به عنوان بخشی از پروژه دهکده جهانی فعالیت می کند
www.wisewire.com WiseWire - سازماندهی جستجو با استفاده از هوش مصنوعی
www.webcrawler.com WebCrawler - سرور جستجو، آسان برای استفاده
www.yahoo.com کاتالوگ وب و رابط برای دسترسی به جستجوی متن کامل در سرور AltaVista
www.aport.ru Aport - سرور جستجوی زبان روسی
www.yandex.ru Yandex - سرور جستجوی روسی زبان
www.rambler.ru Rambler - سرور جستجوی روسی زبان
منابع راهنمایی اینترنتی
www.yellow.com صفحات زرد اینترنت
monk.newmail.ru موتورهای جستجوی پروفایل های مختلف
www.top200.ru 200 وب سایت برتر
www.allru.net
www.ru کاتالوگ منابع اینترنتی روسیه
www.allru.net/z09.htm منابع آموزشی
www.students.ru سرور دانشجوی روسی
www.cdo.ru/index_new.asp مرکز آموزش از راه دور
www.open.ac.uk دانشگاه آزاد انگلستان
www.ntu.edu دانشگاه ملی آمریکا
www.translate.ru مترجم متن الکترونیکی
www.pomorsu.ru/guide.library.html لیست پیوندهای کتابخانه های شبکه
www.elibrary.ru کتابخانه الکترونیک علمی
www.citforum.ru کتابخانه الکترونیکی
www.infamed.com/psy تست های روانشناسی
www.pokoleniye.ru سایت فدراسیون آموزش اینترنتی
www.metod.narod.ru منابع آموزشی
www.spb.osi.ru/ic/distant آموزش از راه دور در اینترنت
www.examen.ru امتحانات و تست ها
www.kbsu.ru/~book/ کتاب درسی علوم کامپیوتر
Mega.km.ru دایره المعارف ها و لغت نامه ها

جستجوی حرفه ای اطلاعات در اینترنت

جستجوی اطلاعات یکی از رایج ترین و در عین حال بیشترین است کارهای چالش برانگیزکه هر کاربری باید در وب با آن سر و کار داشته باشد. با این حال، اگر برای یک عضو عادی از جامعه شبکه، دانش روش های بازیابی اطلاعات موثر، مطلوب اما به دور از کیفیت اجباری است، برای متخصصان اطلاعات، توانایی پیمایش سریع در منابع اینترنتی و یافتن منابع مورد نیاز یکی از مواردی است که مهارت های صلاحیت اولیه

دلیل مشکلاتی که در بازیابی اطلاعات در اینترنت به وجود می آید توسط دو عامل اصلی مشخص می شود. اول اینکه تعداد منابع موجود در وب بسیار زیاد است. در پایان سال 2001، تخمین های تقریبی نشان داد که رقم تقریبی 7.5 میلیارد سند بر روی سرورهای سراسر جهان قرار دارد. ثانیاً، میزان اطلاعات موجود در وب نه تنها از نظر حجم عظیم است، بلکه بسیار پویا است. در نیم دقیقه ای که صرف خواندن خطوط اول این بخش کردید، حدود صد سند جدید یا تغییر یافته در دنیای مجازی ظاهر شد، ده ها سند به آدرس های جدید منتقل شدند و واحدها برای همیشه وجود نداشتند. اینترنت هرگز "خواب" نمی کند، همانطور که سیاره ما هرگز "خواب" نمی کند، که در طول آن موجی از فعالیت های تجاری انسان به طور مداوم دقیقاً مطابق با تغییر مناطق زمانی می چرخد.

برخلاف مجموعه ای پایدار و کنترل شده از اسناد در یک کتابخانه، در وب ما با یک آرایه اطلاعاتی غول پیکر و دائماً در حال تغییر سر و کار داریم، جستجوی داده ها در آن فرآیند بسیار بسیار پیچیده ای است. این وضعیت اغلب بسیار یادآور وظیفه شناخته شده یافتن سوزن در انبار کاه است، و گاهی اطلاعاتی که ارزش زیادی دارند صرفاً به دلیل دشواری یافتن آن بی ادعا باقی می مانند.

اکثر کاربران جهانی شبکه های کامپیوتر. هم آماتورها و هم حرفه ای ها اغلب از ابزارهای مشابهی استفاده می کنند. با این حال، نتایج جستجوها و زمان صرف شده برای آنها تا حد زیادی متفاوت است.

هدف این بخش آشنایی دقیق با ابزارها و روش‌های بازیابی اطلاعات و توسعه مهارت‌های پایدار برای جستجوی حرفه‌ای در وب انواع داده‌ها از متن در هر قالب گرفته تا ویدیو و انیمیشن است.