جستجوی اطلاعات در اینترنت

اینترنت با سرعت بسیار بالایی در حال رشد است، پس پیدا کنید اطلاعات لازمدر میان صدها میلیارد صفحه وب و صدها میلیون فایل، کار دشوارتر و دشوارتر می شود. برای جستجوی اطلاعات از موتورهای جستجوی ویژه ای استفاده می شود که حاوی اطلاعات به روز شده دائمی در مورد مکان صفحات وب و فایل ها در صدها میلیون سرور اینترنتی است.

موتورهای جستجو حاوی اطلاعات گروه بندی موضوعی در مورد منابع اطلاعاتی شبکه جهانی وب در پایگاه های داده هستند. برنامه های ویژه-ربات ها به طور دوره ای وب سرورهای اینترنتی را دور می زنند، تمام اسناد مواجه شده را می خوانند، کلمات کلیدی را در آنها برجسته می کنند و آدرس های اینترنتی اسناد را در پایگاه داده وارد می کنند.

اکثر موتورهای جستجو به نویسنده وب سایت اجازه می دهند تا با پر کردن فرم ثبت نام، اطلاعات را در پایگاه داده وارد کند. در فرآیند پر کردن پرسشنامه، توسعه دهنده سایت آدرس سایت، نام آن را وارد می کند. توضیح کوتاهمحتوای سایت و همچنین کلمات کلیدی که با آن ها راحت ترین سایت را پیدا می کنید.

جستجوی کلمات کلیدیجستجو برای یک سند در پایگاه داده موتور جستجو با وارد کردن پرس و جو در انجام می شود فیلد جستجو.

درخواست باید حاوی یک یا چند کلمه کلیدی باشد که کلیدواژه اصلی این سند هستند. به عنوان مثال، برای جستجوی خود موتورهای جستجوی اینترنتی، می توانید کلمات کلیدی " را وارد کنید. سیستم روسیجستجوی اطلاعات در اینترنت "(شکل 6.21).

مدتی پس از ارسال درخواست، موتور جستجو لیستی از آدرس های اینترنتی اسنادی را که کلمات کلیدی مشخص شده در آنها پیدا شده است، برمی گرداند. برای مشاهده این سند در مرورگر، کافی است لینک اشاره شده به آن را فعال کنید (شکل 6.22).

اگر کلمات کلیدی ناموفق انتخاب شده باشند، ممکن است فهرست آدرس‌های سند بسیار بزرگ باشد (ممکن است شامل ده‌ها یا حتی صدها هزار پیوند باشد). برای محدود کردن لیست، می توانید کلمات کلیدی اضافی را در قسمت جستجو وارد کنید یا از دایرکتوری موتور جستجو استفاده کنید.

یکی از کامل ترین و قدرتمندترین موتورهای جستجو گوگل (www.google.ru) است که 8 میلیارد صفحه وب را در پایگاه داده خود ذخیره می کند و هر ماه 5 میلیون صفحه جدید توسط روبات ها وارد می شود. در Runet (بخش روسی اینترنت)، پایگاه‌های اطلاعاتی گسترده‌ای که شامل 200 میلیون سند هستند، هر کدام دارای موتورهای جستجوی Yandex (www.yandex.ru) و Rambler (www.rambler.ru) هستند.

جستجو در یک سیستم دایرکتوری سلسله مراتبیدر پایگاه داده موتورهای جستجو، وب سایت ها به گروه بندی می شوند دایرکتوری های موضوعی سلسله مراتبی، که مشابه فهرست موضوعی در یک کتابخانه هستند.

بخش های موضوعی سطح بالا، به عنوان مثال: اینترنت، کامپیوتر، علم و آموزشو غیره، حاوی دایرکتوری های تودرتو هستند. به عنوان مثال، دایرکتوری اینترنت ممکن است شامل دایرکتوری های فرعی باشد جستجو، ایمیلو دیگران (شکل 6.23).

جستجوی اطلاعات در یک دایرکتوری به انتخاب یک دایرکتوری خاص کاهش می یابد، پس از آن لیستی از پیوندها به آدرس های اینترنتی وب سایت های پربازدید و معنی دار به کاربر ارائه می شود. هر پیوند معمولاً دارای حاشیه نویسی است، یعنی حاوی یک تفسیر کوتاه در مورد محتوای سند است.

موتور جستجوی Aport (www.aport.ru) دارای کاملترین فهرست موضوعی سلسله مراتبی چند سطحی از منابع اینترنتی به زبان روسی است. کاتالوگ حاوی حاشیه نویسی دقیق از محتوای وب سایت ها و نشانی از موقعیت جغرافیایی آنها است.

جستجوی فایلبرای جستجوی فایل ها در سرورهای آرشیو فایل، موتورهای جستجوی تخصصی از جمله موتور جستجوی FileSearch (www.filesearch.ru) وجود دارد. برای جستجوی یک فایل، باید نام فایل را در قسمت جستجو وارد کنید و موتور جستجو آدرس اینترنتی سرورهای آرشیو فایل را که فایل را با نام ذکر شده ذخیره می کنند، برمی گرداند.

جستجوی اطلاعات در بخش روسی زبان اینترنت با استفاده از بیشترین موتورهای جستجو: Google، Rambler، Aport، Applex و موتور جستجوی فایل Research را می توان با استفاده از موتور جستجوی یکپارچه Gogle.ru انجام داد (شکل 6.24). برای انجام این کار، فقط کلمات کلیدی را در نوار جستجو وارد کنید، از سوئیچ ها برای تنظیم نوع اطلاعات مورد نیاز استفاده کنید و روی دکمه با نام موتور جستجو Gogle.ru کلیک کنید (شکل 6.24). برای انجام این کار، کافی است کلمات کلیدی را در نوار جستجو وارد کنید، با استفاده از سوئیچ ها نوع اطلاعات مورد نیاز را تنظیم کنید و بر روی دکمه با نام موتور جستجو کلیک کنید.


برنج. 6.24. موتور جستجوی یکپارچه Google.ru

روش های جستجو در اینترنت

سه راه برای جستجو در اینترنت

اینترنت به طور کلی، و شبکه جهانی وب به طور خاص، دسترسی مشترک به هزاران سرور و میلیون ها صفحه وب را فراهم می کند که حجم غیرقابل تصوری از اطلاعات را ذخیره می کنند. چگونه در این «اقیانوس اطلاعات» گم نشویم؟ برای این کار باید نحوه جستجو و یافتن اطلاعات لازم در شبکه را بیاموزید.

همانطور که قبلا ذکر شد، سه راه اصلی برای یافتن اطلاعات در اینترنت وجود دارد.

1. مشخص کردن آدرس صفحهاین بیشترین است راه سریعجستجو کنید، اما تنها در صورتی می توان از آن استفاده کرد که آدرس دقیق سند مشخص باشد.

2. پیمایش از طریق هایپرلینک هااین روش کمترین راحتی است، زیرا می توان از آن برای جستجوی اسنادی استفاده کرد که فقط از نظر معنایی به سند فعلی نزدیک هستند. اگر سند فعلی به عنوان مثال به موسیقی اختصاص داده شده باشد، پس با استفاده از لینک های این سند، به سختی می توان به سایت اختصاص یافته به ورزش دسترسی پیدا کرد.

3. تماس با سرور جستجو موتور جستجو) . استفاده از موتورهای جستجو راحت ترین راه برای یافتن اطلاعات است. در حال حاضر، سرورهای جستجوی زیر در بخش روسی زبان اینترنت محبوب هستند:

    Yandex;
    رامبلر;
    پورت.

موتورهای جستجوی دیگری نیز وجود دارد. مثلا، سیستم کارآمدجستجو در سرور اجرا شده است سرویس پستی mail.ru.

جستجو در سرورها

در دسترس ترین و راحت ترین راه برای جستجوی اطلاعات در وب جهانیاستفاده از موتورهای جستجو است. در عین حال، اطلاعات را می توان با کاتالوگ ها و همچنین با مجموعه ای از کلمات کلیدی که سند متن جستجو شده را مشخص می کند جستجو کرد.

استفاده از سرورهای جستجو را با جزئیات بیشتری در نظر بگیرید. سرور جستجوحاوی تعداد زیادی لینک به بیشترین اسناد مختلف، و همه این پیوندها در فهرست های موضوعی سازماندهی شده اند. به عنوان مثال: ورزش، سینما، ماشین، بازی، علم و غیره. علاوه بر این، این لینک ها توسط سرور به طور مستقل، در حالت خودکاربا مشاهده منظم تمام صفحات وب که در شبکه جهانی وب ظاهر می شوند. علاوه بر این، سرورهای جستجو امکان جستجوی اطلاعات با کلمات کلیدی را در اختیار کاربر قرار می دهند. پس از وارد کردن کلمات کلیدی، سرور جستجو شروع به مرور اسناد در سایر سرورهای وب می کند و پیوندهایی به اسنادی را که کلمات مشخص شده در آنها یافت می شود، نمایش می دهد. معمولاً، نتایج جستجو به ترتیب نزولی بر اساس رتبه‌بندی سند خاصی مرتب می‌شوند که نشان می‌دهد یک سند معین چقدر با معیارهای جستجو مطابقت دارد یا هر چند وقت یک‌بار در وب درخواست می‌شود.

زبان درخواست موتور جستجو

گروهی از کلمات کلیدی که بر اساس قوانین خاصی تشکیل شده اند - با استفاده از زبان پرس و جو، درخواست به سرور جستجو نامیده می شود. زبان های پرس و جو برای موتورهای جستجوی مختلف بسیار مشابه هستند. می توانید با مراجعه به بخش "راهنما" سرور جستجوی مورد نظر در این زمینه اطلاعات بیشتری کسب کنید. قوانین ایجاد پرس و جو با استفاده از موتور جستجوی Yandex را به عنوان مثال در نظر بگیرید.

نحو اپراتور اپراتور یعنی چی درخواست نمونه
فضا یا & منطقی و (داخل جمله) فیزیوتراپی
&& منطقی و (در داخل سند) دستور العمل ها و و (پنیر فرآوری شده)
| منطقی OR عکس | عکاسی | عکس فوری | تصویر عکاسی
+ وجود کلمه در سند یافت شده الزامی است بودن یا نبودن
() گروه بندی کلمات (تکنولوژی | تولید) (پنیر | پنیر دلمه)
~ عملگر باینریو نه (در داخل جمله) بانک ها ~ قانون
~~
یا
_
عملگر باینری AND NOT (در داخل سند) راهنمای سفر به پاریس ~~ (آژانس | تور)
/(nm) فاصله در کلمات (منهای (-) - عقب، به علاوه (+) - جلو) تامین کنندگان /2 موسیقی قهوه /(-2 4) جای خالی آموزش ~ /+1 دانش آموز
" " جستجوی عبارت «کلاه قرمز کوچولو» معادل: قرمز / +1 کاپوت سواری
&&/(nm) فاصله در جملات (منهای (-) - عقب، به علاوه (+) - جلو) بانک && /1 مالیات

بدست آوردن بالاترین امتیازهاجستجو کنید، باید چند مورد را به خاطر بسپارید قوانین ساده:

    1. فقط در مورد یک کلمه کلیدی اطلاعات جستجو نکنید.

    2. بهتر است کلمات کلیدی را با حروف بزرگ وارد نکنید، زیرا ممکن است همان کلماتی که با حروف کوچک نوشته شده اند پیدا نشوند.

    3. اگر جستجوی شما هیچ نتیجه ای نداشت، بررسی کنید که آیا وجود دارد یا خیر کلید واژه ها x اشتباهات املایی

موتورهای جستجوی مدرن توانایی اتصال به درخواست تولید شده یک تحلیلگر معنایی را فراهم می کنند. به کمک آن می توانید با وارد کردن یک کلمه، اسنادی را انتخاب کنید که در آنها مشتقاتی از این کلمه در حالت ها، زمان ها و غیره وجود دارد.

سوالات تستی

1. اسناد چگونه با کلمات کلیدی جستجو می شوند؟ در یک سیستم دایرکتوری؟

وظایف برای خودشکوفایی

6.8 کار عملی. نتایج جستجوی اسناد را با استفاده از موتورهای جستجوی مختلف با کلمه کلیدی مقایسه کنید (از موتور جستجوی یکپارچه گوگل استفاده کنید).

6.9 کار عملی. سرورهای آرشیو فایل را برای فایل پخش کننده رسانه WinAmp جستجو کنید.

می گویند همه چیز در اینترنت است. در واقع اینطور نیست. مطالب برای ارسال در وب توسط افراد واقعی تهیه می شود و بنابراین شما فقط می توانید آنچه را که آنها لازم می دانند در آنجا منتشر کنید پیدا کنید. با این حال، رودخانه توسط نهرها تغذیه می شود و به لطف خلاقیت آنها، امروزه حدود دو میلیارد صفحه وب در اینترنت شکل گرفته است. در نتیجه فهرست نویسی منابع موجود در وب به یک مشکل بزرگ تبدیل شده است. علیرغم اینکه هزاران سازمان با این مشکل دست و پنجه نرم می کنند، نه تنها به حل آن نزدیک نمی شود، بلکه حادتر می شود. درصد منابع فهرست‌بندی شده به طور پیوسته در حال کاهش است. AT سال های گذشتهاین پاییز فاجعه بار بود بنابراین، اگر در سال 1999 درصد منابع فهرست‌بندی‌شده به 40 درصد رسید، تنها در یک سال آینده به 25 درصد کاهش یافت.

نتیجه گیری ساده است: فضای وب سریعتر از سیستمی شدن پر می شود.

متأسفانه، ما هیچ دلیلی نداریم که فرض کنیم هر چیزی می تواند در آینده نزدیک تغییر کند. در نتیجه جستجوی اطلاعات در اینترنت را می توان یکی از سخت ترین کارها دانست.

برای جستجوی اطلاعات مورد نظر خود، باید آدرس صفحه وب که در آن قرار دارد را به مرورگر بگویید. این سریعترین و قابل اعتمادترین نوع جستجو است. برای دسترسی سریعبه منبع، فقط مرورگر را راه اندازی کنید و آدرس صفحه را در نوار آدرس تایپ کنید.

آدرس‌های صفحات وب در دایرکتوری‌های ویژه، نشریات چاپی داده می‌شود، آنها در پخش ایستگاه‌های رادیویی محبوب و از صفحه‌های تلویزیون پخش می‌شوند.

اگر آدرس را نمی دانید، پس برای جستجوی اطلاعات در اینترنت وجود دارد موتورهای جستجو، حاوی اطلاعاتی در مورد منابع اینترنتی

هر موتور جستجو یک پایگاه داده بزرگ از کلمات کلیدی مرتبط با صفحات وب است که در آنها یافت می شود. برای جستجوی آدرس سرور با اطلاعات مورد نظر خود، باید یک کلمه کلیدی، چند کلمه یا عبارتی را در قسمت موتور جستجو وارد کنید. بنابراین، شما یک درخواست به موتور جستجو ارسال می کنید. نتایج جستجو به صورت فهرستی از آدرس‌های صفحه وب که در آن کلمات وجود دارند، ارائه می‌شوند.

به عنوان یک قاعده، موتورهای جستجو از سه بخش تشکیل شده اند: ربات، فهرست و برنامه پردازش درخواست.

ربات (عنکبوت، ربات یا ربات) برنامه ای است که از صفحات وب بازدید می کند و محتوای آنها را (کل یا جزئی) می خواند.

ربات‌های موتورهای جستجو در طرح‌های جداگانه برای تجزیه و تحلیل محتوای یک صفحه وب متفاوت هستند.

ایندکس یک فروشگاه داده است که شامل کپی از تمام صفحات بازدید شده توسط روبات ها می باشد.

شاخص ها در هر موتور جستجو از نظر مقدار و نحوه ذخیره اطلاعات متفاوت است. پایگاه داده های موتورهای جستجوی پیشرو اطلاعات ده ها میلیون سند را ذخیره می کنند و حجم فهرست آنها صدها گیگابایت است. ایندکس ها به طور دوره ای به روز و تکمیل می شوند، بنابراین اگر جستجو در زمان های مختلف انجام شده باشد، نتایج کار یک موتور جستجو با همان پرس و جو ممکن است متفاوت باشد.

پردازشگر پرس و جو برنامه ای است که مطابق با درخواست کاربر، فهرست را برای اطلاعات لازم "اسکن" می کند و پیوندهایی را به اسناد یافت شده برمی گرداند.

مجموعه پیوندها در خروجی سیستم توسط برنامه به ترتیب نزولی از بالاترین درجه تطبیق پیوند با درخواست به پایین ترین توزیع می شود.

در روسیه، رایج ترین موتورهای جستجو عبارتند از:

  • Rambler (www.rambler.ru)؛
  • Yandex (www.yandex.ru)؛
  • ایمیل (www.mail.ru).

موتورهای جستجوی بیشتری در خارج از کشور وجود دارد. محبوب ترین ها عبارتند از:

  • آلتا ویستا (www.altavista.com)؛
  • جستجوی سریع (www.alltheweb.com)؛
  • نور شمالی (www.northernlight.com).

یاندکس شاید بهترین موتور جستجو در اینترنت روسیه باشد. این پایگاه داده شامل حدود 200000 سرور و 30 میلیون سند است که سیستم در عرض چند ثانیه اسکن می کند. در مثال این سیستم، نحوه جستجوی اطلاعات را نشان خواهیم داد.

جستجوی اطلاعات با وارد کردن یک کلمه کلیدی در یک کادر خاص و فشار دادن دکمه "یافتن" در سمت راست قاب تنظیم می شود.

نتایج جستجو در عرض چند ثانیه ظاهر می شوند و بر اساس اهمیت رتبه بندی می شوند - مهمترین اسناد در بالای لیست قرار می گیرند. در این حالت، رتبه سند یافت شده با توجه به مکانی در سند که کلمه کلیدی در آن قرار دارد (در عنوان سند مهمتر از هر مکان دیگری است) و تعداد ذکر کلمه کلیدی ( ذکر بیشتر، رتبه بالاتر است).

بنابراین، سایت‌هایی که در مکان‌های اول فهرست قرار دارند، نه از نظر محتوایی، بلکه عملاً در رابطه با فراوانی ذکر کلمه کلیدی پیشرو هستند. در این راستا، نباید به دیدن ده سایت اول پیشنهاد شده توسط موتور جستجو محدود شود.

محتوای سایت را می توان به طور غیر مستقیم با توضیحات مختصری که توسط موتور جستجو در زیر آدرس سایت قرار داده شده ارزیابی کرد. برخی از نویسندگان بی‌وجدان سایت، به منظور افزایش احتمال ظاهر شدن صفحه وب خود در اولین مکان‌های موتور جستجو، عمداً تکرارهای بی‌معنی کلمه کلیدی را در سند وارد می‌کنند. اما به محض اینکه موتور جستجو چنین سندی را "آشغالی" تشخیص دهد، به طور خودکار آن را از پایگاه داده خود حذف می کند.

حتی فهرست رتبه‌بندی اسنادی که توسط یک موتور جستجو در پاسخ به یک عبارت یا کلمه کلیدی ارائه می‌شود، می‌تواند تقریباً طاقت فرسا باشد. در این راستا، Yandex (و همچنین سایر موتورهای جستجوی قدرتمند) فرصتی را در لیست اول برای انتخاب اسنادی فراهم می کند که هدف جستجو را با دقت بیشتری منعکس می کند، یعنی اصلاح یا بهبود نتایج جستجو. به عنوان مثال، لیستی از 34899 صفحه وب در هر کلمه کلیدی. با وارد کردن یک کلمه کلیدی واجد شرایط در دستور "جستجو در یافت شده"، لیست به 750 صفحه کاهش می یابد و با وارد کردن یک کلمه واجد شرایط دیگر در این دستور، لیست به 130 صفحه وب کاهش می یابد.

دایرکتوری های جستجو مجموعه ای (انتخابی) سیستماتیک از پیوندها به سایر منابع اینترنتی هستند. پیوندها به صورت سازماندهی شده اند روبریکاتور موضوعی، n یک ساختار سلسله مراتبی را نشان می دهد که از طریق آن می توانید اطلاعات مورد نیاز خود را پیدا کنید.

بیایید به عنوان مثال ساختار کاتالوگ اینترنتی جستجوی Yandex را در نظر بگیریم.

این یک دایرکتوری با هدف عمومی است، زیرا حاوی پیوندهایی به منابع اینترنتی در تقریباً تمام جهات ممکن است. این دایرکتوری شامل موارد زیر است موضوعات:

  • تجارت و اقتصاد؛
  • جامعه و سیاست؛
  • علم و آموزش؛
  • کامپیوتر و ارتباطات؛
  • کتابهای راهنما و پیوندها؛
  • خانه و خانواده؛
  • سرگرمی و تفریح؛
  • فرهنگ و هنر.

هر یک موضوعبسیاری را شامل می شود زیر بخش ها ، و آنها نیز به نوبه خود شامل می شوند سرفصل هاو غیره.

فرض کنید در حال آماده سازی رویدادی برای روز پیروزی هستید و می خواهید در اینترنت کلمات ترانه نظامی معروف Bulat Okudzhava "شنوید چکمه ها را می شنوید" جستجو کنید. جستجو را می توان به صورت زیر سازماندهی کرد:

Yandex > کاتالوگ > فرهنگ و هنر > موسیقی > آهنگ نویسنده

این روش جستجو بسیار سریع و کارآمد است. در پایان فقط چند لینک به شما پیشنهاد می شود که در میان آنها لینک هایی به سایت هایی با آهنگ های باردهای معروف وجود دارد. تنها باقی مانده است که در سایت یک آرشیو با اشعار B. Okudzhava پیدا کنید و متن مورد نظر را در آن انتخاب کنید.

مثالی دیگر. فرض کنید قصد خرید یک گوشی موبایل را دارید و می خواهید مشخصات دستگاه های شرکت های مختلف را با هم مقایسه کنید. جستجو را می توان تحت عناوین کاتالوگ زیر انجام داد:

Yandex > کاتالوگ > رایانه ها و ارتباطات > اتصال تلفن همراه> تلفن های همراه

دریافت کردن تعداد محدودلینک ها، می توانید با بررسی ویژگی های شرکت ها و تغییرات دستگاه ها، آنها را به سرعت مشاهده کرده و یک گوشی را انتخاب کنید.

اکثر موتورهای جستجو توانایی جستجو بر اساس کلمات کلیدی را دارند. این یکی از رایج ترین انواع جستجو است.

برای جستجو بر اساس کلمات کلیدی، باید یک کلمه یا چند کلمه را وارد کنید تا در یک پنجره خاص جستجو شود و روی دکمه Find کلیک کنید.

موتور جستجو در پایگاه داده خود اسنادی را که حاوی این کلمات هستند را پیدا کرده و نشان می دهد. ممکن است چنین اسناد زیادی وجود داشته باشد، اما تعداد زیاد در این مورد لزوماً به معنای خوب نیست.

بیایید آزمایش هایی را با هر یک از موتورهای جستجو انجام دهیم. فرض کنید تصمیم داریم یک آکواریوم راه اندازی کنیم و به اطلاعاتی در این زمینه علاقه مندیم. در نگاه اول، ساده ترین کار جستجوی کلمه "آکواریوم" است. بیایید این را بررسی کنیم، به عنوان مثال، در موتور جستجوی Yandex. نتیجه جستجو خواهد بود مقدار زیادیصفحات - تعداد زیادی پیوند. علاوه بر این، اگر دقیق‌تر نگاه کنید، در میان آنها سایت‌هایی وجود خواهند داشت که به گروه آکواریوم B. Grebenshchikov، مراکز خرید و انجمن‌های غیررسمی با همین نام و موارد دیگر اشاره می‌کنند که هیچ ربطی به ماهی‌های آکواریومی ندارند.

به راحتی می توان حدس زد که چنین جستجویی نمی تواند حتی کاربر بی تکلف را راضی کند. زمان زیادی باید صرف انتخاب از بین تمام اسناد پیشنهادی شود که به موضوع مورد نیاز ما مربوط می شوند و حتی بیشتر از آن برای آشنایی با محتوای آنها.

بلافاصله می توانید نتیجه بگیرید که معمولاً جستجو با یک کلمه توصیه نمی شود ، زیرا تعیین موضوع یک سند ، صفحه وب یا سایت با یک کلمه بسیار دشوار است. استثنا کلمات و اصطلاحات نادری هستند که تقریباً هرگز خارج از حوزه موضوعی خود استفاده نمی شوند.

با داشتن مجموعه مشخصی از رایج ترین اصطلاحات در ناحیه مورد نظر، می توانید از جستجوی پیشرفته استفاده کنید. روی انجیر پنجره جستجوی پیشرفته در موتور جستجوی Yandex نشان داده شده است. در این حالت قابلیت های زبان پرس و جو به صورت فرم پیاده سازی می شود. یک سرویس مشابه، از جمله فیلترهای فرهنگ لغت، تقریباً توسط همه موتورهای جستجو ارائه می شود.

بیایید سعی کنیم شرایط جستجو را روشن کنیم و عبارت "ماهی آکواریوم" را وارد کنیم. تعداد لینک ها بیش از 20 برابر کاهش می یابد. این نتیجه بیشتر برای ما مناسب است، اما در عین حال، در بین لینک های پیشنهادی می توانید به عنوان مثال مجموعه های سوغاتی روسی از برچسب های کبریت با تصاویر ماهی و مجموعه ای از محافظ صفحه نمایش رایانه رومیزی و کاتالوگ ماهی های آکواریومی با عکس و آکواریوم را مشاهده کنید. فروشگاه های لوازم جانبی بدیهی است که باید به حرکت در جهت اصلاح شرایط جستجو ادامه دهیم.

به منظور تولید بیشتر جستجو، همه موتورهای جستجو دارای یک ویژگی خاص هستند زبان پرس و جو با نحو خاص خودش این زبان ها از بسیاری جهات شبیه هم هستند. یادگیری همه آنها بسیار دشوار است، اما هر موتور جستجو دارای یک سیستم کمکی است که به شما امکان می دهد به زبان مورد نظر مسلط شوید.

در اینجا چند قانون ساده برای ایجاد درخواست در موتور جستجوی Yandex وجود دارد.

کلمات کلیدی در پرس و جو باید با حروف کوچک (کوچک) نوشته شوند.

این تضمین می کند که همه کلمات کلیدی جستجو می شوند، نه فقط آنهایی که با حروف بزرگ شروع می شوند.

جستجو تمام اشکال کلمه را طبق قوانین زبان روسی، صرف نظر از شکل کلمه در پرس و جو، در نظر می گیرد.

به عنوان مثال، اگر کلمه "می دانم" در پرس و جو مشخص شده بود، کلمات "دانستن"، "دانستن" و غیره نیز شرایط جستجو را برآورده می کنند.

برای جستجوی یک عبارت پایدار، کلمات را در علامت نقل قول قرار دهید.

مثلا «ظروف چینی».

برای جستجو بر اساس فرم دقیق کلمه، باید قبل از کلمه علامت تعجب قرار دهید.

به عنوان مثال، برای جستجوی کلمه "September" در حالت جنسی، باید "!September" را بنویسید.

برای جستجو در یک جمله واحد، کلمات در پرس و جو با یک فاصله یا علامت و از هم جدا می شوند.

به عنوان مثال، "رمان ماجراجویی" یا "ماجراجویی و رمان". چندین کلمه تایپ شده در پرس و جو، که با فاصله از هم جدا شده اند، به این معنی است که همه آنها باید در یک جمله از سند مورد جستجو گنجانده شوند.

اگر می خواهید فقط آن دسته از اسنادی را انتخاب کنید که هر کلمه مشخص شده در پرس و جو در آنها وجود داشته باشد، علامت مثبت "+" را در مقابل هر یک از آنها قرار دهید. اگر برعکس، می خواهید هر کلمه ای را از نتیجه جستجو حذف کنید، جلوی این کلمه یک علامت منفی "-" قرار دهید. علامت های «+» و «-» باید با فاصله از علامت قبلی و همراه با کلمه بعدی نوشته شوند.

به عنوان مثال، پرس و جو "Volga-car" اسنادی را پیدا می کند که حاوی کلمه "Volga" هستند نه کلمه "car".

هنگام جستجوی مترادف ها یا کلماتی که از نظر معنی نزدیک هستند، می توانید یک نوار عمودی "|" بین کلمات قرار دهید.

به عنوان مثال، برای پرس و جو "child | بچه | عزیزم" اسنادی را با هر یک از این کلمات پیدا می کند.

به جای یک کلمه در یک پرس و جو، می توانید یک عبارت کامل را جایگزین کنید. برای این کار باید آن را در پرانتز بگیرید

به عنوان مثال، "(کودک | نوزاد | کودک | نوزاد) + (مراقبت | آموزش)".

کاراکتر "~" (tilde) به شما امکان می دهد اسنادی را با جمله ای بیابید که حاوی کلمه اول است، اما حاوی کلمه دوم نیست.

به عنوان مثال، جستجوی "books ~ shop" تمام اسناد حاوی کلمه "کتاب" را پیدا می کند که کلمه "فروشگاه" در کنار آن (در داخل جمله) وجود ندارد.

اگر عملگر یک بار تکرار شود (به عنوان مثال، & یا ~)، جستجو در داخل جمله انجام می شود. عملگر دوگانه (&&,~~) درون سند جستجو می کند.

به عنوان مثال، با جستجوی عبارت "cancer ~~ astrology" اسنادی با کلمه "سرطان" که به طالع بینی مرتبط نیستند را پیدا خواهید کرد.

بیایید به مثال ماهی آکواریومی برگردیم. پس از مطالعه چندین سند ارائه شده توسط موتور جستجو، مشخص می شود که جستجوی اطلاعات در اینترنت نباید با انتخاب ماهی آکواریومی آغاز شود. آکواریوم یک سیستم بیولوژیکی پیچیده است که ایجاد و نگهداری آن نیازمند دانش ویژه، زمان و سرمایه گذاری جدی است.

بر اساس اطلاعات دریافت شده، شخصی که در اینترنت جستجو می کند، می تواند استراتژی جستجوی بیشتر را به طور اساسی تغییر دهد و تصمیم به مطالعه ادبیات خاص مرتبط با موضوع مورد مطالعه بگیرد.

برای جستجوی متون یا اسناد کامل متن، پرس و جو زیر امکان پذیر است:

"+ (آکواریوم | آکواریوم | آکواریوم) + برای مبتدیان + (توصیه | ادبیات) + (مقاله | پایان نامه | متن کامل) - (قیمت | فروشگاه | تحویل | کاتالوگ)».

پس از پردازش درخواست توسط موتور جستجو، نتیجه بسیار موفق بود. در حال حاضر اولین پیوندها به مدارک مورد نیاز منتهی می شود.

اکنون می توانید نتایج جستجو را خلاصه کنید، نتیجه گیری های خاصی را انجام دهید و در مورد اقدامات احتمالی تصمیم بگیرید:

  • جستجوی بیشتر را متوقف کنید، زیرا به دلایل مختلف، نگهداری از آکواریوم خارج از توان شماست.
  • مقالات پیشنهادی را بخوانید و به چیدمان آکواریوم بپردازید.
  • مطالبی را در مورد همستر یا طوطی طوطی جستجو کنید.
  1. کدام نوع جستجو سریعترین و قابل اعتمادترین است؟
  2. کاربر از کجا می تواند آدرس صفحات وب را پیدا کند؟
  3. هدف اصلی یک موتور جستجو چیست؟
  4. موتور جستجو از چه بخش هایی تشکیل شده است؟
  5. چه موتورهای جستجویی را می شناسید؟
  6. فناوری جستجو توسط روبریکاتور یک موتور جستجو چیست؟
  7. فناوری جستجوی کلمات کلیدی چیست؟
  8. چه زمانی باید از + یا - در معیارهای جستجوی خود استفاده کنید؟
  9. معیارهای جستجو در Yandex با عبارت زیر تعیین می شود:

    (پرستار|آموزگار|فرماندار)++(مراقبت|آموزش|نظارت) ?

  10. دو برابر شدن علامت (~~ یا ++) هنگام تشکیل یک پرس و جو پیچیده به چه معناست؟

ورزش.

وظیفه 1. جستجو در فهرست ها.

از فهرست راهنمای موتور جستجو برای یافتن اطلاعات زیر استفاده کنید (طبق دستور معلم):

  1. متن آهنگ از یک گروه موسیقی محبوب
  2. رپرتوار تئاتر ماریینسکی برای هفته جاری
  3. مشخصات آخرین مدل تلفن همراهشرکت معروف (به انتخاب شما)
  4. دستور پخت گاوزبان اوکراینی با کوفته
  5. پیش بینی بلند مدت آب و هوا در منطقه شما (حداقل 10 روز)
  6. عکس خواننده آهنگ معاصر مورد علاقه شما
  7. هزینه تقریبی کامپیوتر چند رسانه ای(قیمت)
  8. اطلاعاتی در مورد جاهای خالی پست منشی در منطقه یا شهر شما
  9. طالع بینی علامت زودیاک شما برای روز جاری

بر اساس نتایج جستجو، یک گزارش مکتوب در Word تهیه کنید: مطالب یافت شده، کپی شده و قالب بندی شده را در سند ارائه دهید. گزارش را به معلم ارائه دهید.

وظیفه 2. تشکیل یک درخواست برای عنوان دقیق یا نقل قول.

شما عنوان دقیق سند را می دانید، به عنوان مثال "الزامات بهداشتی برای رایانه های الکترونیکی شخصی و سازماندهی کار". برای جستجوی متن کامل سند در اینترنت، یک درخواست فرموله کنید.

نتیجه جستجو را در پوشه خود ذخیره کنید. تقدیم به معلم

وظیفه 3. تشکیل پرس و جوهای پیچیده.

  • در هر موتور جستجویی، درخواست جستجوی اطلاعات در مورد حمام روسی را ارائه دهید. پیشنهادات خدمات، تبلیغات لوازم حمام و سایر تبلیغات را حذف کنید. جستجوی خود را بر روی تأثیر حمام روسی بر بدن متمرکز کنید.
  • برای جستجوی اطلاعات در مورد مراقبت از گربه های خانگی، یک درخواست پیچیده بنویسید. گربه های بزرگ (مانند شیرها) را از جستجوی خود و همچنین پیشنهادات خرید، فروش، عکس برای کاغذ دیواری و غیره حذف کنید.
  • متن درخواست و نتیجه جستجو را در Word پر کنید و به معلم ارائه دهید.
وظیفه 4. جستجوی موضوعی.

از هر طریقی که می دانید، اطلاعاتی در مورد تاریخچه فناوری محاسبات در اینترنت جستجو کنید. جستجو در جهات مختلف: محیط تاریخی، فناوری، شخصیت ها. نتایج جستجو را در قالب یک ارائه ارائه دهید. در ارائه خود از فهرست مطالب چند مرحله ای به شکل هایپرلینک استفاده کنید.

مشکل جستجو و ابزار سازماندهی آن

حجم عظیم و روزافزون اطلاعات موجود در اینترنت، از جمله. عملیاتی، مشکل یافتن اطلاعات لازم را بسیار مرتبط و پیچیده می کند. سرعت جستجوی اطلاعات لازم تا حد زیادی حرفه ای بودن کاربر اینترنت را تعیین می کند. شایان ذکر است که برای خودکار کردن کار ϶ᴛᴏ، مختلف، هم خارجی و هم سیستم های داخلیجستجو، که صفحات وب از نوع خاصی هستند. در عین حال، علیرغم وجود ابزارهای اتوماسیون جستجوی متعدد، این کار بسیار پرزحمت باقی می ماند و کاربر را ملزم به داشتن تجربه، شهود و دانش خاصی از اصطلاحات مورد استفاده در حوزه موضوعی خود می کند.

تخمینی که در ژورنال نیچر در 8 ژوئیه 1999 منتشر شد، تعداد صفحات وب نمایه شده عمومی را 800 میلیون تخمین زد.یک سال بعد، نویسنده این مطالعه (استیو لارنس از موسسه تحقیقاتی NEC) معتقد بود که تعداد آنها تقریباً دو برابر شده است. به 1.5 میلیارد حتی بهترین موتورهای جستجو بیش از یک صفحه در شش صفحه فهرست می کنند. شایان ذکر است که برای استخراج اطلاعات مفیداز اینترنت، باید بدانید کجا و چگونه جستجو کنید.

ابزار جستجوی اینترنت اکسپلورر دسترسی به ابزارهای جستجو را ساده می کند و نیازی به دانستن آدرس موتورهای جستجو را از بین می برد. در این مورد، بهتر است با بارگذاری صفحه ϲᴏᴏᴛʙᴇᴛϲᴛʙ مستقیماً با موتورهای جستجو تماس بگیرید.

با توجه به روش سازماندهی جستجو و قابلیت های ارائه شده، تمام ابزارهای جستجو را می توان به طور مشروط به گروه های زیر تقسیم کرد:

کاتالوگ ها و پایگاه های اطلاعاتی تخصصی؛

موتورهای جستجو؛

سیستم های متاجستجو

کاتالوگ ها و پایگاه های داده

کاتالوگ های موجود در WWW شبیه کاتالوگ های کتابخانه ای سیستماتیک هستند. جستجوی دایرکتوری شامل جابجایی متوالی در فهرست سلسله مراتبی پیوندها به نام سرفصل یا دسته است. صفحه اول فهرست شامل پیوندهایی به موضوعات اصلی مانند فرهنگ و هنر است. پزشکی و سلامت؛ جامعه و سیاست؛ تجارت و اقتصاد؛ سرگرمی و غیره. با کلیک بر روی پیوند ϲᴏᴏᴛʙᴇᴛϲᴛʙ (دسته) صفحه ای باز می شود که حاوی پیوندهایی است که موضوع انتخاب شده (روبریک) را شرح می دهد. با حرکت به پایین دسته های جزئیات، می توانید صفحه ای با اطلاعات مورد نظر پیدا کنید. در هر صفحه ای که هنگام جابجایی در کاتالوگ به روشی باز می شود، دنباله سرفصل های تو در تو مشاهده شده نشان داده می شود، به عنوان مثال، دنیای تجارت: امور مالی: تجزیه و تحلیل و غیره.

همه فهرست ها به صورت دستی توسط متخصصان ایجاد و به روز می شوند، به همان روشی که کتاب شناسان فهرست های کتابخانه را جمع آوری و نگهداری می کنند. لازم به ذکر است که شرح سند یا توسط گردآورندگان کاتالوگ و یا توسط نویسنده انجام می شود. به لطف ϶ᴛᴏmu، محتوای صفحات موجود در کاتالوگ با عنوانی که به آن اختصاص داده شده است، بسیار مناسب است. اما، با توجه به سرعت پر کردن و تغییرات در اطلاعات در اینترنت، روش "دستی" نگهداری کاتالوگ ها اجازه نمی دهد تا وضعیت واقعی منابع اینترنتی را در این موضوع به طور یکسان منعکس کند.

موتورهای جستجو

(موتورهای جستجو، موتورهای جستجو، روبات های جستجوگر)

ده ها وب سایت بزرگ و هزاران وب سایت کوچک و تخصصی وجود دارد که به جستجوی اینترنتی اختصاص یافته اند. ابزارهای جستجوی گروه ϶ᴛᴏ به کاربر این امکان را می دهد تا الزامات اطلاعات مورد نیاز خود را مطابق با قوانین خاص فرموله کند (یک پرس و جو با استفاده از زبان پرس و جو ایجاد کند). گره‌ها می‌توانند از فهرست‌های اینترنتی خود استفاده کنند که دائماً توسط برنامه‌های ویژه‌ای به نام عنکبوت (عنکبوت) به روز می‌شوند، برنامه spider وب را بررسی می‌کند، هر پیوند را در یک صفحه مشخص، سپس در صفحات آدرس‌دهی شده پیوندها و غیره را بررسی می‌کند و مالک آن را در مورد تمام صفحات برای نمایه سازی بعدی

در نتیجه جستجو، یک یا چند صفحه حاوی پیوندهایی به اسناد (صفحه های وب) مرتبط با پرس و جو ایجاد می شود. شایان ذکر است که برای هر پیوند، تاریخ ایجاد سند، حجم آن، میزان ارتباط آن است. معمولاً قطعات متنی که محتوای سند را مشخص می کنند نیز در پرس و جو نشان داده می شوند. با کلیک بر روی چنین پیوندی می توانید صفحه مورد علاقه خود را دانلود کنید. در مورد تعداد بسیار زیادی از اسناد یافت شده، می توانید پرس و جو را در ϲᴏᴏᴛʙᴇᴛϲᴛʙ اصلاح کنید و جستجو را با آن تکرار کنید، اما فقط در بین صفحات انتخاب شده (چنین جستجویی در ماشین های مختلف به طور متفاوتی نامیده می شود، اما معمولاً ϶ᴛᴏ - جستجو در مورد یافت شده) در تعدادی از موتورهای جستجو، می توانید از روش خاصی استفاده کنید، پیوند صفحه ای را که محتوای آن به بهترین وجه نیازهای شما را برآورده می کند، تغییر دهید و جستجو را تکرار کنید و از شما بخواهید که موارد مشابه را جستجو کنید.

مزیت جستجوی خودکار در واقع این است که نمایانگر حجم بسیار زیادی از اطلاعات موجود در اینترنت در این لحظه. در عین حال، پیچیدگی توصیف دقیق درخواست که به اندازه کافی نیازهای اطلاعاتی شما را منعکس می کند، و همچنین پیچیدگی بیشتر کار تعیین خودکار درجه درخواست شما از صفحات مشاهده شده، منجر به این واقعیت می شود که تعداد صفحات انتخاب شده "در اولین اجرا" به طور سنتی یا بسیار کوچک یا بیش از حد بزرگ است. به طور کلی، جستجو با استفاده از موتور جستجو یک فرآیند تکراری (چند گذر) است که در نتیجه فرم پرس و جو به تدریج اصلاح می شود.

موتورهای متاجستجو

همانطور که در بالا ذکر شد، هر موتور جستجو از طریق مجموعه خاصی از سرورها نگاه می کند و اسناد را در ϲᴏᴏᴛʙᴇᴛϲᴛʙii با معیارهای خود انتخاب می کند. در نتیجه جستجو توسط سیستم های مختلف برای کلمات کلیدی یکسان نتایج متفاوتی به دست می دهد. این منجر به ایده ایجاد سیستم های به اصطلاح متاجستجو (یا چندجستجوی) شد که خودشان چیزی را جستجو نمی کنند، بلکه به طور همزمان به چندین موتور جستجو برای کمک روی می آورند. توجه داشته باشید که هر یک از موتورهای فراجستجو دارای یک زبان پرس و جو ϲʙᴏ هستند. این سیستم پرس و جو فرموله شده به زبان خود را به زبان های پرس و جو مورد استفاده توسط هر موتور جستجو ترجمه می کند. علاوه بر این، نتایج جستجو توسط همه سیستم‌ها ترکیب شده و به شکل ϲᴏᴏᴛʙᴇᴛϲᴛʙ ارائه می‌شوند. به طور طبیعی، جستجو با استفاده از موتورهای متاجستجو بیشتر از موتورهای جستجوی معمولی طول می کشد.

مروری بر محبوب ترین موتورهای جستجو

تعداد زیادی موتور جستجو در اینترنت وجود دارد و هر کاربر توسط موتوری که به آن عادت دارد یا همکارانش به او توصیه کرده اند هدایت می شود. ما از شرح مختصری از محبوب ترین موتورهای جستجو استفاده خواهیم کرد که در یکی از سایت ها آورده شده است.

1. گوگل (www.google.com) سریعترین و بزرگترین موتور جستجو. بیش از 1.3 میلیارد صفحه ایندکس شده است (که کمی بیش از 700 میلیون به طور کامل هستند، فقط آدرس و متن پیوند در مورد بقیه مشخص است). می‌توانید نتایج را از سایت‌ها و/یا دامنه‌های خاص اضافه یا حذف کنید. برخلاف اکثر موتورهای جستجو، گوگل محبوبیت یک منبع را با تعداد لینک هایی که از صفحات دیگر به آن منتهی می شود ارزیابی می کند. جستجوی موضوع محور - Apple Macintosh، BSD UNIX، Linux، دولت ایالات متحده و جستجوهای دانشگاه - جستجو در منابع مؤسسات علمی و آموزشی پیشرو وجود دارد.

2. Yandex (www.yandex.ru) بهترین موتور جستجوی تولید داخل. این عمدتاً منابع روسی زبان را نمایه می کند، در حالی که ϶ᴛᴏm از نظر قابلیت ها کمتر از سیستم های خارجی نیست. جستجو را می توان دقیقاً یا به هر شکل کلمه ای، محدود به تاریخ انجام داد که نشان دهنده سایت یا زیر شاخه آن است. می توانید بر اساس به اصطلاح فهرست استناد جستجو کنید، تصاویر، اسکریپت ها، اپلت ها را جستجو کنید. زبان سند را تنظیم کنید پیوندهای لازم به طور سنتی در ده نتیجه اول یافت می شوند. این یک نسخه "لایت" (با حداقل عناصر طراحی) در http://www.ya.ru دارد.

3. AltaVista (www.altavista.com) گسترش زیادی از معیارهای جستجو را فراهم می کند: در جستجوی پیشرفته یک انتخاب فاصله زمانی وجود دارد که شامل تاریخ ایجاد یا تغییر منبع، پشتیبانی از 25 زبان است. امکان صدور یک نتیجه در هر سایت وجود دارد. تا همین اواخر، AV یک پورتال بزرگ بود، اما به دلایل مالی (و نه تنها) تعداد خدمات را به میزان قابل توجهی کاهش داد.

4 یاهو (www.yahoo.com) ذکر این نکته ضروری است که یکی از اولین موتورهای جستجو در اینترنت است. جدا از مجموعه استانداردتوابع، به شما امکان می دهد منابع را بر اساس تاریخ انتخاب کنید (4 سال، 1، 3، 6 ماه، هفته، 1، 3 روز) از قابلیت تعیین علامت "*" به جای هر دنباله ای از کاراکترها در کلمات کلیدی پشتیبانی می کند. در یاهو یک کاتالوگ ساختار یافته بزرگ از دسته ها (دسته ها) گردآوری شد. ابتدا جستجو در آنها انجام می شود، سپس در آرشیو خود و سپس - با استفاده از سیستم های گوگل. جستجو در دسته ها نتایج خوبی می دهد - آنها کم و بینهایت هستند و خوب هستند.

5. Lycos (www.lycos.com) اخیرا - یکی از محبوب ترین سیستم ها. با همه اینها، هیچ ویژگی خاصی ارائه نمی دهد - "AND" "OR"، جستجوی عبارات، حضور / عدم حضور اجباری یک کلمه. در ویژگی های پیشرفته - جستجو در عنوان، URL، نام میزبان و / یا نام دامنه. 25 زبان، از جمله روسی - در یک کلمه، کل مجموعه "به طور کلی پذیرفته شده". می توانید نوع محتوای منبع را مشخص کنید - خودکار، کتاب، ftp، دانلود، اخبار و غیره. بدیهی است که محبوبیت Lycos نتیجه مقیاس پروژه بزرگ ϶ᴛᴏ است.

6. Rambler (www.rambler.ru) تا همین اواخر معروف ترین موتور جستجوی روسیه بود. جستجوی پیشرفته به شما امکان جستجوی عبارات را نمی دهد و جستجوی منظم تا فوریه 1999 به ندرت نتایج قابل قبولی را به همراه داشت. از فوریه، سیستم ϶ᴛᴏ از یک موتور جستجوی بهبودیافته استفاده می کند، طراحی تغییر کرده است، اما Rambler هنوز از نظر کیفیت (طبق نظر نویسنده که موتورهای جستجو را تجزیه و تحلیل می کند) منابع اطلاعات آماری در مورد پروژه های اینترنتی نمی تواند با Yandex و Aport مطابقت داشته باشد.

7. Aport (www.aport.ru) یکی دیگر از موتورهای جستجوی خوب روسیه. جستجو با متن (فقط در تمام اشکال کلمه) و با استفاده از URL انجام می شود عملگرهای منطقیو عملگر "..." (با این حال، کلمات توقف در عبارت هنوز نادیده گرفته می شوند)، بر اساس تاریخ و در فیلدهای جداگانه (عنوان، توضیحات و غیره)، متا کاراکترها * و! ارائه نتایج جستجو در مقایسه با سایر موتورهای جستجوی روسی به خوبی طراحی شده است. برخی از تردیدها ناشی از طراحی صفحه اصلی است که به وضوح مملو از اطلاعات است. یک نسخه کمی "سبک تر" در http://aport.ru وجود دارد.

نحوه انتخاب موتور جستجو

هنگام جستجو در اینترنت، دو جزء مهم هستند - کامل بودن (هیچ چیز گم نشد) و دقت (هیچ چیز اضافی پیدا نشد).

1. پوشش و عمق

پوشش به حجم پایگاه داده موتور جستجو اشاره دارد که با سه شاخص اندازه گیری می شود - مقدار کل اطلاعات نمایه شده، تعداد سرورهای منحصر به فرد و تعداد اسناد منحصر به فرد. عمق به این صورت درک می شود که آیا محدودیتی در تعداد صفحات یا در عمق دایرکتوری تودرتو در یک سرور وجود دارد.

نحوه بررسی: برخی از ماشین ها آمار ربات را در این سایت می نویسند. اما می توانید خودتان آن را بررسی کنید - باید چند مورد را بپرسید پرس و جوهای جستجو، متشکل از یک کلمه (ɥᴛᴏ برای حذف تأثیر زبان پرس و جو، از جمله تفاسیر مختلف از فضا)، و زمانی که به آمار نتایج صادر شده توسط ماشین نگاه کنید - معمولاً در ابتدای لیست نشان داده می شود. در کل چند سند پیدا شد علاوه بر این که کلمات باید از مناطق مختلف باشند، همچنین خوب است که کلمات با وزن های مختلف - نادر، "متوسط" و "سنگین" (مکرر) را گرفته و تعداد یافت شده را با هم مقایسه کنید. کلمات سنگین، به ویژه، متن کامل (فهرست کردن همه کلمات در یک سند) یک موتور جستجو را آزمایش می کنند.

بررسی عمق راه رفتن ربات دشوارتر است - برای ϶ᴛᴏ لازم است برخی از سایت ها را انتخاب کنید، به عنوان مثال، با ساختار آرشیو شاخه ای، و بررسی کنید که آیا اسناد نمایه شده اند، که فقط می توان به آنها دسترسی داشت، برای مثال، در 6 کلیک روی پیوندها.

2. میزان خزیدن و ارتباط پیوندها

سرعت پیمایش وب نشان می دهد که یک منبع جدید اضافه شده با چه سرعتی ایندکس می شود و اطلاعات موجود در پایگاه داده با چه سرعتی به روز می شوند. فراموش نکنید که یک شاخص مهم از کیفیت یک موتور جستجو (ربات آن) نه تنها تصرف مناطق جدید، بلکه نظارت بر وضعیت کسانی است که قبلاً تحت پوشش قرار گرفته اند. سرورها ناپدید می شوند و می مانند، صفحات روی آنها به روز می شوند. پیوندهایی که توسط موتور جستجو در لیست یافت شده ارائه می شود، اولاً باید وجود داشته باشند و ثانیاً محتوای آنها باید مطابق با درخواست باشد.

نحوه بررسی: اطلاعات هدف را می توان با تجزیه و تحلیل گزارش های سرور به دست آورد - ربات موتور جستجو معمولاً با نام دستگاه خود (یا مشابه) نشان داده می شود، بنابراین می توانید ببینید که چند بار از سرور بازدید می کند، چند صفحه را مشاهده می کند. و غیره. متأسفانه، معمولاً گزارش فقط ϲʙᴏ از سایت او برای مطالعه در دسترس است، بنابراین روش آزمایشی باقی می ماند.

برای تعیین میزان خزیدن، باید صفحه ای از متن را در جایی ایجاد کنید، آن را به موتورهای جستجو اضافه کنید و ببینید که چقدر سریع ظاهر می شود. یا یک صفحه موجود را تغییر دهید. شایان ذکر است که برای تعیین ارتباط پیوندها، اسناد را حداقل در صفحه اول لیست موجود برای چندین پرس و جو بررسی کنید. پیام پیدا نشدنشان می دهد که سند دیگر وجود ندارد.

3. کیفیت جستجو (شاخص موضوعی)

شایان ذکر است که هر موتور جستجو دارای یک ϲʙᴏ و یک الگوریتم برای مرتب سازی نتایج جستجو است. هرچه سند مورد نیاز شما به بالای لیست نزدیک تر باشد، ارتباط بهتری کار می کند.

نحوه بررسی: فقط با آزمایش. توصیه می شود برای مقایسه درخواست هایی با طول های مختلف ارائه دهید. شما همچنین می توانید از زبان پرس و جو استفاده کنید، در حالی که کسانی که تمایلی به خواندن توضیحات ندارند می توانند از صفحه جستجوی توسعه یافته استفاده کنند ("جستجوی پیشرفته" در Aport و Yandex، "پرس و جوی دقیق" در Rambler - گزینه های ترجمه به روسی "جستجوی پیشرفته")

علاوه بر ارتباط، ویژگی های کاربر مهمی نیز وجود دارد.

4. سرعت جستجو

اگر موتور جستجو کند پاسخ دهد، کار با آن ناکارآمد است. شایان ذکر است که سرعت مشاهده شده توسط کاربر نه تنها به خود موتور جستجو، بلکه به کانال های اینترنتی نیز بستگی دارد.

نحوه بررسی: با آزمایش - باید به دنبال درخواست هایی با طول های مختلف، متفاوت باشید<тяжести>کلمات و در زمان های مختلف روز (بار سرور به طور قابل توجهی در طول روز ناهموار است، اوج آن حدود سه تا چهار بعد از ظهر است)

5. قابلیت های جستجو (کار با زبان سند، زبان پرس و جو)

یکی دیگر از موارد مقایسه این است که موتور جستجو دقیقاً چه چیزی و چگونه به این شاخص کمک می کند. شایان ذکر است که یک موتور جستجوی متن کامل تمام کلمات متن قابل مشاهده برای کاربر را نمایه می کند. وجود صرف شناسی باعث می شود که کلمات مورد نظر را در تمام نزول یا صرف یافتن کنیم. علاوه بر ϶ᴛᴏgo، در زبان HTMLبرچسب هایی وجود دارند که می توانند توسط موتور جستجو نیز پردازش شوند (عناوین، پیوندها، شرح تصاویر و غیره)

تقریباً همه ماشین‌ها یک زبان پرس و جو در قالب عملگرهای منطقی استاندارد (AND، OR، NOT) دارند. برخی می توانند عبارات یا کلمات را در یک فاصله مشخص جستجو کنند - ϶ᴛᴏ اغلب برای به دست آوردن یک نتیجه معقول مهم است. یک ویژگی اضافی جستجو در مناطق سند - سرفصل ها، پیوندها، کلمات کلیدی (META KEYWORDS) و غیره خواهد بود. ویژگی اضافیزبان پرس و جو - یک پرس و جو زبان طبیعی که به دانش عملگرها نیاز ندارد.

نحوه بررسی: معمولاً این اطلاعات در سرور موتور جستجو (در Help "e) منتشر می شود. توجه داشته باشید که با این وجود توصیه می شود پرس و جوهای واقعی را بررسی کنید، زیرا گاهی اوقات آنچه شما می خواهید معتبر است.

6. امکانات اضافی

اینها ویژگی های اضافی هستند که موتور جستجو در اختیار کاربران قرار می دهد. این شامل انواع گزینه های جستجو (صفحات تخصصی، جستجوی اسناد مشابه، محدود کردن دامنه جستجو) و لیستی از سرورهای یافت شده، و جستجو بر اساس تاریخ و سرور، و رابط کاربر پسندموتور جستجو و امکان شخصی سازی آن.

نحوه بررسی: ممکن است اطلاعات تا حدی در سرور موتور جستجو منتشر شده باشد، اما بهتر است سعی کنید خودتان با این ویژگی ها کار کنید.

واضح است که این تحلیل زمان می برد. به غیر از این، موتورهای جستجو، مانند بقیه اینترنت، ثابت نمی مانند. در عین حال با توجه به اینکه جستجوی اطلاعات یکی از مولفه های مهم است فناوری رایانه، باید توجه کافی به ϶ᴛᴏ داده شود - حداقل کمتر از توانایی کار در یک شبکه محلی.

نظرسنجی در Yandex.ru انجام شد: چرا به اینترنت نیاز است و چه چیزی کم است (http://www.yandex.ru/polling/9.html) به ترتیب نزولی، داده های نظرسنجی به شرح زیر توزیع شد: اینترنت به عنوان دایرکتوری (23، 76%)، ابزار تحقیق (15.45%)، سرگرمی (14.15%)، و تنها در رتبه چهارم - منبع خبری (12.32%)، خوش بینانه به نظر می رسید که 10٪ از کاربران همیشه و 73٪ اغلب موفق می شوید اطلاعات مورد نیاز خود را پیدا کنید. آنچه در اینترنت وجود ندارد: اطلاعات، جستجوی خوب و نظم (شامل: نظم، ساختار، ساختار، ساختار، ساختار، و همچنین سیستم، سیستم سازی، نظام مندی، نظام مندی و نظام مندی)

به سوالات پاسخ دهید:

روش های سازماندهی جستجوها در اینترنت چیست؟

اطلاعات در کاتالوگ ها و پایگاه های داده چگونه جستجو می شود؟

اطلاعات چگونه وارد کاتالوگ ها و پایگاه های داده می شود؟

موتورهای جستجوی اینترنتی چیست؟

پایگاه داده اطلاعاتی چگونه در موتورهای جستجو تشکیل می شود؟

جستجوی اطلاعات در موتورهای جستجو از کجا شروع می شود؟

درخواست چیست؟

اطلاعات در موتورهای جستجو چگونه جستجو می شود؟

منظور از ارتباط پرس و جو چیست؟

در صورت یافتن تعداد بسیار زیاد اسناد در حین جستجوی بیشتر چه می توان کرد؟

موتورهای متاجستجو چیست؟

تفاوت اساسی بین موتورهای متاجستجو و موتورهای جستجوی معمولی چیست؟

کدام یک از سیستم های زیر موتورهای فراجستجو خواهند بود:

محبوب ترین موتورهای جستجوی داخلی کدامند؟

محبوب ترین موتورهای جستجوی خارجی کدامند؟

هنگام جستجوی اطلاعات در اینترنت چه دو جزء مهم هستند؟

چه ویژگی هایی اثربخشی موتورهای جستجو را هنگام جستجوی اطلاعات در اینترنت تعیین می کند؟

شرایط استفاده:
حقوق مالکیت معنوی به مواد - اطلاعاتی شبکه های کامپیوتر- Borisov N.A.، Lukin A.A. متعلق به نویسنده آن است. این راهنما / کتاب فقط برای اهداف اطلاعاتی و بدون دخالت در گردش تجاری ارسال شده است. تمام اطلاعات (از جمله "موضوع 3. جستجوی اطلاعات در اینترنت") از منابع باز جمع آوری می شود، یا توسط کاربران به صورت رایگان اضافه می شود.
برای استفاده کامل از اطلاعات ارسال شده، مدیریت پروژه سایت اکیداً خرید کتاب / کتابچه راهنمای شبکه های کامپیوتری اطلاعات - Borisov N.A., Lukin A.A. را توصیه می کند. در هر فروشگاه آنلاین

بلوک برچسب: شبکه های کامپیوتری اطلاعات - Borisov N.A., Lukin A.A., 2015. موضوع 3. جستجوی اطلاعات در اینترنت.

(ج) سایت مخزن حقوقی 2011-2016

سه راه برای جستجو در اینترنت

اینترنت به طور کلی، و شبکه جهانی وب به طور خاص، دسترسی مشترک به هزاران سرور و میلیون ها صفحه وب را فراهم می کند که حجم غیرقابل تصوری از اطلاعات را ذخیره می کنند. چگونه در این «اقیانوس اطلاعات» گم نشویم؟ برای این کار باید نحوه جستجو و یافتن اطلاعات لازم در شبکه را بیاموزید.

همانطور که قبلا ذکر شد، سه راه اصلی برای یافتن اطلاعات در اینترنت وجود دارد.

1. مشخص کردن آدرس صفحهاین سریعترین راه برای جستجو است، اما تنها در صورتی می توان از آن استفاده کرد که آدرس سند دقیقاً مشخص باشد.

2. پیمایش از طریق هایپرلینک هااین روش کمترین راحتی است، زیرا می توان از آن برای جستجوی اسنادی استفاده کرد که فقط از نظر معنی مشابه سند فعلی هستند. اگر سند فعلی به عنوان مثال به موسیقی اختصاص داده شده باشد، پس با استفاده از لینک های این سند، به سختی می توان به سایت اختصاص یافته به ورزش دسترسی پیدا کرد.

3. تماس با سرور جستجو (موتور جستجو). استفاده از موتورهای جستجو راحت ترین راه برای یافتن اطلاعات است. در حال حاضر، سرورهای جستجوی زیر در بخش روسی زبان اینترنت محبوب هستند: Yandex; رامبلر.

موتورهای جستجوی دیگری نیز وجود دارد. به عنوان مثال، یک سیستم جستجوی کارآمد در سرور سرویس پست الکترونیکی mail.ru پیاده سازی شده است.

جستجو در سرورها

در دسترس ترین و راحت ترین راه برای یافتن اطلاعات در شبکه جهانی وب استفاده از موتورهای جستجو است. در عین حال، اطلاعات را می توان با کاتالوگ ها و همچنین با مجموعه ای از کلمات کلیدی که سند متن جستجو شده را مشخص می کند جستجو کرد.

استفاده از سرورهای جستجو را با جزئیات بیشتری در نظر بگیرید. سرور جستجوحاوی تعداد زیادی پیوند به اسناد مختلف است و همه این پیوندها در فهرست های موضوعی سیستماتیک شده اند. به عنوان مثال: ورزش، فیلم، اتومبیل، بازی، علم و غیره. علاوه بر این، این پیوندها توسط سرور به طور مستقل و به طور خودکار با مشاهده منظم تمام صفحات وب که در شبکه جهانی وب ظاهر می شوند تنظیم می شوند. علاوه بر این، سرورهای جستجو امکان جستجوی اطلاعات با کلمات کلیدی را در اختیار کاربر قرار می دهند. پس از وارد کردن کلمات کلیدی، سرور جستجو شروع به مرور اسناد در سایر سرورهای وب می کند و پیوندهایی به اسنادی را که کلمات مشخص شده در آنها یافت می شود، نمایش می دهد. معمولاً، نتایج جستجو به ترتیب نزولی بر اساس رتبه‌بندی سند خاصی مرتب می‌شوند که نشان می‌دهد یک سند معین چقدر با معیارهای جستجو مطابقت دارد یا هر چند وقت یک‌بار در وب درخواست می‌شود.

زبان درخواست موتور جستجو

گروهی از کلمات کلیدی که بر اساس قوانین خاصی تشکیل شده اند - با استفاده از زبان پرس و جو، درخواست به سرور جستجو نامیده می شود. زبان های پرس و جو برای موتورهای جستجوی مختلف بسیار مشابه هستند. می توانید با مراجعه به بخش "راهنما" سرور جستجوی مورد نظر در این زمینه اطلاعات بیشتری کسب کنید. قوانین ایجاد پرس و جو را در مثال موتور جستجوی Yandex در نظر بگیرید.

نحو اپراتور اپراتور یعنی چی درخواست نمونه
فضا یا & منطقی و (داخل جمله) پروتزهای ثابت
&& منطقی و (در داخل سند) انواع و و (پرتزهای مصنوعی ثابت)
| منطقی OR عکس | عکاسی | عکس فوری | تصویر عکاسی
+ وجود کلمه در سند یافت شده الزامی است بودن یا نبودن
() گروه بندی کلمات (تکنولوژی | تولید) (پنیر | پنیر دلمه)
~ عملگر باینری AND NOT (در یک جمله) بانک ها ~ قانون
~~ یا _ عملگر باینری AND NOT (در داخل سند) راهنمای سفر به پاریس ~~ (آژانس | تور)
/(nm) فاصله در کلمات (منهای (-) - عقب، به علاوه (+) - جلو) تامین کنندگان /2 موسیقی قهوه /(-2 4) جای خالی آموزش ~ /+1 دانش آموز
« « جستجوی عبارت "دندان مصنوعی ثابت" معادل: دندان مصنوعی ثابت /+1
&&/(nm) فاصله در جملات (منهای (-) - عقب، به علاوه (+) - جلو) پزشکی && /1 دندان مصنوعی

اطلاعات کلی.

در حال حاضر، اینترنت صدها میلیون سرور را متحد می کند که میزبان میلیاردها سایت مختلف و فایل های فردی حاوی انواع مختلف اطلاعات هستند. این یک مخزن غول پیکر از اطلاعات است. روش های مختلفی برای جستجوی اطلاعات در اینترنت وجود دارد.

جستجو بر اساس آدرس شناخته شده آدرس های مورد نیاز از دایرکتوری ها گرفته شده است. با دانستن آدرس، فقط آن را وارد کنید نوار آدرسمرورگر.

www.gov.ru - سرور مقامات دولتی روسیه.

ساخت آدرس توسط کاربر با دانستن سیستم تولید آدرس اینترنتی، می توانید آدرس هایی را هنگام جستجوی وب سایت ها بسازید.

اضافه کردن یک دامنه موضوعی یا جغرافیایی به یک کلمه کلیدی (نام شرکت، شرکت، سازمان یا یک اسم ساده انگلیسی) ضروری است و شهود باید متصل باشد.

آدرس سایت های تجاری:

www.cnn.com (اخبار جهانی CNN)،

www.sony.com SONY),

www.mtv.com (اخبار موسیقی MTV).

آدرس موسسات آموزشی:

www.ntu.edu (دانشگاه ملی ایالات متحده).

آدرس سرورهای منطقه ای:

www.poland.net (لهستان)،

www.israil.net (اسرائیل).

موتورهای جستجوی اینترنتی

برای جستجوی اطلاعات در اینترنت، سیستم های بازیابی اطلاعات ویژه ای ایجاد شده است. موتورهای جستجو دارای یک آدرس منظم هستند و به عنوان یک صفحه وب حاوی ابزارهای ویژه برای سازماندهی جستجو (رشته جستجو، کاتالوگ موضوعی، پیوندها) نمایش داده می شوند. برای فراخوانی یک موتور جستجو کافیست آدرس آن را در نوار آدرس مرورگر وارد کنید.

با توجه به روش سازماندهی اطلاعات، سیستم های بازیابی اطلاعات به دو نوع طبقه بندی (rubricators) و فرهنگ لغت تقسیم می شوند.

روبریکاتورها (طبقه بندی کننده ها) موتورهای جستجویی هستند که از سازماندهی سلسله مراتبی (درخت مانند) اطلاعات استفاده می کنند. هنگام جستجوی اطلاعات، کاربر به عناوین موضوعی نگاه می کند و به تدریج فیلد جستجو را محدود می کند (به عنوان مثال، اگر نیاز به یافتن معنای یک کلمه دارید، ابتدا باید یک فرهنگ لغت را در طبقه بندی کننده پیدا کنید و سپس آن را در آن پیدا کنید. کلمه درست).

سیستم های جستجوی فرهنگ لغت، سیستم های نرم افزاری و سخت افزاری خودکار قدرتمندی هستند. با کمک آنها، اطلاعات در اینترنت مشاهده می شود (اسکن). داده های مربوط به مکان این یا آن اطلاعات در کتاب های مرجع ویژه وارد می شود. در پاسخ به درخواست، جستجو مطابق با رشته پرس و جو انجام می شود. در نتیجه، آدرس‌هایی (URL) به کاربر ارائه می‌شود که کلمه یا گروهی از کلمات جستجو شده در زمان اسکن پیدا شده است. با انتخاب هر یک از لینک های پیشنهادی می توانید به سند پیدا شده بروید. بیشتر موتورهای جستجوی مدرن ترکیبی هستند.

معروف ترین و محبوب ترین موتورهای جستجو:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

سیستم هایی وجود دارند که در جستجو تخصص دارند منابع اطلاعاتدر جهات مختلف

جستجوی افراد در اینترنت:

www.whowhere.ru www. bigfoot.com

جستجو بر اساس گروه های خبری (Usenet):

www.dejanews.com

موتورهای جستجوی موضوع:

جستجو کردن نرم افزار:

جستجو در آرشیو فایل:

http://ftpseach.com city.ru، http://ftpsearch. licos.com

کاتالوگ ها (مجموعه های موضوعی پیوندها با حاشیه نویسی):

http://www.atrus.ru

اغلب، جستجوی مؤثر برای اطلاعات را می توان با استفاده از کاتالوگ های منطقه ای - سرورهای تخصصی حاوی داده های مربوط به شرکت ها یا منابع وب یک شهر یا منطقه انجام داد. به عنوان مثال، برای سنت پترزبورگ، چنین کاتالوگ در http://www.spb.ru قرار دارد.

فهرستی از IPS را می‌توانید در www.monk بیابید. newmail.ru

فهرست دقیق تری از موتورهای جستجو و دایرکتوری ها در جدول ارائه شده است. 3.2.

قوانین اجرای پرس و جو

در هر موتور جستجو، در بخش راهنما، می توانید اطلاعاتی در مورد نحوه جستجو، نحوه نوشتن یک رشته کوئری دریافت کنید. در زیر اطلاعاتی در مورد یک زبان پرس و جو معمولی و "متوسط" آمده است.

درخواست ساده

یک کلمه که موضوع جستجو را تعریف می کند وارد کنید. به عنوان مثال، در موتور جستجوی Rambler.ru، کافی است وارد کنید: اتوماسیون.

اسنادی یافت می شوند که حاوی کلمات مشخص شده در درخواست هستند. همه اشکال کلمات روسی به رسمیت شناخته می شوند، به عنوان یک قاعده، مورد حروف نادیده گرفته می شود.

می توانید از کاراکتر "*" یا "?" در پرس و جو استفاده کنید. امضاء کردن "؟" در کلمه کلیدی، یک کاراکتر جایگزین می شود که به جای آن می توان هر حرفی را جایگزین کرد و کاراکتر "*" دنباله ای از کاراکترها است.

به عنوان مثال، Query automaton* اسنادی را پیدا می کند که شامل کلمات خودکار، خودکار و غیره است.

درخواست پیچیده

اغلب نیاز به ترکیب کلمات کلیدی برای به دست آوردن اطلاعات خاص تر وجود دارد. در این مورد، از کلمات پیوند دهنده اضافی، توابع، عملگرها، نمادها، ترکیبی از عملگرها که با براکت جدا شده اند استفاده می شود.

به عنوان مثال، query music & (beatles | beatles) به این معنی است که کاربر به دنبال اسنادی است که حاوی کلمات music و beatles یا music و beatles باشد.

جدول 3.1 قوانین مربوط به ایجاد درخواست های اتخاذ شده در سیستم Aport (http://www.aport.ru) را نشان می دهد.

جدول 3.1

اپراتورها برای تشکیل درخواست ها

اپراتور مترادف ها اظهار نظر
و و & پرس و جو اسناد حاوی هر دو کلمه کلیدی را پیدا می کند. ممکن است نوشته شود یا نباشد. به عنوان مثال، پرس و جو: علوم کامپیوتر و کتاب درسی معادل کتاب درسی علوم کامپیوتر است
یا یا | آن دسته از اسنادی را جستجو می کند که از یکی از کلمات مشخص شده یا هر دو کلمه به طور همزمان استفاده می کنند
نه نه-~ جستجو محدود به اسنادی است که حاوی کلمه مشخص شده بعد از اپراتور نیستند
" " " " نقل قول های دوتایی یا تکی به شما امکان می دهد یک عبارت را پیدا کنید
تاریخ = date:date= جستجو محدود به اسنادی است که در بازه زمانی مشخص شده قرار می گیرند. مثال 1. date=01/02/2002-01/03/2002. این درخواست اسناد حاوی کلمه "ارز" و دارای تاریخ بین 1 فوریه 2002 و 1 مارس 2002 را برمی گرداند. مثال 2. date=01/03/2002 ارز مثال 3. date:<02/03/2002 валюта

جدول 3.2

لیست سرورها و دایرکتوری های جستجو

نشانی شرح
www.excite.com موتور جستجو با بررسی گره ها و راهنماها
www.alta-vista.com سرور جستجو، قابلیت های جستجوی پیشرفته در دسترس است
www.hotbot.com سرور جستجو
www.poland.net www.israil.net سرورهای جستجوی منطقه ای لهستان، اسرائیل
www.ifoseek.com سرور جستجو (استفاده آسان)
www.ipl.org کتابخانه عمومی اینترنتی، یک کتابخانه عمومی که به عنوان بخشی از پروژه دهکده جهانی فعالیت می کند
www.wisewire.com WiseWire - سازماندهی جستجو با استفاده از هوش مصنوعی
www.webcrawler.com WebCrawler - سرور جستجو، آسان برای استفاده
www.yahoo.com کاتالوگ وب و رابط برای دسترسی به جستجوی متن کامل در سرور AltaVista
www.aport.ru Aport - سرور جستجوی زبان روسی
www.yandex.ru Yandex - سرور جستجوی روسی زبان
www.rambler.ru Rambler - سرور جستجوی روسی زبان
منابع راهنمایی اینترنتی
www.yellow.com صفحات زرد اینترنت
راهب. newmail.ru موتورهای جستجوی پروفایل های مختلف
www.top200.ru 200 وب سایت برتر
www.allru.net
www.ru کاتالوگ منابع اینترنتی روسیه
www.allru.net/z09. htm منابع آموزشی
www.students.ru سرور دانشجوی روسی
www.cdo.ru/index_new. asp مرکز آموزش از راه دور
www.open. ac انگلستان دانشگاه آزاد انگلستان
www.ntu.edu دانشگاه ملی آمریکا
www.translate.ru مترجم متن الکترونیکی
www.pomorsu.ru/guide. library.html لیست پیوندهای کتابخانه های شبکه
www.elibrary.ru کتابخانه الکترونیک علمی
www.citforum.ru کتابخانه الکترونیکی
www.infamed.com/psy تست های روانشناسی
www.pokoleniye.ru سایت فدراسیون آموزش اینترنتی
www.method. people.ru منابع آموزشی
www.spb. www.osi.ru/ic/distant آموزش از راه دور در اینترنت
www.examen.ru امتحانات و تست ها
www.kbsu.ru/~book/ کتاب درسی علوم کامپیوتر
عظیم. km.ru دایره المعارف ها و لغت نامه ها

جستجوی اطلاعات در اینترنت: دام

مشکلاتی که در سطح ظاهر نمی شوند، اغلب پس از اتمام مرحله خاصی از کار اکتشافی و شاید بر اساس نتایج آن، قبلاً تصمیماتی گرفته شده باشد، خود را فقط "در گذشته" احساس می کنند. چه چیزی مانع از شفاف شدن وضعیت از همان ابتدای راه اندازی این یا آن سیستم بازیابی اطلاعات (IPS) می شود؟ پاسخ بسیار ساده است: فقدان اطلاعات جامع از این نوع از سوی توسعه دهنده. پیامد مستقیم این امر غیرقابل اعتماد بودن داده های دریافتی و از دست دادن کنترل نشده آنهاست. به ندرت می توان موتور جستجویی را در وب پیدا کرد که برخی از ویژگی های "غیر مستند" را نداشته باشد. به نظر می رسد که کاربر به اطلاعات زیادی نیاز ندارد، یعنی:

پایگاه داده IPS چگونه پر می شود و حجم آن چقدر است.

طیف گسترده ای از امکانات زبان جستجوی سیستم؛

ویژگی های اصلی ارائه نتایج جستجو، در درجه اول الگوریتم برای رتبه بندی رکوردها از لیست پاسخ ها به یک پرس و جو.

افسوس، منبع چنین اطلاعاتی معمولاً سندی نیست که از صفحه اصلی سرور جستجو در دسترس است، بلکه انتشارات نویسندگان فردی است که در وب، کتاب ها و مجلات رایانه ای پراکنده شده اند. دلایل این وضعیت ظاهراً نه تنها شامل سهل انگاری توسعه دهنده، بلکه عاملی به نام سیاست بازاریابی است. به زبان ساده، ارائه کامل ترین اطلاعات موتور جستجو در مورد خود، همیشه تأثیر مثبتی در رتبه بندی آن ندارد. با این وجود، در برخی موارد، کاربر کاملاً قادر است وضعیت را تحت کنترل درآورد. اغلب می توان با کمک آزمایش به ویژگی های سرویس جستجوی انتخابی پی برد. ایجاد پرس و جوهای آزمایشی ویژه که به سرعت دقیقاً جنبه ای از عملکرد سیستم را که برای کار فعلی مهم است، روشن می کند، در بسیاری از موارد بی اهمیت است. نحوه جلوگیری از برخی از مشکلات هنگام کار با IPS، بحث خود را اختصاص خواهیم داد. به عنوان مثال هایی که ارائه را نشان می دهد، موتورهای جستجوی اینترنتی شناخته شده در سطح وسیع در نظر گرفته خواهند شد.