جستجوی اطلاعات در اینترنت

اینترنت با سرعت بسیار بالایی در حال رشد است، پس پیدا کنید اطلاعات لازمدر میان صدها میلیارد صفحه وب و صدها میلیون فایل، به طور فزاینده ای پیچیده می شود. برای جستجوی اطلاعات از موتورهای جستجوی ویژه ای استفاده می شود که حاوی اطلاعات به روز شده دائمی در مورد مکان صفحات وب و فایل ها در صدها میلیون سرور اینترنتی است.

موتورهای جستجو حاوی اطلاعات گروه بندی موضوعی در مورد منابع اطلاعاتی شبکه جهانی وب در پایگاه های داده هستند. برنامه های ربات ویژه به طور دوره ای وب سرورهای اینترنتی را دور می زنند، تمام اسنادی را که با آنها روبرو می شوند مطالعه می کنند، کلمات کلیدی را در آنها برجسته می کنند و آدرس اینترنتی اسناد را در پایگاه داده وارد می کنند.

اکثر موتورهای جستجو به نویسنده یک وب سایت اجازه می دهند تا با پر کردن فرم ثبت نام، اطلاعات را در پایگاه داده وارد کند. در فرآیند پر کردن پرسشنامه، توسعه دهنده سایت آدرس سایت، نام آن را وارد می کند. توضیح کوتاهمحتوای سایت و همچنین کلمات کلیدی که یافتن سایت را آسان تر می کند.

جستجو بر اساس کلمات کلیدیجستجو برای یک سند در پایگاه داده سیستم جستجو با وارد کردن پرس و جو در انجام می شود فیلد جستجو.

پرس و جو باید حاوی یک یا چند کلمه کلیدی باشد که در این سند مرکزی هستند. به عنوان مثال، برای جستجوی خود موتورهای جستجوی اینترنتی، می توانید کلمات کلیدی " را وارد کنید. سیستم روسیجستجوی اطلاعات در اینترنت" (شکل 6.21).

مدتی پس از ارسال درخواست، موتور جستجو لیستی از آدرس های اینترنتی اسنادی را که کلمات کلیدی مشخص شده در آنها پیدا شده است، برمی گرداند. برای مشاهده این سند در مرورگر، کافی است پیوندی را که به آن اشاره می کند فعال کنید (شکل 6.22).

اگر کلمات کلیدی ضعیف انتخاب شده باشند، ممکن است فهرست آدرس های سند بسیار بزرگ باشد (ممکن است ده ها یا حتی صدها هزار پیوند داشته باشد). به منظور کاهش لیست، می توانید کلمات کلیدی اضافی را در قسمت جستجو وارد کنید یا از دایرکتوری موتور جستجو استفاده کنید.

یکی از کامل ترین و قدرتمندترین موتورهای جستجو گوگل (www.google.ru) است که پایگاه داده آن 8 میلیارد صفحه وب را ذخیره می کند و هر ماه برنامه های روباتی 5 میلیون صفحه جدید به آن اضافه می کنند. در Runet (بخش روسی اینترنت)، موتورهای جستجوی Yandex (www.yandex.ru) و Rambler (www.rambler.ru) پایگاه داده های گسترده ای دارند که شامل 200 میلیون سند است.

جستجو در یک سیستم دایرکتوری سلسله مراتبیدر پایگاه داده موتورهای جستجو، وب سایت ها به گروه بندی می شوند کاتالوگ های موضوعی سلسله مراتبی، که مشابه فهرست موضوعی در یک کتابخانه هستند.

بخش های موضوعی سطح بالا، به عنوان مثال: اینترنت، کامپیوتر، علم و آموزشو غیره، شامل زیر شاخه ها هستند. به عنوان مثال، دایرکتوری اینترنت ممکن است شامل دایرکتوری های فرعی باشد جستجو، ایمیلو غیره (شکل 6.23).

جستجوی اطلاعات در کاتالوگ به انتخاب یک کاتالوگ خاص خلاصه می شود و پس از آن لیستی از پیوندها به آدرس های اینترنتی پربازدیدترین و آموزنده ترین وب سایت ها به کاربر ارائه می شود. هر پیوند معمولاً دارای حاشیه نویسی است، یعنی حاوی یک تفسیر کوتاه در مورد محتوای سند است.

کاملترین کاتالوگ موضوعی سلسله مراتبی چند سطحی منابع اینترنتی به زبان روسی در سیستم جستجوی Aport (www.aport.ru) موجود است. کاتالوگ حاوی خلاصه ای دقیق از محتوای وب سایت ها و نشانی از موقعیت جغرافیایی آنها است.

جستجوی فایل ها.برای جستجوی فایل ها در سرورهای آرشیو فایل، موتورهای جستجوی تخصصی از جمله موتور جستجوی FileSearch (www.filesearch.ru) وجود دارد. برای جستجوی فایل، باید نام فایل را در قسمت جستجو وارد کنید و موتور جستجو آدرس اینترنتی سرورهای آرشیو فایل را که فایل با نام مشخص شده در آن ذخیره شده است، برمی گرداند.

جستجوی اطلاعات در بخش روسی زبان اینترنت با استفاده از بیشترین موتورهای جستجو: Google، Rambler، Aport، Japs1ex و سیستم جستجوی فایل Research را می توان با استفاده از موتور جستجوی یکپارچه Gogle.ru انجام داد (شکل 6.24). برای انجام این کار، فقط کلمات کلیدی را در نوار جستجو وارد کنید، از سوئیچ ها برای تنظیم نوع اطلاعات مورد نیاز استفاده کنید و روی دکمه با نام موتور جستجو Gogle.ru کلیک کنید (شکل 6.24). برای انجام این کار، کافی است کلمات کلیدی را در نوار جستجو وارد کنید، با استفاده از سوئیچ ها نوع اطلاعات مورد نیاز را تنظیم کنید و روی دکمه با نام موتور جستجو کلیک کنید.


برنج. 6.24. موتور جستجوی یکپارچه Gogle.ru

راه های جستجو در اینترنت

سه راه برای جستجو در اینترنت

اینترنت به طور کلی و شبکه جهانی وب به طور خاص دسترسی مشترک به هزاران سرور و میلیون ها صفحه وب را فراهم می کند که حجم غیرقابل تصوری از اطلاعات را ذخیره می کنند. چگونه در این "اقیانوس اطلاعات" گم نشویم؟ برای این کار باید نحوه جستجو و یافتن اطلاعات لازم در اینترنت را بیاموزید.

همانطور که قبلا ذکر شد، سه راه اصلی برای جستجوی اطلاعات در اینترنت وجود دارد.

1. مشخص کردن آدرس صفحهاین بیشترین است راه سریعجستجو کنید، اما تنها در صورتی می توان از آن استفاده کرد که آدرس دقیق سند مشخص باشد.

2. ناوبری از طریق هایپرلینک هااین کمترین روش راحت است، زیرا با کمک آن می توانید اسنادی را جستجو کنید که فقط از نظر معنایی به سند فعلی نزدیک هستند. اگر سند فعلی، به عنوان مثال، به موسیقی اختصاص داده شده است، پس با استفاده از پیوندهای موجود در این سند بعید است که بتوانید به سایت اختصاص یافته به ورزش دسترسی پیدا کنید.

3. تماس با سرور جستجو ( موتور جستجو) . استفاده از سرورهای جستجو راحت ترین راه برای یافتن اطلاعات است. در حال حاضر، موتورهای جستجوی زیر در بخش روسی زبان اینترنت محبوب هستند:

    Yandex;
    رامبلر;
    پورت.

موتورهای جستجوی دیگری نیز وجود دارد. مثلا، سیستم کارآمدجستجو در سرور اجرا شده است سرویس پستی mail.ru.

جستجو در سرورها

مقرون به صرفه ترین و به روشی مناسبجستجوی اطلاعات در شبکه جهانی وباستفاده از موتورهای جستجو است. در این مورد، اطلاعات را می توان از طریق کاتالوگ ها و همچنین از طریق مجموعه ای از کلمات کلیدی مشخص کننده سند متنی مورد جستجو جستجو کرد.

بیایید استفاده از سرورهای جستجو را با جزئیات بیشتری بررسی کنیم. سرور جستجوحاوی تعداد زیادی لینک به بیشترین اسناد مختلف، و همه این پیوندها در کاتالوگ های موضوعی سیستماتیک شده اند. به عنوان مثال: ورزش، سینما، ماشین، بازی، علم و غیره علاوه بر این، این لینک ها توسط سرور به طور مستقل، در حالت خودکاربا مشاهده منظم تمام صفحات وب ظاهر شده در وب جهانی. علاوه بر این، موتورهای جستجو امکان جستجوی اطلاعات با استفاده از کلمات کلیدی را در اختیار کاربر قرار می دهند. پس از وارد کردن کلمات کلیدی، سرور جستجو شروع به مشاهده اسناد در سایر سرورهای وب و نمایش پیوندهایی به اسنادی می کند که کلمات مشخص شده در آنها ظاهر می شود. معمولاً، نتایج جستجو به ترتیب نزولی بر اساس رتبه‌بندی سند خاصی مرتب می‌شوند، که نشان می‌دهد یک سند معین تا چه اندازه با عبارات جستجو مطابقت دارد یا هر چند وقت یک‌بار درخواست آنلاین می‌شود.

زبان درخواست موتور جستجو

گروهی از کلمات کلیدی که بر اساس قوانین خاصی - با استفاده از زبان پرس و جو - تشکیل شده اند، درخواست به سرور جستجو نامیده می شوند. زبان های پرس و جو برای سرورهای جستجوی مختلف بسیار مشابه هستند. می توانید با مراجعه به بخش "راهنما" سرور جستجوی مورد نظر در این زمینه اطلاعات بیشتری کسب کنید. بیایید به عنوان مثال به قوانین تشکیل پرس و جو با استفاده از موتور جستجوی Yandex نگاه کنیم.

نحو اپراتور اپراتور یعنی چه؟ درخواست نمونه
فضا یا & منطقی و (در یک جمله) فیزیوتراپی
&& منطقی و (داخل سند) دستور العمل ها و و (پنیر فرآوری شده)
| منطقی OR عکس | عکاسی | عکس فوری | تصویر عکاسی
+ وجود کلمه در سند یافت شده الزامی است بودن یا نبودن
() گروه بندی کلمات (تکنولوژی | تولید) (پنیر | پنیر دلمه)
~ اپراتور باینریو نه (در یک جمله) بانک ها ~ قانون
~~
یا
_
عملگر باینری AND NOT (در داخل سند) راهنمای پاریس ~~ (آژانس | تور)
/(n متر) فاصله در کلمات (منهای (-) - عقب، به علاوه (+) - جلو) تامین کنندگان /2 موسیقی قهوه /(-2 4) جای خالی آموزش ~ /+1 دانش آموز
" " عبارت را جستجو کنید «کلاه قرمز کوچولو» معادل: قرمز /+1 سرپوش
&&/(n متر) فاصله در جملات (منهای (-) - عقب، به علاوه (+) - جلو) بانک && /1 مالیات

بدست آوردن بالاترین امتیازهاجستجو کنید، باید چند قانون ساده را به خاطر بسپارید:

    1. اطلاعات را تنها با استفاده از یک کلمه کلیدی جستجو نکنید.

    2. بهتر است کلمات کلیدی را با حروف بزرگ وارد نکنید، زیرا ممکن است همان کلماتی که با حروف کوچک نوشته شده اند پیدا نشوند.

    3. اگر در نتیجه جستجوی خود هیچ نتیجه ای دریافت نکردید، بررسی کنید که آیا وجود دارد یا خیر کلید واژه ها x اشتباهات املایی

موتورهای جستجوی مدرن توانایی اتصال یک تحلیلگر معنایی را به یک پرس و جو تولید شده فراهم می کنند. با کمک آن می توانید کلمه ای را وارد کنید و اسنادی را انتخاب کنید که مشتقات این کلمه در موارد مختلف، زمان ها و غیره در آنها یافت می شود.

کنترل سوالات

1. اسناد با استفاده از کلمات کلیدی چگونه جستجو می شوند؟ در یک سیستم دایرکتوری؟

وظایف برای تکمیل مستقل

6.8 کار عملی. نتایج جستجوی اسناد را بر اساس کلمه کلیدی با استفاده از موتورهای جستجوی مختلف مقایسه کنید (از موتور جستجوی یکپارچه Gogle استفاده کنید).

6.9 کار عملی. فایل پخش کننده رسانه WinAmp را در سرورهای آرشیو فایل پیدا کنید.

این چیه

DuckDuckGo یک موتور جستجوی متن باز نسبتاً شناخته شده است. کد منبع. سرورها در ایالات متحده آمریکا قرار دارند. علاوه بر ربات خود، موتور جستجو از نتایج منابع دیگر استفاده می کند: یاهو، بینگ، ویکی پدیا.

بهتر

DuckDuckGo خود را به عنوان یک موتور جستجو قرار می دهد که حداکثر حریم خصوصی و محرمانه را فراهم می کند. این سیستم هیچ اطلاعاتی در مورد کاربر جمع آوری نمی کند، گزارش ها را ذخیره نمی کند (بدون سابقه جستجو)، استفاده می کند بیسکویت هاتا حد امکان محدود

DuckDuckGo اطلاعات شخصی کاربران را جمع آوری یا به اشتراک نمی گذارد. این سیاست حفظ حریم خصوصی ما است.

گابریل واینبرگ، بنیانگذار DuckDuckGo

چرا شما به این نیاز دارید

همه موتورهای جستجوی اصلی سعی می‌کنند نتایج جستجو را بر اساس داده‌های مربوط به شخص مقابل مانیتور شخصی‌سازی کنند. این پدیده "حباب فیلتر" نامیده می شود: کاربر فقط نتایجی را می بیند که با ترجیحات او مطابقت دارند یا سیستم چنین می داند.

تصویری عینی ایجاد می کند که به رفتار گذشته شما در اینترنت بستگی ندارد و موضوعی را حذف می کند تبلیغات گوگلو Yandex بر اساس درخواست شما. با DuckDuckGo جستجوی اطلاعات به زبان های خارجی آسان است، در حالی که Google و Yandex به طور پیش فرض به سایت های روسی زبان ترجیح می دهند، حتی اگر درخواست به زبان دیگری وارد شود.


این چیه

not Evil سیستمی است که شبکه Tor ناشناس را جستجو می کند. برای استفاده از آن باید به این شبکه بروید، مثلاً با راه اندازی یک .

نه ایول تنها موتور جستجو در نوع خود نیست. LOOK (جستجوی پیش‌فرض در مرورگر Tor) وجود دارد که از طریق آن قابل دسترسی است اینترنت معمولی) یا TORCH (یکی از قدیمی ترین موتورهای جستجو در شبکه Tor) و دیگران. ما به دلیل اشاره واضح گوگل (فقط به صفحه شروع نگاه کنید) روی نه شیطان قرار گرفتیم.

بهتر

جاهایی را جستجو می کند که گوگل، یاندکس و سایر موتورهای جستجو به طور کلی بسته هستند.

چرا شما به این نیاز دارید

شبکه Tor حاوی منابع بسیاری است که نمی توان آنها را در اینترنت مطیع قانون یافت. و با تشدید کنترل دولت بر محتوای اینترنت، تعداد آنها افزایش خواهد یافت. Tor نوعی شبکه درون اینترنت با شبکه‌های اجتماعی، ردیاب‌های تورنت، رسانه‌ها، پلتفرم های معاملاتی، وبلاگ ها، کتابخانه ها و غیره.

3. YaCy

این چیه

YaCy یک موتور جستجوی غیرمتمرکز است که بر اساس اصل شبکه های P2P کار می کند. هر کامپیوتری که کامپیوتر اصلی روی آن نصب شده است ماژول نرم افزار، اینترنت را به طور مستقل اسکن می کند، یعنی آنالوگ یک ربات جستجوگر است. نتایج به‌دست‌آمده در یک پایگاه داده مشترک جمع‌آوری می‌شوند که توسط همه شرکت‌کنندگان YaCy استفاده می‌شود.

بهتر

گفتن اینکه آیا این بهتر است یا بدتر دشوار است، زیرا YaCy یک رویکرد کاملاً متفاوت برای سازماندهی جستجو است. عدم وجود یک سرور و شرکت مالک، نتایج را کاملاً مستقل از ترجیحات هر کسی می کند. استقلال هر گره سانسور را از بین می برد. YaCy قادر به جستجو در وب عمیق و شبکه های عمومی غیر نمایه شده است.

چرا شما به این نیاز دارید

اگر از طرفداران نرم افزارهای متن باز و اینترنت رایگان، تحت تأثیر سازمان های دولتی و شرکت های بزرگ نیست، پس YaCy انتخاب شماست. همچنین می تواند برای سازماندهی جستجو در یک شرکت یا شبکه مستقل دیگر استفاده شود. و حتی با وجود اینکه YaCy در زندگی روزمره چندان کاربردی نیست، از نظر فرآیند جستجو جایگزین شایسته ای برای گوگل است.

4. پیپل

این چیه

Pipl سیستمی است که برای جستجوی اطلاعات در مورد یک شخص خاص طراحی شده است.

بهتر

نویسندگان Pipl ادعا می کنند که الگوریتم های تخصصی آنها کارآمدتر از موتورهای جستجوی معمولی جستجو می کنند. به ویژه، پروفایل ها در اولویت هستند شبکه های اجتماعی، نظرات، لیست شرکت کنندگان و پایگاه های اطلاعاتی مختلفی که اطلاعات افراد در آن منتشر می شود، مانند پایگاه های اطلاعات تصمیمات دادگاه. رهبری Pipl در این زمینه توسط ارزیابی های Lifehacker.com، TechCrunch و سایر نشریات تایید شده است.

چرا شما به این نیاز دارید

اگر نیاز به یافتن اطلاعاتی در مورد شخصی که در ایالات متحده زندگی می کند دارید، Pipl بسیار موثرتر از Google خواهد بود. پایگاه‌های اطلاعاتی دادگاه‌های روسیه ظاهراً برای موتور جستجو غیرقابل دسترسی است. بنابراین، او به خوبی با شهروندان روسیه کنار نمی آید.

این چیه

FindSounds یکی دیگر از موتورهای جستجوی تخصصی است. صداهای مختلف را در منابع باز جستجو می کند: خانه، طبیعت، اتومبیل، مردم و غیره. این سرویس از پرس و جوهای روسی پشتیبانی نمی کند، اما لیست قابل توجهی از برچسب های روسی زبان وجود دارد که می توانید از آنها برای جستجو استفاده کنید.

بهتر

خروجی فقط شامل صداها و هیچ چیز اضافی است. در تنظیمات می توانید فرمت و کیفیت صدای دلخواه را تنظیم کنید. تمام صداهای یافت شده برای دانلود در دسترس هستند. جستجو بر اساس الگو وجود دارد.

چرا شما به این نیاز دارید

اگر می خواهید به سرعت صدای شلیک تفنگ، ضربات دارکوب شیرخوار یا فریاد هومر سیمپسون را بیابید، این سرویس برای شما مناسب است. و ما این را فقط از پرس و جوهای موجود به زبان روسی انتخاب کردیم. بر زبان انگلیسیطیف حتی گسترده تر است.

به طور جدی، یک سرویس تخصصی نیاز به مخاطبان متخصص دارد. اما اگر برای شما هم مفید باشد چه؟

این چیه

Wolfram|Alpha یک موتور جستجوی محاسباتی است. به جای پیوند به مقالات حاوی کلمات کلیدی، پاسخی آماده به درخواست کاربر ارائه می دهد. به عنوان مثال، اگر "مقایسه جمعیت نیویورک و سانفرانسیسکو" را در فرم جستجو به زبان انگلیسی وارد کنید، Wolfram|Alpha بلافاصله جداول و نمودارها را همراه با مقایسه نمایش می دهد.

بهتر

این سرویس نسبت به سایرین برای یافتن حقایق و محاسبه داده ها بهتر است. Wolfram|Alpha دانش موجود در وب را از طریق انباشته و سیستماتیک می کند مناطق مختلفاز جمله علم، فرهنگ و سرگرمی. در صورتی که این پایگاه حاوی پاسخ آماده به پرس و جو جستجو، سیستم آن را نشان می دهد، در غیر این صورت محاسبه می کند و نتیجه را نمایش می دهد. در این مورد، کاربر فقط هیچ چیز اضافی را نمی بیند.

چرا شما به این نیاز دارید

برای مثال اگر دانشجو، تحلیلگر، روزنامه نگار یا محقق هستید، می توانید از Wolfram|Alpha برای پیدا کردن و محاسبه داده های مربوط به کار خود استفاده کنید. این سرویس همه درخواست ها را درک نمی کند، اما دائما در حال توسعه و هوشمند شدن است.

این چیه

موتور Metasearch Dogpile لیست ترکیبی از نتایج موتورهای جستجو را نمایش می دهد نتایج گوگل، یاهو و سایر سیستم های محبوب.

بهتر

اول، Dogpile تبلیغات کمتری را نمایش می دهد. در مرحله دوم، این سرویس از یک الگوریتم ویژه برای یافتن و نشان دادن بهترین نتایج از موتورهای جستجوی مختلف استفاده می کند. به گفته توسعه دهندگان Dogpile، سیستم های آنها کامل ترین نتایج جستجو را در کل اینترنت ایجاد می کند.

چرا شما به این نیاز دارید

اگر نمی توانید اطلاعاتی را در گوگل یا سایر موتورهای جستجوی استاندارد دیگر پیدا کنید، با استفاده از Dogpile آن را در چندین موتور جستجو به طور همزمان جستجو کنید.

این چیه

BoardReader سیستمی برای جستجوی متن در انجمن ها، خدمات پرسش و پاسخ و سایر جوامع است.

بهتر

این سرویس به شما اجازه می دهد تا فیلد جستجوی خود را به پلتفرم های اجتماعی محدود کنید. به لطف فیلترهای ویژه، می توانید به سرعت پست ها و نظراتی را پیدا کنید که با معیارهای شما مطابقت دارند: زبان، تاریخ انتشار و نام سایت.

چرا شما به این نیاز دارید

BoardReader می تواند برای متخصصان روابط عمومی و سایر متخصصان رسانه که به نظر توده ها در مورد مسائل خاص علاقه مند هستند مفید باشد.

سرانجام

عمر موتورهای جستجوی جایگزین اغلب زودگذر است. لایف هکر از سرگئی پترنکو، مدیر کل سابق شعبه اوکراینی Yandex در مورد چشم انداز بلندمدت چنین پروژه هایی سوال کرد.


سرگئی پترنکو

مدیر کل سابق Yandex.Ukraine.

در مورد سرنوشت موتورهای جستجوی جایگزین، ساده است: پروژه های بسیار خاص با مخاطبان کوچک، بنابراین بدون چشم انداز تجاری روشن یا برعکس، با وضوح کامل عدم وجود آنها.

اگر به نمونه های مقاله نگاه کنید، می بینید که چنین موتورهای جستجو یا در یک جایگاه باریک اما محبوب تخصص دارند، که شاید هنوز آنقدر رشد نکرده است که در رادارهای گوگل یا یاندکس قابل توجه باشد، یا در حال آزمایش هستند. یک فرضیه اصلی در رتبه بندی، که هنوز در جستجوی معمولی قابل اجرا نیست.

به عنوان مثال، اگر یک جستجو در Tor به طور ناگهانی مورد تقاضا قرار گیرد، یعنی حداقل درصدی از مخاطبان گوگل به نتایج حاصل از آن نیاز داشته باشند، مطمئناً موتورهای جستجوی معمولی شروع به حل این مشکل می کنند که چگونه آنها را پیدا کنید و به کاربر نشان دهید. اگر رفتار مخاطب نشان دهد که برای بخش قابل توجهی از کاربران در تعداد قابل توجهی از پرس و جوها، نتایجی که بدون در نظر گرفتن عوامل بسته به کاربر ارائه می شود مرتبط تر به نظر می رسد، Yandex یا Google شروع به تولید چنین نتایجی خواهند کرد.

«بهتر بودن» در متن این مقاله به معنای «در همه چیز بهتر باشید» نیست. بله، از بسیاری جهات قهرمانان ما از Yandex دور هستند (حتی از Bing). اما هر یک از این خدمات چیزی را به کاربر می دهد که غول های صنعت جستجو نمی توانند ارائه دهند. حتما شما هم پروژه های مشابه را می شناسید. با ما به اشتراک بگذارید - بیایید بحث کنیم.

جستجوی اطلاعات در اینترنت

جستجوی اطلاعات در اینترنت

برای جستجوی اطلاعاتمعمولا استفاده می شوند سه راه(شکل 1 را ببینید). اولینکه - جستجو بر اساس آدرس. زمانی استفاده می شود که کاربر آدرس یک منبع اطلاعاتی حاوی اطلاعات مورد نیاز خود را بداند. هنگام سازماندهی جستجوی اطلاعات بر اساس آدرس (شکل آدرس - IP، دامنه یا URL - در این مورد مهم نیست)، کاربر فقط باید آدرس منبع را در قسمت مناسب مرورگر وارد کند - برنامه ای که برای دسترسی به منابع شبکه را فراهم می کند.

برنج. 1. روش های جستجوی اطلاعات در پایگاه داده های فرامتن

دومین- جستجو با استفاده از پیمایش هایپرلینک. هنگام استفاده از این نوع موارد جستجو، کاربر ابتدا باید به سرور مرتبط با پایگاه داده مربوطه دسترسی پیدا کند. سپس می توانید سند را با استفاده از لینک ها پیدا کنید. بدیهی است که این روش زمانی مناسب است که آدرس منبع برای کاربر ناشناخته باشد. پورتال های وب برای استفاده به عنوان نقطه شروع برای جستجو در هنگام اجرای این روش - سرورهایی که دسترسی مستقیم به مجموعه خاصی از سرورها، از جمله منابع اطلاعاتی نصب شده بر روی آنها، و همچنین برنامه های کاربردی وب که خدمات وب را که مطابق با هدف از پورتال سرورهای قابل دسترسی از طریق پورتال ممکن است متعلق به یک سیستم خاص (به عنوان مثال، شرکتی) یا سیستم های مختلفو به طور ویژه با توجه به نوع، موضوعی یا سایر ویژگی های اسناد و داده های موجود در وب سایت آنها انتخاب شوند. به طور معمول، پورتال ها عملکردهای مختلفی را با هم ترکیب می کنند تا مشتری را تا زمانی که ممکن است حفظ کنند. سرویس غالب پورتال سرویس است میز کمک: جستجو، دسته بندی ها، شاخص های مالی، اطلاعات آب و هوا و غیره اگر وب‌سایت‌ها در بیشتر موارد مجموعه‌ای از صفحات وب ثابت هستند، پورتال‌ها مجموعه هستند نرم افزارو اطلاعات از پیش ساختاریافته ای که این ابزارها به درخواست کاربران خاص به داده های ساخت یافته تبدیل می شوند.

سومروش جستجو شامل استفاده از سرورهای جستجوی اینترنتی است. سرورهای جستجو کامپیوترهای میزبان اختصاصی هستند که پایگاه داده منابع اینترنتی را میزبانی می کنند. رابط کاربریچنین سروری دارای یک فیلد برای وارد کردن کلمات کلیدی است که موضوع مورد علاقه کاربر را توصیف می کند (شکل 2 را ببینید).

شکل 2. نمای پنجره سرور جستجوی Yandex

سرور این کلمات را به عنوان یک درخواست اطلاعاتی درک می کند که مطابق آن منابع را جستجو می کند و لیستی از اسناد پیدا شده را به کاربر ارائه می دهد. بدیهی است که هنگام اجرای این روش خطاهای هر دو نوع 1 (از دست دادن هدف) و نوع 2 (نویز اطلاعات) امکان پذیر است. لازم به ذکر است سرورهای جستجو دو گروه هستند: موتورهای جستجو و کاتالوگ موضوعی. تفاوت آنها به دلیل روش ایجاد و متعاقباً پر کردن پایگاه داده منابع اینترنتی است که این سرورانجام می دهد بازیابی اطلاعات. بنابراین، موتورهای جستجو شامل برنامه ویژه- ربات جستجوگر به طور مداوم شبکه را رصد می کند، اطلاعات را از آن جمع آوری می کند صفحات وب، آنها را ایندکس می کند و تصویر جستجوی آنها را در پایگاه داده خود ثبت می کند. در کاتالوگ های موضوعی، پایگاه داده ای از اسناد اینترنتی "به صورت دستی" توسط ویراستاران متخصص ایجاد می شود. از آنجایی که هیچ اداره واحدی در اینترنت وجود ندارد، منابع اطلاعاتی آن به طور مداوم در حال تغییر است. ممکن است اسناد جدید در آن ظاهر شود و اسناد موجود ممکن است ناپدید شوند. دفعات به روز رسانی اطلاعات در اسناد برای سایت های مختلف متفاوت است: برای برخی چندین بار در ساعت، برای برخی یک بار در روز، روز، ماه و غیره است. بنابراین، درک این نکته بسیار مهم است که هنگام استفاده از سیستم‌های بازیابی اطلاعات برای یافتن اطلاعات در اینترنت، جستجو در فضای واقعی اسناد اینترنتی انجام نمی‌شود، بلکه در برخی مدل‌ها، محتوای آن ممکن است به طور قابل توجهی با واقعی متفاوت باشد. محتوای اینترنتی در زمان جستجو بر اساس پوشش منابع نمایه شده، موتورهای جستجو را می توان به دو گروه بین المللی و روسی زبان تقسیم کرد. اولین ها تمام اسناد منتشر شده در اینترنت را در یک ردیف فهرست می کنند. منابع شاخص دوم واقع در مناطق دامنهبا غلبه زبان روسی. لیست محبوب ترین سیستم ها در جدول آورده شده است. 1.

جدول 1. محبوب ترین موتورهای جستجو

بین المللی روسی زبان
گوگل Yandex (44.4٪ از Runet)
یاهو Rambler (10.6% Runet)
بینگ Mail.ru (7.3٪ از Runet)
MSN Nigma (0.5٪ از Runet)
AltaVista Gogo.ru (0.3٪ از Runet)
پرسیدن Aport (0.2٪ از Runet)

توجه: Runet بخش روسی زبان اینترنت است که شامل دامنه هایی با نام است ru و RF.

لازم به ذکر است که دسته خاصی از سرورهای جستجو – موتورهای متاجستجو وجود دارد. تفاوت اساسی آنها با موتورهای جستجوو کاتالوگ های موضوعی این است که پایگاه داده فهرست خود را ندارند، و بنابراین، با دریافت درخواست کاربر، آن را به طور همزمان به چندین سرور جستجو هدایت می کنند (شکل 3 را ببینید).

برنج. 3. طرح عملکرد سیستم متاجستجو

توانایی استفاده همزمان از چندین موتور جستجو برای یک پرس و جو، مزیت آشکار موتورهای متاجستجو است. در حال حاضر، سیستم Metabot.ru که رابط کاربری آن در شکل 1 نشان داده شده است، کاربرد گسترده ای پیدا کرده است. 4. این سیستم به شما امکان می دهد از سرورهای جستجوی بین المللی و روسی زبان برای جستجوی منابع استفاده کنید.

ارسال کار خوب خود در پایگاه دانش ساده است. از فرم زیر استفاده کنید

دانشجویان، دانشجویان تحصیلات تکمیلی، دانشمندان جوانی که از دانش پایه در تحصیل و کار خود استفاده می کنند از شما بسیار سپاسگزار خواهند بود.

اسناد مشابه

    ابزارهایی برای جستجوی اطلاعات در اینترنت. الزامات اساسی و روش های بازیابی اطلاعات. ساختار و ویژگی های خدمات جستجو. موتورهای جستجوی جهانی WWW (وب جهانی). برنامه ریزی برای جستجو و جمع آوری اطلاعات در اینترنت.

    چکیده، اضافه شده در 11/02/2010

    ویژگی های روش های جستجوی اطلاعات در اینترنت، یعنی استفاده از لینک های فرامتن، موتورهای جستجو و ابزارهای خاص. تجزیه و تحلیل منابع جدید اینترنتی تاریخچه پیدایش و شرح موتورهای جستجوی غربی و روسی زبان.

    چکیده، اضافه شده در 2010/05/12

    شرح و طبقه بندی سیستم های مدرن بازیابی اطلاعات اسناد فرا متنی بررسی و رتبه بندی موتورهای جستجوی بزرگ جهان. توسعه یک سیستم بازیابی اطلاعات که مکانیسم جستجوی اطلاعات در اینترنت را نشان می دهد.

    پایان نامه، اضافه شده در 1394/06/16

    تجزیه و تحلیل قابلیت های موتورهای جستجوی Yandex و Google، مقایسه آنها از نظر سودمندی. تاریخچه ایجاد موتورهای جستجو، ویژگی های رابط آنها، ابزارهای جستجو و الگوریتم ها. تشکیل سوال و معیارهای پاسخگویی به آن.

    چکیده، اضافه شده در 2011/05/07

    در نظر گرفتن موتورهای جستجوی اینترنتی به عنوان یک مجموعه نرم افزاری و سخت افزاری با رابط وب که امکان جستجوی اطلاعات را فراهم می کند. انواع موتورهای جستجو: Archie، Wandex، Aliweb، WebCrawler، AltaVista، Yahoo!، Google، Yandex، Bing و Rambler.

    چکیده، اضافه شده در 2013/05/10

    ساختار و اصول ساخت اینترنت، جستجو و ذخیره اطلاعات در آن. تاریخچه ظهور و طبقه بندی سیستم های بازیابی اطلاعات. اصل عملکرد و ویژگی های موتورهای جستجو گوگل، یاندکس، رامبلر، یاهو. جستجو بر اساس URL ها

    کار دوره، اضافه شده در 2013/03/29

    ماهیت و اصل عملیات شبکه جهانیاینترنت. جستجوی اطلاعات بر اساس پارامترهای موجود در سیستم گوگل. سیستم های تخصصی بازیابی اطلاعات: "KtoTam"، "Tagoo"، "Truveo"، "Kinopoisk"، "Ulov-Umov". استفاده مناسب از موتورهای جستجو

    ارائه، اضافه شده در 2015/02/16

    ذخیره سازی داده ها در شبکه های اینترنتی. اسناد فرا متنی، انواع فایل ها. فایل های گرافیکی، انواع و ویژگی های آنها. موتورهای جستجو و قوانین جستجوی اطلاعات بررسی موتورهای جستجوی اینترنتی همه چیز در مورد موتورهای جستجو Yandex، Google، Rambler.

    کار دوره، اضافه شده در 2011/03/26

اطلاعات کلی.

در حال حاضر، اینترنت صدها میلیون سرور را متحد می کند که میزبان میلیاردها سایت مختلف و فایل های جداگانه حاوی انواع مختلف اطلاعات هستند. این یک مخزن غول پیکر از اطلاعات است. روش های مختلفی برای جستجوی اطلاعات در اینترنت وجود دارد.

جستجو بر اساس آدرس شناخته شده آدرس های لازم از دایرکتوری ها گرفته می شود. با دانستن آدرس، فقط آن را وارد کنید نوار آدرسمرورگر.

www.gov.ru - سرور مقامات دولتی روسیه.

ساخت آدرس توسط کاربر با دانستن سیستم تشکیل آدرس های اینترنتی، می توانید آدرس ها را هنگام جستجوی وب سایت ها بسازید.

به کلمه کلیدی (نام یک شرکت، شرکت، سازمان یا یک اسم ساده انگلیسی)، باید یک دامنه موضوعی یا جغرافیایی اضافه کنید و باید شهود خود را به هم متصل کنید.

آدرس صفحات وب تجاری:

www.cnn.com (اخبار جهانی CNN)،

www.sony.com ( شرکت SONY),

www.mtv.com (اخبار موسیقی MTV).

آدرس موسسات آموزشی:

www.ntu.edu (دانشگاه ملی ایالات متحده).

آدرس سرورهای منطقه ای:

www.poland.net (لهستان)،

www.israil.net (اسرائیل).

موتورهای جستجوی اینترنتی

سیستم های بازیابی اطلاعات ویژه ای برای جستجوی اطلاعات در اینترنت ایجاد شده است. موتورهای جستجو دارای یک آدرس منظم هستند و به عنوان یک صفحه وب حاوی ابزارهای ویژه برای سازماندهی جستجوها (رشته جستجو، فهرست موضوعی، پیوندها) نمایش داده می شوند. برای فراخوانی یک موتور جستجو، کافی است آدرس آن را در نوار آدرس مرورگر وارد کنید.

با توجه به روش سازماندهی اطلاعات، سیستم های بازیابی اطلاعات به دو نوع طبقه بندی (rubricators) و فرهنگ لغت تقسیم می شوند.

دسته ها (طبقه بندی کننده ها) موتورهای جستجویی هستند که از سازماندهی سلسله مراتبی (درختی) اطلاعات استفاده می کنند. هنگام جستجوی اطلاعات، کاربر به عناوین موضوعی نگاه می کند و به تدریج فیلد جستجو را محدود می کند (به عنوان مثال، اگر شما نیاز به یافتن معنای یک کلمه دارید، ابتدا باید یک فرهنگ لغت را در طبقه بندی کننده پیدا کنید و سپس آن را در آن پیدا کنید. کلمه درست).

سیستم های جستجوی فرهنگ لغت، سیستم های نرم افزاری و سخت افزاری خودکار قدرتمندی هستند. با کمک آنها، اطلاعات در اینترنت مشاهده (اسکن) می شود. داده های مربوط به مکان این یا آن اطلاعات در فهرست های فهرست ویژه وارد می شود. در پاسخ به یک درخواست، جستجو با توجه به رشته پرس و جو انجام می شود. در نتیجه، آدرس‌هایی (URL) به کاربر ارائه می‌شود که کلمه یا گروهی از کلمات جستجو شده در زمان اسکن پیدا شده است. با انتخاب هر یک از آدرس های پیوند پیشنهادی، می توانید به سند پیدا شده بروید. بیشتر موتورهای جستجوی مدرن ترکیبی هستند.

معروف ترین و محبوب ترین موتورهای جستجو:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

سیستم هایی وجود دارند که در جستجو تخصص دارند منابع اطلاعاتدر جهات مختلف

جستجوی افراد در اینترنت:

www.whowhere.ru www. bigfoot.com

جستجو برای گروه های خبری (Usenet):

www.dejanews.com

موتورهای جستجوی موضوع:

جستجو کردن نرم افزار:

جستجو در آرشیو فایل:

http://ftpseach. city.ru، http://ftpsearch. licos.com

کاتالوگ ها (مجموعه های موضوعی پیوندها با حاشیه نویسی):

http://www.atrus.ru

اغلب، جستجوی موثر برای اطلاعات را می توان با استفاده از دایرکتوری های منطقه ای - سرورهای تخصصی حاوی داده های مربوط به شرکت ها یا منابع وب یک شهر یا منطقه انجام داد. به عنوان مثال، برای سنت پترزبورگ چنین فهرستی در http://www.spb.ru قرار دارد.

لیستی از IPS را می توانید در وب سایت www.monk بیابید. newmail.ru

فهرست دقیق تری از موتورهای جستجو و دایرکتوری ها در جدول ارائه شده است. 3.2.

قوانین برای اجرای درخواست ها

بخش راهنمای هر موتور جستجو اطلاعاتی در مورد نحوه جستجو و نحوه ساخت یک رشته جستجو ارائه می دهد. در زیر اطلاعاتی در مورد یک زبان پرس و جو معمولی و «متوسط» آمده است.

درخواست ساده

یک کلمه که موضوع جستجو را تعریف می کند وارد کنید. به عنوان مثال، در موتور جستجو Rambler.ru کافی است وارد کنید: اتوماسیون.

اسنادی یافت می شوند که حاوی کلمات مشخص شده در درخواست هستند. همه اشکال کلمات روسی به رسمیت شناخته می شوند؛ به عنوان یک قاعده، حروف بزرگ نادیده گرفته می شود.

می توانید از کاراکتر "*" یا "?" در پرس و جو استفاده کنید. امضا کردن "؟" در یک کلمه کلیدی، یک کاراکتر جایگزین می شود، که به جای آن می توان هر حرفی را جایگزین کرد و علامت "*" دنباله ای از کاراکترها است.

به عنوان مثال، query automatic* به شما امکان می دهد اسنادی را پیدا کنید که شامل کلمات automatic، automation و غیره است.

درخواست پیچیده

اغلب نیاز به ترکیب کلمات کلیدی برای به دست آوردن اطلاعات خاص تر وجود دارد. در این مورد، از کلمات پیوند دهنده اضافی، توابع، عملگرها، نمادها، ترکیبی از عملگرها که با براکت جدا شده اند استفاده می شود.

به عنوان مثال، query music & (beatles | beatles) به این معنی است که کاربر به دنبال اسنادی است که حاوی کلمات music و beatles یا music و beatles باشد.

جدول 3.1 قوانین مربوط به ایجاد درخواست های اتخاذ شده در سیستم Aport (http://www.aport.ru) را نشان می دهد.

جدول 3.1

اپراتورهایی برای تشکیل پرس و جو

اپراتور مترادف ها یک نظر
و و& پرس و جو اسناد حاوی هر دو کلمه کلیدی را پیدا می کند. شما مجبور نیستید آن را بنویسید. به عنوان مثال، پرس و جو: علوم کامپیوتر و کتاب درسی معادل کتاب درسی علوم کامپیوتر است
یا یا | جستجو برای آن دسته از اسنادی انجام می شود که از یکی از کلمات مشخص شده یا هر دو کلمه به طور همزمان استفاده می کنند.
نه نه - ~ جستجو محدود به اسنادی است که حاوی کلمه مشخص شده بعد از اپراتور نیستند
" " " " نقل قول های دوتایی یا تکی به شما امکان می دهد یک عبارت را پیدا کنید
تاریخ = date:date= جستجو محدود به اسنادی است که در محدوده تاریخ مشخص شده قرار می گیرند. مثال 1. ارز date=01/02/2002-01/03/2002. این درخواست اسنادی حاوی کلمه "ارز" و دارای تاریخ از 1 فوریه 2002 تا 1 مارس 2002 ارائه می کند. مثال 2. date = 01/03/2002 واحد پولی مثال 3. تاریخ:<02/03/2002 валюта

جدول 3.2

لیست موتورهای جستجو و دایرکتوری ها

نشانی شرح
www.excite.com موتور جستجو با نظرات و راهنماهای سایت
www.alta-vista.com سرور جستجو، قابلیت های جستجوی پیشرفته در دسترس است
www.hotbot.com سرور جستجو
www.poland.net www.israil.net سرورهای جستجوی منطقه ای لهستان، اسرائیل
www.ifoseek.com سرور جستجو (استفاده آسان)
www.ipl.org کتابخانه عمومی اینترنتی، یک کتابخانه عمومی که در چارچوب پروژه دهکده جهانی فعالیت می کند
www.wisewire.com WiseWire - سازمان جستجو با استفاده از هوش مصنوعی
www.webcrawler.com WebCrawler - سرور جستجو، آسان برای استفاده
www.yahoo.com CatalogWeb و رابط برای دسترسی به جستجوی متن کامل در سرور AltaVista
www.aport.ru Aport - سرور جستجوی روسی زبان
www.yandex.ru Yandex - سرور جستجوی روسی زبان
www.rambler.ru Rambler - سرور جستجوی روسی زبان
منابع راهنمایی اینترنتی
www.yellow.com صفحات زرد اینترنت
راهب newmail.ru موتورهای جستجوی پروفایل های مختلف
www.top200.ru 200 وب سایت برتر
www.allru.net
www.ru کاتالوگ منابع اینترنتی روسیه
www.allru.net/z09. htm منابع آموزشی
www.students.ru سرور دانشجوی روسی
www.cdo.ru/index_new. asp مرکز آموزش از راه دور
www.open. ac انگلستان دانشگاه آزاد انگلستان
www.ntu.edu دانشگاه ملی آمریکا
www.translate.ru مترجم متن الکترونیکی
www.pomorsu.ru/guide. library.html لیست پیوندهای کتابخانه های شبکه
www.elibrary.ru کتابخانه الکترونیک علمی
www.citforum.ru کتابخانه دیجیتال
www.infamed.com/psy تست های روانشناسی
www.pokoleniye.ru وب سایت فدراسیون آموزش اینترنتی
www.method. narod.ru منابع آموزشی
www.spb. osi.ru/ic/distant آموزش از راه دور در اینترنت
www.examen.ru امتحانات و تست ها
www.kbsu.ru/~book/ کتاب درسی علوم کامپیوتر
عظیم. km.ru دایره المعارف ها و لغت نامه ها

جستجوی اطلاعات در اینترنت: دام

مشکلاتی که در ظاهر نیستند، اغلب پس از تکمیل مرحله مشخصی از کار جستجو و احتمالاً، بر اساس نتایج آن، قبلاً تصمیم گرفته شده است، خود را فقط "در آینده" احساس می کنند. چه چیزی مانع از شفاف سازی وضعیت از همان ابتدای راه اندازی این یا آن سیستم بازیابی اطلاعات (IRS) می شود؟ پاسخ بسیار ساده است: فقدان اطلاعات جامع از این نوع از سوی توسعه دهنده. پیامد مستقیم این امر غیر قابل اعتماد بودن داده های دریافتی و از دست دادن کنترل نشده آن است. به ندرت می توان موتور جستجویی را در اینترنت پیدا کرد که برخی از ویژگی های "غیر مستند" را نداشته باشد. به نظر می رسد که کاربر به اطلاعات زیادی نیاز ندارد، یعنی:

پایگاه داده IPS چگونه پر می شود و حجم آن چقدر است.

طیف کاملی از قابلیت های زبان جستجوی سیستم؛

ویژگی های اصلی ارائه نتایج جستجو، در درجه اول الگوریتم برای رتبه بندی رکوردها از لیست پاسخ ها به یک پرس و جو.

افسوس، منبع چنین اطلاعاتی معمولاً سندی نیست که از صفحه اصلی یک سرور جستجو قابل دسترسی است، بلکه انتشارات نویسندگان فردی است که در اینترنت، کتاب ها و مجلات رایانه ای پراکنده شده اند. دلایل این وضعیت ظاهراً نه تنها شامل سهل انگاری توسعه دهنده، بلکه عاملی به نام سیاست بازاریابی است. به زبان ساده، ارائه کامل ترین اطلاعات در مورد خود یک موتور جستجو همیشه تأثیر مثبتی بر رتبه آن ندارد. با این حال، در برخی موارد کاربر کاملاً قادر به کنترل اوضاع است. اغلب می توان از طریق آزمایش به ویژگی های عملیاتی یک سرویس جستجوی انتخابی پی برد. ایجاد پرس و جوهای آزمایشی ویژه که به سرعت دقیقاً جنبه ای از عملکرد سیستم را که برای کار فعلی مهم است، روشن می کند، در بسیاری از موارد بی اهمیت است. ما بحث خود را به نحوه جلوگیری از برخی مشکلات هنگام کار با IPS اختصاص خواهیم داد. به عنوان مثال برای نشان دادن ارائه، موتورهای جستجوی معروف اینترنتی در نظر گرفته خواهند شد.