Αναζήτηση πληροφοριών στο Διαδίκτυο

Το Διαδίκτυο αναπτύσσεται με πολύ γρήγορους ρυθμούς, οπότε βρείτε απαραίτητες πληροφορίεςανάμεσα σε εκατοντάδες δισεκατομμύρια ιστοσελίδες και εκατοντάδες εκατομμύρια αρχεία, γίνεται όλο και πιο δύσκολο. Για την αναζήτηση πληροφοριών, χρησιμοποιούνται ειδικές μηχανές αναζήτησης, οι οποίες περιέχουν συνεχώς ενημερωμένες πληροφορίες σχετικά με τη θέση ιστοσελίδων και αρχείων σε εκατοντάδες εκατομμύρια διακομιστές Διαδικτύου.

Οι μηχανές αναζήτησης περιέχουν θεματικά ομαδοποιημένες πληροφορίες σχετικά με τους πόρους πληροφοριών του Παγκόσμιου Ιστού σε βάσεις δεδομένων. Ειδικά προγράμματα-ρομπότ περιοδικά «παρακάμπτουν» τους διακομιστές Διαδικτύου, διαβάζουν όλα τα έγγραφα που συναντώνται, επισημαίνουν λέξεις-κλειδιά σε αυτά και εισάγουν διευθύνσεις Διαδικτύου εγγράφων στη βάση δεδομένων.

Οι περισσότερες μηχανές αναζήτησης επιτρέπουν στον συγγραφέα του ιστότοπου να εισάγει πληροφορίες στη βάση δεδομένων συμπληρώνοντας μια φόρμα εγγραφής. Κατά τη διαδικασία συμπλήρωσης του ερωτηματολογίου, ο προγραμματιστής του ιστότοπου εισάγει τη διεύθυνση του ιστότοπου, το όνομά του, Σύντομη περιγραφήτο περιεχόμενο του ιστότοπου, καθώς και τις λέξεις-κλειδιά με τις οποίες θα είναι πιο εύκολο να βρείτε τον ιστότοπο.

Αναζήτηση με λέξη κλειδί.Η αναζήτηση για ένα έγγραφο στη βάση δεδομένων της μηχανής αναζήτησης πραγματοποιείται με την εισαγωγή ερωτημάτων σε κουτί αναζήτησης.

Το αίτημα πρέπει να περιέχει μία ή περισσότερες λέξεις-κλειδιά που είναι οι κύριες για αυτό το έγγραφο. Για παράδειγμα, για να αναζητήσετε τις ίδιες τις μηχανές αναζήτησης στο Διαδίκτυο, μπορείτε να εισαγάγετε τις λέξεις-κλειδιά " Ρωσικό σύστημααναζήτηση πληροφοριών στο Διαδίκτυο "(Εικ. 6.21).

Λίγο καιρό μετά την αποστολή του αιτήματος, η μηχανή αναζήτησης θα επιστρέψει μια λίστα με διευθύνσεις Διαδικτύου με έγγραφα στα οποία βρέθηκαν οι καθορισμένες λέξεις-κλειδιά. Για να δείτε αυτό το έγγραφο στο πρόγραμμα περιήγησης, αρκεί να ενεργοποιήσετε τον σύνδεσμο που δείχνει προς αυτό (Εικ. 6.22).

Εάν οι λέξεις-κλειδιά επιλέχθηκαν ανεπιτυχώς, τότε η λίστα των διευθύνσεων των εγγράφων μπορεί να είναι πολύ μεγάλη (μπορεί να περιέχει δεκάδες ή και εκατοντάδες χιλιάδες συνδέσμους). Για να περιορίσετε τη λίστα, μπορείτε να εισαγάγετε πρόσθετες λέξεις-κλειδιά στο πεδίο αναζήτησης ή να χρησιμοποιήσετε τον κατάλογο της μηχανής αναζήτησης.

Μία από τις πιο ολοκληρωμένες και ισχυρές μηχανές αναζήτησης είναι η Google (www.google.ru), η οποία αποθηκεύει 8 δισεκατομμύρια ιστοσελίδες στη βάση δεδομένων της και 5 εκατομμύρια νέες σελίδες εισάγονται από ρομπότ κάθε μήνα. Στο Runet (το ρωσικό τμήμα του Διαδικτύου), εκτεταμένες βάσεις δεδομένων που περιέχουν 200 εκατομμύρια έγγραφα η καθεμία διαθέτουν μηχανές αναζήτησης Yandex (www.yandex.ru) και Rambler (www.rambler.ru).

Αναζήτηση σε ένα ιεραρχικό σύστημα καταλόγων.Σε μια βάση δεδομένων μηχανών αναζήτησης, οι τοποθεσίες Web ομαδοποιούνται σε ιεραρχικούς καταλόγους θεμάτων, τα οποία είναι ανάλογα με έναν θεματικό κατάλογο σε μια βιβλιοθήκη.

Θεματικές ενότητες ανώτατου επιπέδου, για παράδειγμα: Διαδίκτυο, υπολογιστές, επιστήμη και εκπαίδευσηκαι ούτω καθεξής, περιέχουν ένθετους καταλόγους. Για παράδειγμα, ο κατάλογος Internet μπορεί να περιέχει υποκαταλόγους Αναζήτηση, αλληλογραφίακαι άλλα (Εικ. 6.23).

Η αναζήτηση πληροφοριών σε έναν κατάλογο περιορίζεται στην επιλογή ενός συγκεκριμένου καταλόγου, μετά τον οποίο θα παρουσιαστεί στον χρήστη μια λίστα με συνδέσμους προς τις διευθύνσεις Διαδικτύου των τοποθεσιών Web με τις περισσότερες επισκέψεις και με νόημα. Κάθε σύνδεσμος είναι συνήθως σχολιασμένος, δηλαδή περιέχει ένα σύντομο σχόλιο για το περιεχόμενο του εγγράφου.

Η μηχανή αναζήτησης Aport (www.aport.ru) διαθέτει τον πληρέστερο ιεραρχικό θεματικό κατάλογο πολλαπλών επιπέδων των ρωσόφωνων πόρων του Διαδικτύου. Ο κατάλογος περιέχει λεπτομερή σχολιασμό του περιεχομένου των τοποθεσιών Web και ένδειξη της γεωγραφικής τους θέσης.

Αναζήτηση αρχείων.Για την αναζήτηση αρχείων σε διακομιστές αρχειοθέτησης αρχείων, υπάρχουν εξειδικευμένες μηχανές αναζήτησης, συμπεριλαμβανομένης της μηχανής αναζήτησης FileSearch (www.filesearch.ru). Για να αναζητήσετε ένα αρχείο, πρέπει να εισαγάγετε το όνομα αρχείου στο πεδίο αναζήτησης και η μηχανή αναζήτησης θα επιστρέψει τις διευθύνσεις Διαδικτύου των διακομιστών αρχειοθέτησης αρχείων που αποθηκεύουν το αρχείο με το συγκεκριμένο όνομα.

Η αναζήτηση πληροφοριών στο ρωσόφωνο τμήμα του Διαδικτύου χρησιμοποιώντας τις περισσότερες μηχανές αναζήτησης: Google, Rambler, Aport, Applex και η μηχανή αναζήτησης αρχείων Research μπορεί να γίνει χρησιμοποιώντας την ενσωματωμένη μηχανή αναζήτησης Gogle.ru (Εικ. 6.24). Για να το κάνετε αυτό, απλώς εισάγετε λέξεις-κλειδιά στη γραμμή αναζήτησης, χρησιμοποιήστε τους διακόπτες για να ορίσετε τον τύπο των απαιτούμενων πληροφοριών και κάντε κλικ στο κουμπί με το όνομα της μηχανής αναζήτησης Gogle.ru (Εικ. 6.24). Για να το κάνετε αυτό, απλώς εισάγετε λέξεις-κλειδιά στη γραμμή αναζήτησης, χρησιμοποιήστε τους διακόπτες για να ορίσετε τον τύπο των απαιτούμενων πληροφοριών και κάντε κλικ στο κουμπί με το όνομα της μηχανής αναζήτησης.


Ρύζι. 6.24. Ενσωματωμένη μηχανή αναζήτησης Google.ru

Μέθοδοι αναζήτησης στο Διαδίκτυο

Τρεις τρόποι αναζήτησης στον Ιστό

Το Διαδίκτυο γενικά, και ο Παγκόσμιος Ιστός ειδικότερα, παρέχουν στον συνδρομητή πρόσβαση σε χιλιάδες διακομιστές και εκατομμύρια ιστοσελίδες που αποθηκεύουν μια αφάνταστη ποσότητα πληροφοριών. Πώς να μην χαθείτε σε αυτόν τον «ωκεανό πληροφοριών»; Για να το κάνετε αυτό, πρέπει να μάθετε πώς να αναζητάτε και να βρίσκετε τις απαραίτητες πληροφορίες στο δίκτυο.

Όπως αναφέρθηκε ήδη, υπάρχουν τρεις κύριοι τρόποι εύρεσης πληροφοριών στο Διαδίκτυο.

1. Καθορισμός της διεύθυνσης της σελίδας.Αυτό είναι το πιο γρήγορο τρόποαναζήτηση, αλλά μπορεί να χρησιμοποιηθεί μόνο εάν είναι γνωστή η ακριβής διεύθυνση του εγγράφου.

2. Πλοήγηση μέσω υπερσυνδέσμων.Αυτή είναι η λιγότερο βολική μέθοδος, καθώς μπορεί να χρησιμοποιηθεί για την αναζήτηση εγγράφων που έχουν νόημα μόνο κοντά στο τρέχον έγγραφο. Εάν το τρέχον έγγραφο είναι αφιερωμένο, για παράδειγμα, στη μουσική, τότε χρησιμοποιώντας τους υπερσυνδέσμους αυτού του εγγράφου, δύσκολα θα είναι δυνατή η πρόσβαση σε έναν ιστότοπο αφιερωμένο στον αθλητισμό.

3. Κλήση του διακομιστή αναζήτησης μηχανή αναζήτησης) . Η χρήση μηχανών αναζήτησης είναι ο πιο βολικός τρόπος για να βρείτε πληροφορίες. Επί του παρόντος, οι ακόλουθοι διακομιστές αναζήτησης είναι δημοφιλείς στο ρωσόφωνο τμήμα του Διαδικτύου:

    Yandex;
    Περιπλανώμενος υποκείμενο;
    Προς τα αριστερά.

Υπάρχουν και άλλες μηχανές αναζήτησης. Για παράδειγμα, αποτελεσματικό σύστημααναζήτηση που υλοποιείται στον διακομιστή υπηρεσία ταχυδρομείου mail.ru.

Αναζήτηση διακομιστών

Ο πιο προσιτός και βολικός τρόπος αναζήτησης πληροφοριών Παγκόσμιος Ιστόςείναι η χρήση μηχανών αναζήτησης. Ταυτόχρονα, οι πληροφορίες μπορούν να αναζητηθούν από καταλόγους, καθώς και από ένα σύνολο λέξεων-κλειδιών που χαρακτηρίζουν το έγγραφο κειμένου που αναζητήθηκε.

Εξετάστε τη χρήση των διακομιστών αναζήτησης με περισσότερες λεπτομέρειες. διακομιστή αναζήτησηςπεριέχει μεγάλο αριθμό συνδέσμων προς τα περισσότερα διάφορα έγγραφα, και όλοι αυτοί οι σύνδεσμοι οργανώνονται σε θεματικούς καταλόγους. Για παράδειγμα: σπορ, κινηματογράφος, αυτοκίνητα, παιχνίδια, επιστήμη κ.λπ. Επιπλέον, αυτοί οι σύνδεσμοι ορίζονται από τον διακομιστή ανεξάρτητα, στο αυτόματη λειτουργίαμε την τακτική προβολή όλων των ιστοσελίδων που εμφανίζονται στον Παγκόσμιο Ιστό. Επιπλέον, οι διακομιστές αναζήτησης παρέχουν στον χρήστη τη δυνατότητα αναζήτησης πληροφοριών με λέξεις-κλειδιά. Αφού εισαγάγετε λέξεις-κλειδιά, ο διακομιστής αναζήτησης ξεκινά την περιήγηση σε έγγραφα σε άλλους διακομιστές Web και εμφανίζει συνδέσμους προς εκείνα τα έγγραφα στα οποία βρίσκονται οι καθορισμένες λέξεις. Συνήθως, τα αποτελέσματα αναζήτησης ταξινομούνται με φθίνουσα σειρά με βάση μια ειδική βαθμολογία εγγράφων που υποδεικνύει πόσο καλά ένα δεδομένο έγγραφο ταιριάζει με τα κριτήρια αναζήτησης ή πόσο συχνά ζητείται στον ιστό.

Γλώσσα ερωτήματος μηχανής αναζήτησης

Μια ομάδα λέξεων-κλειδιών, που σχηματίζεται σύμφωνα με ορισμένους κανόνες - χρησιμοποιώντας τη γλώσσα ερωτήματος, ονομάζεται αίτημα προς τον διακομιστή αναζήτησης. Οι γλώσσες ερωτημάτων για διαφορετικές μηχανές αναζήτησης είναι πολύ παρόμοιες. Μπορείτε να μάθετε περισσότερα σχετικά με αυτό μεταβαίνοντας στην ενότητα "Βοήθεια" του επιθυμητού διακομιστή αναζήτησης. Εξετάστε τους κανόνες για τη δημιουργία ερωτημάτων χρησιμοποιώντας τη μηχανή αναζήτησης Yandex ως παράδειγμα.

Σύνταξη χειριστή Τι σημαίνει χειριστής Παράδειγμα αιτήματος
χώρο ή & Λογικό ΚΑΙ (εντός πρότασης) φυσιοθεραπεία
&& Λογικό ΚΑΙ (εντός του εγγράφου) συνταγές && (επεξεργασμένο τυρί)
| Λογικό Ή φωτογραφία | φωτογραφία | στιγμιότυπο | φωτογραφική εικόνα
+ Υποχρεωτική παρουσία της λέξης στο έγγραφο που βρέθηκε +να είσαι ή +να μην είσαι
() Ομαδοποίηση λέξεων (τεχνολογία | παραγωγή) (τυρί | τυρί cottage)
~ δυαδικός τελεστήςΚΑΙ ΟΧΙ (εντός της πρότασης) τράπεζες ~ νόμος
~~
ή
_
Δυαδικό ΚΑΙ ΟΧΙ τελεστής (εντός εγγράφου) Ταξιδιωτικός οδηγός Παρισιού ~~ (πρακτορείο | ξενάγηση)
/(nm) Απόσταση σε λέξεις (μείον (-) - πίσω, συν (+) - εμπρός) προμηθευτές /2 καφέ μουσική /(-2 4) κενές θέσεις εκπαίδευσης ~ /+1 μαθητές
" " Αναζήτηση φράσεων «κοκκινοσκουφίτσα» Ισοδύναμα: κόκκινη / +1 κουκούλα
&&/(nm) Απόσταση σε προτάσεις (μείον (-) - πίσω, συν (+) - εμπρός) τράπεζα && /1 φόροι

Αποκτώ κορυφαίες βαθμολογίεςαναζήτηση, πρέπει να θυμάστε μερικούς απλούς κανόνες:

    1. Μην αναζητάτε πληροφορίες για μία μόνο λέξη-κλειδί.

    2. Είναι καλύτερο να μην εισάγετε λέξεις-κλειδιά με κεφαλαία γράμματα, καθώς αυτό μπορεί να έχει ως αποτέλεσμα να μην βρεθούν οι ίδιες λέξεις γραμμένες με πεζά.

    3. Εάν η αναζήτησή σας δεν επέστρεψε κανένα αποτέλεσμα, ελέγξτε αν υπάρχουν λέξεις-κλειδιά x ορθογραφικά λάθη.

Οι σύγχρονες μηχανές αναζήτησης παρέχουν τη δυνατότητα σύνδεσης με το παραγόμενο αίτημα ενός σημασιολογικού αναλυτή. Με τη βοήθειά του, μπορείτε, εισάγοντας μια λέξη, να επιλέξετε έγγραφα στα οποία υπάρχουν παράγωγα αυτής της λέξης σε διάφορες περιπτώσεις, χρόνους κ.λπ.

ερωτήσεις δοκιμής

1. Πώς γίνεται η αναζήτηση εγγράφων με λέξεις-κλειδιά; Σε σύστημα καταλόγου;

Καθήκοντα για αυτοεκπλήρωση

6.8 Πρακτική εργασία. Συγκρίνετε τα αποτελέσματα αναζήτησης για έγγραφα ανά λέξη-κλειδί χρησιμοποιώντας διαφορετικές μηχανές αναζήτησης (χρησιμοποιήστε την ενσωματωμένη μηχανή αναζήτησης Google).

6.9 Πρακτική εργασία. Αναζητήστε τους διακομιστές αρχειοθέτησης αρχείων για το αρχείο αναπαραγωγής πολυμέσων WinAmp.

Τι είναι αυτό

Το DuckDuckGo είναι μια αρκετά γνωστή μηχανή αναζήτησης ανοιχτού κώδικα. πηγαίος κώδικας. Οι διακομιστές βρίσκονται στις ΗΠΑ. Εκτός από το δικό της ρομπότ, η μηχανή αναζήτησης χρησιμοποιεί τα αποτελέσματα άλλων πηγών: Yahoo, Bing, Wikipedia.

Το καλύτερο

Το DuckDuckGo τοποθετείται ως η απόλυτη αναζήτηση απορρήτου και απορρήτου. Το σύστημα δεν συλλέγει δεδομένα σχετικά με τον χρήστη, δεν αποθηκεύει αρχεία καταγραφής (χωρίς ιστορικό αναζήτησης), χρήση μπισκόταμέγιστο περιορισμένο.

Το DuckDuckGo δεν συλλέγει ούτε μοιράζεται προσωπικές πληροφορίες από χρήστες. Αυτή είναι η πολιτική απορρήτου μας.

Gabriel Weinberg, ιδρυτής του DuckDuckGo

Γιατί το χρειάζεστε αυτό

Όλες οι μεγάλες μηχανές αναζήτησης προσπαθούν να εξατομικεύσουν τα αποτελέσματα αναζήτησης με βάση δεδομένα σχετικά με το άτομο που βρίσκεται μπροστά από την οθόνη. Αυτό το φαινόμενο ονομάζεται "φούσκα φίλτρου": ο χρήστης βλέπει μόνο εκείνα τα αποτελέσματα που είναι συνεπή με τις προτιμήσεις του ή που το σύστημα θεωρεί ως τέτοια.

Σχηματίζει μια αντικειμενική εικόνα που δεν εξαρτάται από την προηγούμενη συμπεριφορά σας στον Ιστό και εξαλείφει τη θεματική διαφημίσεις googleκαι "Yandex", με βάση τα αιτήματά σας. Με τη βοήθεια του DuckDuckGo, είναι εύκολο να αναζητήσετε πληροφορίες σε ξένες γλώσσες, ενώ η Google και η Yandex προτιμούν ιστότοπους στη ρωσική γλώσσα από προεπιλογή, ακόμη και αν το ερώτημα έχει εισαχθεί σε άλλη γλώσσα.


Τι είναι αυτό

Το not Evil είναι ένα σύστημα που αναζητά το ανώνυμο δίκτυο Tor. Για να το χρησιμοποιήσετε, πρέπει να μεταβείτε σε αυτό το δίκτυο, για παράδειγμα, ξεκινώντας ένα εξειδικευμένο .

not Evil δεν είναι η μόνη μηχανή αναζήτησης του είδους της. Υπάρχει ένα LOOK (προεπιλεγμένη αναζήτηση στο πρόγραμμα περιήγησης Tor, διαθέσιμο από κανονικό internet) ή TORCH (μία από τις παλαιότερες μηχανές αναζήτησης στο δίκτυο Tor) και άλλες. Καταλήξαμε στο not Evil λόγω της αλάνθαστης υπαινιγμού για την Google (απλώς κοιτάξτε την αρχική σελίδα).

Το καλύτερο

Ψάχνει για το πού απαγορεύεται κατ' αρχήν η πρόσβαση στο Google, το Yandex και άλλες μηχανές αναζήτησης.

Γιατί το χρειάζεστε αυτό

Υπάρχουν πολλοί πόροι στο δίκτυο Tor που δεν μπορούν να βρεθούν στο νομοταγές Διαδίκτυο. Και ο αριθμός τους θα αυξηθεί καθώς ο έλεγχος των αρχών επί του περιεχομένου του Ιστού θα σφίγγει. Το Tor είναι ένα είδος δικτύου μέσα στον Ιστό με τα κοινωνικά δίκτυα, τους ιχνηλάτες torrent, τα μέσα, πλατφόρμες συναλλαγών, ιστολόγια, βιβλιοθήκες και ούτω καθεξής.

3. YaCy

Τι είναι αυτό

Το YaCy είναι μια αποκεντρωμένη μηχανή αναζήτησης που λειτουργεί με βάση την αρχή των δικτύων P2P. Κάθε υπολογιστής που έχει έναν κύριο μονάδα λογισμικού, σαρώνει μόνο του το Διαδίκτυο, δηλαδή είναι ανάλογο ενός ρομπότ αναζήτησης. Τα αποτελέσματα που λαμβάνονται συλλέγονται σε μια κοινή βάση δεδομένων, η οποία χρησιμοποιείται από όλους τους συμμετέχοντες στο YaCy.

Το καλύτερο

Είναι δύσκολο να πούμε εδώ αν αυτό είναι καλύτερο ή χειρότερο, καθώς το YaCy είναι μια εντελώς διαφορετική προσέγγιση στην οργάνωση της αναζήτησης. Η έλλειψη ενός μόνο διακομιστή και εταιρείας κατόχου καθιστά τα αποτελέσματα εντελώς ανεξάρτητα από τις προτιμήσεις του καθενός. Η αυτονομία κάθε κόμβου αποκλείει τη λογοκρισία. Το YaCy είναι σε θέση να πραγματοποιήσει αναζήτηση στον ιστό σε βάθος και σε μη ευρετηριασμένα δημόσια δίκτυα.

Γιατί το χρειάζεστε αυτό

Εάν είστε υποστηρικτής ανοιχτού κώδικα και δωρεάν internet, δεν επηρεάζεται από κυβερνητικούς φορείς και μεγάλες εταιρείες, τότε το YaCy είναι η επιλογή σας. Μπορεί επίσης να χρησιμοποιηθεί για την οργάνωση αναζητήσεων σε ένα εταιρικό ή άλλο αυτόνομο δίκτυο. Και παρόλο που το YaCy δεν είναι πολύ χρήσιμο στην καθημερινή ζωή, είναι μια άξια εναλλακτική της Google όσον αφορά τη διαδικασία αναζήτησης.

4. Πιπλ

Τι είναι αυτό

Το Pipl είναι ένα σύστημα που έχει σχεδιαστεί για την αναζήτηση πληροφοριών για ένα συγκεκριμένο άτομο.

Το καλύτερο

Οι συντάκτες του Pipl ισχυρίζονται ότι οι εξειδικευμένοι αλγόριθμοί τους αναζητούν πιο αποτελεσματικά από τις «κανονικές» μηχανές αναζήτησης. Ειδικότερα, τα προφίλ έχουν προτεραιότητα κοινωνικά δίκτυα, σχόλια, λίστες συμμετεχόντων και διάφορες βάσεις δεδομένων όπου δημοσιεύονται πληροφορίες για άτομα, όπως βάσεις δεδομένων δικαστικών αποφάσεων. Η ηγεσία της Pipl σε αυτόν τον τομέα επιβεβαιώνεται από το Lifehacker.com, το TechCrunch και άλλες εκδόσεις.

Γιατί το χρειάζεστε αυτό

Εάν πρέπει να βρείτε πληροφορίες για ένα άτομο που ζει στις ΗΠΑ, τότε το Pipl θα είναι πολύ πιο αποτελεσματικό από την Google. Οι βάσεις δεδομένων των ρωσικών δικαστηρίων, προφανώς, δεν είναι προσβάσιμες στη μηχανή αναζήτησης. Επομένως, δεν τα καταφέρνει τόσο καλά με τους πολίτες της Ρωσίας.

Τι είναι αυτό

Το FindSounds είναι μια άλλη εξειδικευμένη μηχανή αναζήτησης. Πραγματοποιεί αναζήτηση σε ανοιχτές πηγές για διάφορους ήχους: σπίτι, φύση, αυτοκίνητα, ανθρώπους και ούτω καθεξής. Η υπηρεσία δεν υποστηρίζει αιτήματα στα ρωσικά, αλλά υπάρχει μια εντυπωσιακή λίστα ετικετών στη ρωσική γλώσσα που μπορείτε να αναζητήσετε.

Το καλύτερο

Στην έκδοση μόνο ήχων και τίποτα παραπάνω. Στις ρυθμίσεις μπορείτε να ορίσετε την επιθυμητή μορφή και ποιότητα ήχου. Όλοι οι ήχοι που βρέθηκαν είναι διαθέσιμοι για λήψη. Υπάρχει αναζήτηση προτύπων.

Γιατί το χρειάζεστε αυτό

Εάν θέλετε να βρείτε γρήγορα τον ήχο ενός μουσκέτου, το χτύπημα ενός δρυοκολάπτη που ρουφάει ή το κλάμα του Homer Simpson, τότε αυτή η υπηρεσία είναι για εσάς. Και το επιλέξαμε μόνο από τα διαθέσιμα ερωτήματα στη ρωσική γλώσσα. Στο αγγλική γλώσσατο φάσμα είναι ακόμη ευρύτερο.

Σοβαρά, μια εξειδικευμένη υπηρεσία συνεπάγεται ένα εξειδικευμένο κοινό. Θα σου φανεί όμως χρήσιμο και σε σένα;

Τι είναι αυτό

Η Wolfram|Alpha είναι μια υπολογιστική μηχανή αναζήτησης. Αντί για συνδέσμους σε άρθρα που περιέχουν λέξεις-κλειδιά, δίνει μια έτοιμη απάντηση στο ερώτημα του χρήστη. Για παράδειγμα, εάν εισάγετε στη φόρμα αναζήτησης "συγκρίνετε τον πληθυσμό της Νέας Υόρκης και του Σαν Φρανσίσκο" στα αγγλικά, τότε το Wolfram|Alpha θα εμφανίσει αμέσως πίνακες και γραφήματα με σύγκριση.

Το καλύτερο

Αυτή η υπηρεσία είναι καλύτερη από άλλες για την εύρεση γεγονότων και τον υπολογισμό δεδομένων. Το Wolfram|Alpha συσσωρεύει και συστηματοποιεί τη γνώση που είναι διαθέσιμη στον Ιστό από διάφορες περιοχέςσυμπεριλαμβανομένης της επιστήμης, του πολιτισμού και της ψυχαγωγίας. Εάν αυτή η βάση δεδομένων περιέχει μια έτοιμη απάντηση σε ερώτημα αναζήτησης, το δείχνει το σύστημα, αν όχι, υπολογίζει και εμφανίζει το αποτέλεσμα. Σε αυτήν την περίπτωση, ο χρήστης βλέπει μόνο και τίποτα περισσότερο.

Γιατί το χρειάζεστε αυτό

Εάν είστε, για παράδειγμα, φοιτητής, αναλυτής, δημοσιογράφος ή ερευνητής, μπορείτε να χρησιμοποιήσετε το Wolfram|Alpha για να βρείτε και να υπολογίσετε δεδομένα που σχετίζονται με τις δραστηριότητές σας. Η υπηρεσία δεν κατανοεί όλα τα αιτήματα, αλλά συνεχώς εξελίσσεται και γίνεται πιο έξυπνη.

Τι είναι αυτό

Η μηχανή Metasearch Dogpile εμφανίζει μια συνδυασμένη λίστα αποτελεσμάτων από τις μηχανές αναζήτησης. Google SERP, Yahoo και άλλα δημοφιλή συστήματα.

Το καλύτερο

Πρώτον, το Dogpile εμφανίζει λιγότερες διαφημίσεις. Δεύτερον, η υπηρεσία χρησιμοποιεί έναν ειδικό αλγόριθμο για να βρει και να εμφανίσει τα καλύτερα αποτελέσματα από διαφορετικές μηχανές αναζήτησης. Σύμφωνα με τους προγραμματιστές του Dogpile, το σύστημά τους δημιουργεί το πιο ολοκληρωμένο ζήτημα σε ολόκληρο το Διαδίκτυο.

Γιατί το χρειάζεστε αυτό

Εάν δεν μπορείτε να βρείτε πληροφορίες στο Google ή σε άλλη τυπική μηχανή αναζήτησης, αναζητήστε τις σε πολλές μηχανές αναζήτησης ταυτόχρονα χρησιμοποιώντας το Dogpile.

Τι είναι αυτό

Το BoardReader είναι ένα σύστημα αναζήτησης κειμένου για φόρουμ, υπηρεσίες Q&A και άλλες κοινότητες.

Το καλύτερο

Η υπηρεσία σάς επιτρέπει να περιορίσετε το πεδίο αναζήτησης σε ιστότοπους κοινωνικής δικτύωσης. Χάρη σε ειδικά φίλτρα, μπορείτε να βρείτε γρήγορα αναρτήσεις και σχόλια που ταιριάζουν με τα κριτήριά σας: γλώσσα, ημερομηνία δημοσίευσης και όνομα ιστότοπου.

Γιατί το χρειάζεστε αυτό

Το BoardReader μπορεί να είναι χρήσιμο για ειδικούς δημοσίων σχέσεων και άλλους επαγγελματίες των μέσων ενημέρωσης που ενδιαφέρονται για τη γνώμη των μέσων μαζικής ενημέρωσης για ορισμένα θέματα.

Τελικά

Η ζωή των εναλλακτικών μηχανών αναζήτησης είναι συχνά φευγαλέα. Η Lifehacker ρώτησε τον πρώην διευθύνοντα σύμβουλο του ουκρανικού υποκαταστήματος της εταιρείας Yandex Sergey Petrenko σχετικά με τις μακροπρόθεσμες προοπτικές τέτοιων έργων.


Σεργκέι Πετρένκο

Πρώην διευθύνων σύμβουλος της Yandex.Ukraine.

Όσο για την τύχη των εναλλακτικών μηχανών αναζήτησης, είναι απλό: να είναι πολύ εξειδικευμένα έργα με μικρό κοινό, επομένως, χωρίς σαφείς εμπορικές προοπτικές ή, αντίθετα, με την πλήρη σαφήνεια της απουσίας τους.

Αν κοιτάξετε τα παραδείγματα στο άρθρο, μπορείτε να δείτε ότι τέτοιες μηχανές αναζήτησης είτε ειδικεύονται σε μια στενή αλλά περιζήτητη θέση, η οποία, ίσως μόνο μέχρι στιγμής, δεν έχει αναπτυχθεί αρκετά ώστε να γίνει αντιληπτή στα ραντάρ της Google ή της Yandex, ή δοκιμάζουν μια αρχική υπόθεση στην κατάταξη, η οποία δεν είναι ακόμη εφαρμόσιμη στη συμβατική αναζήτηση.

Για παράδειγμα, εάν μια αναζήτηση Tor ξαφνικά αποδειχθεί ότι έχει ζήτηση, δηλαδή τουλάχιστον ένα ποσοστό του κοινού της Google θα χρειαστεί τα αποτελέσματα από εκεί, τότε, φυσικά, οι συνηθισμένες μηχανές αναζήτησης θα αρχίσουν να λύνουν το πρόβλημα του τρόπου βρείτε τα και δείξτε τα στον χρήστη. Εάν η συμπεριφορά του κοινού δείχνει ότι ένα σημαντικό ποσοστό χρηστών σε σημαντικό αριθμό ερωτημάτων φαίνεται να έχει πιο σχετικά αποτελέσματα, δεδομένα χωρίς να λαμβάνονται υπόψη παράγοντες που εξαρτώνται από τον χρήστη, τότε η Yandex ή η Google θα αρχίσουν να δίνουν τέτοια αποτελέσματα.

«Το να είσαι καλύτερος» στο πλαίσιο αυτού του άρθρου δεν σημαίνει «να είσαι καλύτερος σε όλα». Ναι, από πολλές απόψεις οι ήρωές μας απέχουν πολύ από το Yandex (ακόμα και μακριά από το Bing). Όμως κάθε μία από αυτές τις υπηρεσίες δίνει στον χρήστη κάτι που οι γίγαντες της βιομηχανίας αναζήτησης δεν μπορούν να προσφέρουν. Σίγουρα γνωρίζετε και εσείς παρόμοια έργα. Μοιραστείτε μαζί μας - ας συζητήσουμε.

Αναζήτηση πληροφοριών στο Διαδίκτυο

Αναζήτηση πληροφοριών στο Διαδίκτυο

Για αναζήτηση πληροφοριώνσε κοινά χρησιμοποιούμενα τρεις τρόπους(Βλέπε Εικ. 1). Ο πρώτοςαπό αυτά - αναζήτηση κατά διεύθυνση. Χρησιμοποιείται όταν ο χρήστης γνωρίζει τη διεύθυνση ενός πόρου πληροφοριών που περιέχει τις πληροφορίες που χρειάζεται. Κατά την οργάνωση της αναζήτησης πληροφοριών ανά διεύθυνση (η μορφή της διεύθυνσης - IP, τομέας ή διεύθυνση URL - σε αυτήν την περίπτωση δεν έχει σημασία), ο χρήστης πρέπει απλώς να εισαγάγει τη διεύθυνση του πόρου στο κατάλληλο πεδίο του προγράμματος περιήγησης - ένα πρόγραμμα έχει σχεδιαστεί για να παρέχει πρόσβαση σε πόρους δικτύου.

Ρύζι. 1. Τρόποι αναζήτησης πληροφοριών σε βάσεις δεδομένων υπερκειμένου

Δεύτερος- αναζήτηση χρησιμοποιώντας πλοήγηση υπερ-συνδέσμων. Όταν χρησιμοποιείτε αυτόν τον τύπο αναζήτησης, ο χρήστης πρέπει πρώτα να έχει πρόσβαση στον διακομιστή που σχετίζεται με την αντίστοιχη βάση δεδομένων. Στη συνέχεια, μπορείτε να βρείτε το έγγραφο χρησιμοποιώντας υπερσυνδέσμους. Προφανώς, αυτή η μέθοδος είναι βολική όταν η διεύθυνση του πόρου είναι άγνωστη στο χρήστη. Για να χρησιμοποιηθούν ως αφετηρία για την αναζήτηση κατά την εφαρμογή αυτής της μεθόδου, προορίζονται οι πύλες Ιστού - διακομιστές που παρέχουν άμεση πρόσβαση σε ένα συγκεκριμένο σύνολο διακομιστών, συμπεριλαμβανομένων πόρων πληροφοριών που είναι εγκατεστημένοι σε αυτούς, καθώς και εφαρμογές Ιστού που υλοποιούν υπηρεσίες Ιστού που αντιστοιχούν σε σκοπό της πύλης. Οι διακομιστές που είναι προσβάσιμοι μέσω της πύλης μπορεί να είναι συγκεκριμένοι για ένα συγκεκριμένο σύστημα (για παράδειγμα, εταιρικό) ή διάφορα συστήματακαι να επιλέγονται ειδικά σύμφωνα με τα συγκεκριμένα, θεματικά ή άλλα χαρακτηριστικά των εγγράφων και των δεδομένων που περιέχονται στους ιστότοπούς τους. Συνήθως, οι πύλες συνδυάζουν μια ποικιλία λειτουργιών για να διατηρήσουν τον πελάτη όσο το δυνατόν περισσότερο. Η κυρίαρχη υπηρεσία της πύλης είναι η υπηρεσία γραφείο βοήθειας: αναζήτηση, αναλυτές, οικονομικοί δείκτες, πληροφορίες καιρού κ.λπ. Ενώ οι τοποθεσίες Web είναι ως επί το πλείστον συλλογές στατικών ιστοσελίδων, οι πύλες είναι συλλογές από εργαλεία λογισμικούκαι μη δομημένες πληροφορίες που αυτά τα εργαλεία μετατρέπουν σε δομημένα δεδομένα κατόπιν αιτήματος συγκεκριμένων χρηστών.

ΤρίτοςΗ μέθοδος αναζήτησης περιλαμβάνει τη χρήση διακομιστών αναζήτησης στο Διαδίκτυο. Οι διακομιστές αναζήτησης είναι αποκλειστικοί κεντρικοί υπολογιστές - υπολογιστές που φιλοξενούν βάσεις δεδομένων πόρων Διαδικτύου. Διεπαφή χρήστηένας τέτοιος διακομιστής έχει ένα πεδίο για την εισαγωγή λέξεων-κλειδιών που περιγράφουν το θέμα που ενδιαφέρει το χρήστη (βλ. Εικ. 2).

Εικ.2. Προβολή του παραθύρου διακομιστή αναζήτησης Yandex

Ο διακομιστής αντιλαμβάνεται αυτές τις λέξεις ως αίτημα πληροφοριών, σύμφωνα με το οποίο αναζητά πόρους και παρουσιάζει στον χρήστη μια λίστα με τα έγγραφα που βρέθηκαν. Προφανώς, κατά την εφαρμογή αυτής της μεθόδου, είναι πιθανά σφάλματα τόσο του 1ου (έλλειψη στόχου) όσο και του 2ου είδους (θόρυβος πληροφοριών). Πρέπει να αναφερθεί ότι διακρίνονται δύο ομάδες διακομιστών αναζήτησης: οι μηχανές αναζήτησης και οι κατάλογοι θεμάτων. Η διαφορά τους οφείλεται στη μέθοδο δημιουργίας και επακόλουθης αναπλήρωσης της βάσης δεδομένων των πόρων του Διαδικτύου, η οποία δεδομένου διακομιστήπραγματοποιεί ανάκτηση πληροφορίας. Έτσι, οι μηχανές αναζήτησης έχουν ειδικό πρόγραμμα- ρομπότ αναζήτησης. Παρακολουθεί συνεχώς το δίκτυο, συλλέγει πληροφορίες από ιστοσελίδες, τα ευρετηριάζει και διορθώνει την εικόνα αναζήτησής τους στη βάση δεδομένων του. Στους θεματικούς καταλόγους, μια βάση δεδομένων εγγράφων του Διαδικτύου σχηματίζεται "χειροκίνητα" από ειδικούς συντάκτες. Δεδομένου ότι δεν υπάρχει ενιαία διαχείριση στο Διαδίκτυο, οι πόροι πληροφοριών του αλλάζουν συνεχώς. Μπορούν να εμφανιστούν νέα έγγραφα σε αυτό και τα υπάρχοντα έγγραφα μπορούν να εξαφανιστούν. Η συχνότητα ενημέρωσης πληροφοριών σε έγγραφα για διαφορετικούς ιστότοπους είναι διαφορετική: για κάποιους είναι πολλές φορές ανά ώρα, για κάποιους είναι μία φορά την ημέρα, ημέρα, μήνα κ.λπ. Επομένως, είναι πολύ σημαντικό να κατανοήσουμε ότι όταν χρησιμοποιούνται συστήματα ανάκτησης πληροφοριών για την εύρεση πληροφοριών στο Διαδίκτυο, η αναζήτηση δεν πραγματοποιείται στον πραγματικό χώρο των εγγράφων του Ιστού, αλλά σε κάποιο μοντέλο, το περιεχόμενο του οποίου μπορεί να διαφέρει σημαντικά από το πραγματικό περιεχόμενο του Διαδικτύου τη στιγμή της αναζήτησης. Ανάλογα με τον βαθμό κάλυψης των πόρων με ευρετήριο, οι μηχανές αναζήτησης μπορούν να χωριστούν σε δύο ομάδες: διεθνείς και ρωσόφωνες. Το πρώτο ευρετήριο όλων των εγγράφων που δημοσιεύονται στο Διαδίκτυο στη σειρά. Το δεύτερο ευρετηριάζει τους πόρους που βρίσκονται σε ζώνες τομέαμε την επικράτηση της ρωσικής γλώσσας. Η λίστα με τα πιο δημοφιλή συστήματα δίνεται στον Πίνακα. ένας.

Αυτί. 1. Οι πιο δημοφιλείς μηχανές αναζήτησης

Διεθνές Ρωσόφωνοι
Google Yandex (44,4% του Runet)
Yahoo! Rambler (10,6% του Runet)
Bing Mail.ru (7,3% του Runet)
msn Nigma (0,5% Runet)
AltaVista Gogo.ru (0,3% Runet)
Παρακαλώ Aport (0,2% Runet)

Σημείωση: Το Runet είναι το ρωσόφωνο τμήμα του Διαδικτύου, το οποίο δημιουργεί τομείς με ονόματα ru και rf.

Να αναφέρουμε ότι υπάρχει ειδική κατηγορία μηχανών αναζήτησης – μηχανές μετα-αναζήτησης. Η θεμελιώδης διαφορά τους από μηχανές αναζήτησηςκαι οι θεματικοί κατάλογοι είναι ότι δεν έχουν τη δική τους βάση δεδομένων ευρετηρίου και επομένως, μόλις λάβουν ένα αίτημα χρήστη, το ανακατευθύνουν σε πολλούς διακομιστές αναζήτησης ταυτόχρονα (Βλ. Εικ. 3).

Ρύζι. 3. Το σχήμα του συστήματος μετα-αναζήτησης

Η δυνατότητα ταυτόχρονης χρήσης πολλαπλών μηχανών αναζήτησης για ένα μόνο αίτημα είναι ένα προφανές πλεονέκτημα των μηχανών metasearch. Επί του παρόντος, το σύστημα Metabot.ru έχει βρει ευρεία εφαρμογή, η διεπαφή του οποίου φαίνεται στο Σχ. 4. Αυτό το σύστημα σάς επιτρέπει να χρησιμοποιείτε διακομιστές αναζήτησης διεθνών και ρωσικής γλώσσας για την αναζήτηση πόρων.

Στείλτε την καλή δουλειά σας στη βάση γνώσεων είναι απλή. Χρησιμοποιήστε την παρακάτω φόρμα

Φοιτητές, μεταπτυχιακοί φοιτητές, νέοι επιστήμονες που χρησιμοποιούν τη βάση γνώσεων στις σπουδές και την εργασία τους θα σας είναι πολύ ευγνώμονες.

Παρόμοια Έγγραφα

    Μέσα αναζήτησης πληροφοριών στο Διαδίκτυο. Βασικές απαιτήσεις και μέθοδοι ανάκτησης πληροφοριών. Δομή και χαρακτηριστικά των υπηρεσιών αναζήτησης. Παγκόσμιες μηχανές αναζήτησης WWW (World Wide Web). Σχεδιασμός αναζήτησης και συλλογής πληροφοριών στο Διαδίκτυο.

    περίληψη, προστέθηκε 02.11.2010

    Χαρακτηριστικά των μεθόδων αναζήτησης πληροφοριών στο Διαδίκτυο, συγκεκριμένα, με χρήση συνδέσμων υπερκειμένου, μηχανών αναζήτησης και ειδικών εργαλείων. Ανάλυση νέων πόρων του Διαδικτύου. Η ιστορία της εμφάνισης και περιγραφής δυτικών και ρωσόφωνων μηχανών αναζήτησης.

    περίληψη, προστέθηκε 05/12/2010

    Περιγραφή και ταξινόμηση σύγχρονων συστημάτων ανάκτησης πληροφοριών. έγγραφα υπερκειμένου. Επισκόπηση και βαθμολογίες των μεγάλων μηχανών αναζήτησης στον κόσμο. Ανάπτυξη συστήματος ανάκτησης πληροφοριών που καταδεικνύει τον μηχανισμό αναζήτησης πληροφοριών στο Διαδίκτυο.

    διατριβή, προστέθηκε 16/06/2015

    Ανάλυση των δυνατοτήτων των μηχανών αναζήτησης Yandex και Google, σύγκρισή τους ως προς τη χρησιμότητα. Η ιστορία της δημιουργίας μηχανών αναζήτησης, τα χαρακτηριστικά της διεπαφής τους, τα εργαλεία αναζήτησης και οι αλγόριθμοι. Ο σχηματισμός της ερώτησης και το κριτήριο για την απάντηση σε αυτήν.

    περίληψη, προστέθηκε 05/07/2011

    Θεώρηση των μηχανών αναζήτησης στο Διαδίκτυο ως ένα σύμπλεγμα λογισμικού και υλικού με διεπαφή ιστού που παρέχει τη δυνατότητα αναζήτησης πληροφοριών. Τύποι μηχανών αναζήτησης: Archie, Wandex, Aliweb, WebCrawler, AltaVista, Yahoo!, Google, Yandex, Bing και Rambler.

    περίληψη, προστέθηκε 05/10/2013

    Η δομή και οι αρχές δημιουργίας του Διαδικτύου, αναζήτησης και αποθήκευσης πληροφοριών σε αυτό. Η ιστορία της εμφάνισης και της ταξινόμησης συστημάτων ανάκτησης πληροφοριών. Η αρχή της λειτουργίας και τα χαρακτηριστικά των μηχανών αναζήτησης Google, Yandex, Rambler, Yahoo. Αναζήτηση κατά διευθύνσεις URL.

    θητεία, προστέθηκε 29/03/2013

    Η ουσία και η αρχή λειτουργίας του παγκόσμιου Διαδικτύου. Αναζήτηση πληροφοριών ανά παραμέτρους στο σύστημα Google. Εξειδικευμένα συστήματα ανάκτησης πληροφοριών: "KtoTam", "Tagoo", "Truveo", "Kinopoisk", "Catch-Umov". Κατάλληλη χρήση των μηχανών αναζήτησης.

    παρουσίαση, προστέθηκε 16/02/2015

    Αποθήκευση δεδομένων στο Διαδίκτυο. Έγγραφα υπερκειμένου, τύποι αρχείων. Αρχεία γραφικών, τα είδη και τα χαρακτηριστικά τους. Μηχανές αναζήτησης και κανόνες αναζήτησης πληροφοριών. Έρευνα μηχανών αναζήτησης στο Διαδίκτυο. Όλα για τις μηχανές αναζήτησης Yandex, Google, Rambler.

    θητεία, προστέθηκε 26/03/2011

Γενικές πληροφορίες.

Επί του παρόντος, το Διαδίκτυο ενώνει εκατοντάδες εκατομμύρια διακομιστές που φιλοξενούν δισεκατομμύρια διαφορετικούς ιστότοπους και μεμονωμένα αρχεία που περιέχουν διάφορα είδη πληροφοριών. Είναι ένα τεράστιο αποθετήριο πληροφοριών. Υπάρχουν διάφορες μέθοδοι αναζήτησης πληροφοριών στο Διαδίκτυο.

Αναζήτηση με γνωστή διεύθυνση. Οι απαιτούμενες διευθύνσεις λαμβάνονται από καταλόγους. Γνωρίζοντας τη διεύθυνση, απλώς πληκτρολογήστε την γραμμή διεύθυνσηςΠρόγραμμα περιήγησης.

www.gov.ru - διακομιστής των ρωσικών κρατικών αρχών.

Κατασκευή διεύθυνσης από τον χρήστη. Γνωρίζοντας το σύστημα δημιουργίας διευθύνσεων Διαδικτύου, μπορείτε να δημιουργήσετε διευθύνσεις κατά την αναζήτηση τοποθεσιών Web.

Είναι απαραίτητο να προσθέσετε έναν θεματικό ή γεωγραφικό τομέα σε μια λέξη-κλειδί (το όνομα μιας εταιρείας, επιχείρησης, οργανισμού ή ένα απλό αγγλικό ουσιαστικό) και η διαίσθηση πρέπει να συνδεθεί.

Διευθύνσεις εμπορικών ιστοσελίδων:

www.cnn.com (CNN World News),

www.sony.com SONY),

www.mtv.com (Μουσικές ειδήσεις MTV).

Διευθύνσεις εκπαιδευτικών ιδρυμάτων:

www.ntu.edu (Εθνικό Πανεπιστήμιο των ΗΠΑ).

Διευθύνσεις τοπικών διακομιστών:

www.poland.net (Πολωνία),

www.israil.net (Ισραήλ).

Μηχανές αναζήτησης στο Διαδίκτυο

Για την αναζήτηση πληροφοριών στο Διαδίκτυο, έχουν αναπτυχθεί ειδικά συστήματα ανάκτησης πληροφοριών. Οι μηχανές αναζήτησης έχουν μια κανονική διεύθυνση και εμφανίζονται ως ιστοσελίδα που περιέχει ειδικά εργαλεία για την οργάνωση της αναζήτησης (συμβολοσειρά αναζήτησης, κατάλογος θεμάτων, σύνδεσμοι). Για να καλέσετε μια μηχανή αναζήτησης, απλώς εισαγάγετε τη διεύθυνσή της στη γραμμή διευθύνσεων του προγράμματος περιήγησης.

Σύμφωνα με τη μέθοδο οργάνωσης των πληροφοριών, τα συστήματα ανάκτησης πληροφοριών χωρίζονται σε δύο τύπους: ταξινόμηση (ρουμπρικτές) και λεξικό.

Οι Rubricators (ταξινομητές) είναι μηχανές αναζήτησης που χρησιμοποιούν μια ιεραρχική (δενδροειδή) οργάνωση πληροφοριών. Κατά την αναζήτηση πληροφοριών, ο χρήστης εξετάζει τις θεματικές επικεφαλίδες, περιορίζοντας σταδιακά το πεδίο αναζήτησης (για παράδειγμα, εάν πρέπει να βρείτε τη σημασία μιας λέξης, τότε πρώτα πρέπει να βρείτε ένα λεξικό στον ταξινομητή και στη συνέχεια να το βρείτε σε αυτό σωστή λέξη).

Τα συστήματα αναζήτησης λεξικών είναι ισχυρά αυτόματα συστήματα λογισμικού και υλικού. Με τη βοήθειά τους, προβάλλονται (σαρώνονται) πληροφορίες στο Διαδίκτυο. Τα δεδομένα σχετικά με τη θέση αυτής ή αυτής της πληροφορίας εισάγονται σε ειδικά βιβλία αναφοράς-ευρετήρια. Σε απάντηση στο αίτημα, πραγματοποιείται αναζήτηση σύμφωνα με τη συμβολοσειρά ερωτήματος. Ως αποτέλεσμα, προσφέρονται στον χρήστη εκείνες οι διευθύνσεις (URL) όπου βρέθηκε η λέξη ή ομάδα λέξεων που αναζητήθηκε τη στιγμή της σάρωσης. Επιλέγοντας οποιονδήποτε από τους προτεινόμενους συνδέσμους, μπορείτε να μεταβείτε στο έγγραφο που βρέθηκε. Οι περισσότερες σύγχρονες μηχανές αναζήτησης είναι μικτές.

Οι πιο διάσημες και δημοφιλείς μηχανές αναζήτησης:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

Υπάρχουν συστήματα που ειδικεύονται στην αναζήτηση πληροφοριακούς πόρουςπρος διάφορες κατευθύνσεις.

Αναζήτηση ατόμων στο Διαδίκτυο:

www.whowhere.ru www. bigfoot.com

Αναζήτηση κατά ομάδες συζήτησης (Usenet):

www.dejanews.com

Μηχανές αναζήτησης θεμάτων:

Αναζήτηση λογισμικό:

Αναζήτηση σε αρχεία αρχείων:

http://ftpseach.com city.ru, http://ftpsearch. licos.com

Κατάλογοι (θεματικές συλλογές συνδέσμων με σχολιασμούς):

http://www.atrus.ru

Συχνά, μια αποτελεσματική αναζήτηση πληροφοριών μπορεί να πραγματοποιηθεί χρησιμοποιώντας τοπικούς καταλόγους - εξειδικευμένους διακομιστές που περιέχουν δεδομένα σχετικά με επιχειρήσεις ή πόρους Ιστού μιας πόλης ή περιοχής. Για παράδειγμα, για την Αγία Πετρούπολη, ένας τέτοιος κατάλογος βρίσκεται στη διεύθυνση http://www.spb.ru.

Μπορείτε να βρείτε μια λίστα με IPS στη διεύθυνση www.monk. newmail.ru

Μια πιο λεπτομερής λίστα μηχανών αναζήτησης και καταλόγων παρουσιάζεται στον Πίνακα. 3.2.

Κανόνες εκτέλεσης ερωτήματος

Σε κάθε μηχανή αναζήτησης, στην ενότητα Βοήθεια, μπορείτε να λάβετε πληροφορίες σχετικά με τον τρόπο αναζήτησης, τον τρόπο σύνταξης μιας συμβολοσειράς ερωτήματος. Ακολουθούν πληροφορίες σχετικά με μια τυπική, "μέση" γλώσσα ερωτημάτων.

Απλό αίτημα.

Εισαγάγετε μία λέξη που καθορίζει το θέμα αναζήτησης. Για παράδειγμα, στη μηχανή αναζήτησης Rambler.ru, αρκεί να εισαγάγετε: αυτοματοποίηση.

Βρέθηκαν έγγραφα που περιέχουν τις λέξεις που καθορίζονται στο αίτημα. Όλες οι μορφές ρωσικών λέξεων αναγνωρίζονται, κατά κανόνα, η περίπτωση των γραμμάτων αγνοείται.

Μπορείτε να χρησιμοποιήσετε τον χαρακτήρα "*" ή "?" στο ερώτημα. Σημάδι "?" στη λέξη-κλειδί, αντικαθίσταται ένας χαρακτήρας, στη θέση του οποίου μπορεί να αντικατασταθεί οποιοδήποτε γράμμα και ο χαρακτήρας "*" είναι μια ακολουθία χαρακτήρων.

Για παράδειγμα, ένα αυτόματο ερώτημα* θα βρει έγγραφα που περιλαμβάνουν τις λέξεις automatic, automatic και ούτω καθεξής.

Σύνθετο αίτημα.

Συχνά υπάρχει ανάγκη συνδυασμού λέξεων-κλειδιών για να ληφθούν πιο συγκεκριμένες πληροφορίες. Σε αυτή την περίπτωση, χρησιμοποιούνται πρόσθετες λέξεις σύνδεσης, συναρτήσεις, τελεστές, σύμβολα, συνδυασμοί τελεστών που χωρίζονται με αγκύλες.

Για παράδειγμα, το ερώτημα music & (beatles | beatles) σημαίνει ότι ο χρήστης αναζητά έγγραφα που περιέχουν τις λέξεις μουσική και beatles ή μουσική και beatles.

Ο Πίνακας 3.1 δείχνει τους κανόνες για τη δημιουργία αιτημάτων που έχουν υιοθετηθεί στο σύστημα Aport (http://www.aport.ru).

Πίνακας 3.1

Χειριστές για τη διαμόρφωση αιτημάτων

Χειριστής Συνώνυμα Σχόλιο
Και ΚΑΙ & Το ερώτημα θα βρει έγγραφα που περιέχουν και τις δύο λέξεις-κλειδιά. Μπορεί να είναι γραμμένο ή όχι. Για παράδειγμα, το ερώτημα: πληροφορική και σχολικό βιβλίο είναι ισοδύναμο με το εγχειρίδιο επιστήμης υπολογιστών
Ή Ή | Πραγματοποιεί αναζήτηση για εκείνα τα έγγραφα που χρησιμοποιούν μία από τις καθορισμένες λέξεις ή και τις δύο λέξεις ταυτόχρονα
ΔΕΝ ΟΧΙ-~ Η αναζήτηση περιορίζεται σε έγγραφα που δεν περιέχουν τη λέξη που καθορίζεται μετά τον χειριστή
" " " " Τα διπλά ή μονά εισαγωγικά σάς επιτρέπουν να βρείτε μια φράση
ημερομηνία= ημερομηνία:ημερομηνία= Η αναζήτηση περιορίζεται σε έγγραφα που εμπίπτουν στο καθορισμένο διάστημα ημερομηνιών Παράδειγμα 1. νομισματική ημερομηνία=01/02/2002-01/03/2002. Αυτό το αίτημα θα επιστρέψει έγγραφα που περιέχουν τη λέξη "νόμισμα" και έχουν ημερομηνία μεταξύ 1ης Φεβρουαρίου 2002 και 1ης Μαρτίου 2002. Παράδειγμα 2. date=01/03/2002 νόμισμα Παράδειγμα 3. ημερομηνία:<02/03/2002 валюта

Πίνακας 3.2

Λίστα διακομιστών αναζήτησης και καταλόγων

Διεύθυνση Περιγραφή
www.excite.com Μηχανή αναζήτησης με κριτικές κόμβων και οδηγούς
www.alta-vista.com Διακομιστής αναζήτησης, διαθέσιμες προηγμένες δυνατότητες αναζήτησης
www.hotbot.com διακομιστή αναζήτησης
www.poland.net www.israil.net Τοπικοί διακομιστές αναζήτησης Πολωνίας, Ισραήλ
www.ifoseek.com Διακομιστής αναζήτησης (εύχρηστος)
www.ipl.org Internet Public Library, μια δημόσια βιβλιοθήκη που λειτουργεί ως μέρος του έργου World Village
www.wisewire.com WiseWire - οργάνωση αναζήτησης με χρήση τεχνητής νοημοσύνης
www.webcrawler.com WebCrawler - διακομιστής αναζήτησης, εύκολος στη χρήση
www.yahoo.com Κατάλογος Ιστού και διεπαφή για πρόσβαση στην αναζήτηση πλήρους κειμένου στον διακομιστή AltaVista
www.aport.ru Aport - Διακομιστής αναζήτησης ρωσικής γλώσσας
www.yandex.ru Yandex - διακομιστής αναζήτησης στη ρωσική γλώσσα
www.rambler.ru Rambler - διακομιστής αναζήτησης στη ρωσική γλώσσα
Πόροι βοήθειας στο Διαδίκτυο
www.yellow.com Χρυσός Οδηγός Διαδικτύου
καλόγερος. newmail.ru Μηχανές αναζήτησης διαφόρων προφίλ
www.top200.ru Κορυφαίοι 200 ​​ιστότοποι
www.allru.net
www.ru Κατάλογος ρωσικών πόρων Διαδικτύου
www.allru.net/z09. htm Εκπαιδευτικοί Πόροι
www.students.ru Διακομιστής Ρώσων φοιτητών
www.cdo.ru/index_new. ασπίδα Κέντρο Εκπαίδευσης εξ Αποστάσεως
www.open. μετα Χριστον. Ηνωμένο Βασίλειο Open University UK
www.ntu.edu Εθνικό Πανεπιστήμιο των ΗΠΑ
www.translate.ru Ηλεκτρονικός μεταφραστής κειμένου
www.pomorsu.ru/guide. library.html Λίστα συνδέσμων προς βιβλιοθήκες δικτύου
www.elibrary.ru Επιστημονική ηλεκτρονική βιβλιοθήκη
www.citforum.ru ΗΛΕΚΤΡΟΝΙΚΗ ΒΙΒΛΙΟΘΗΚΗ
www.infamed.com/psy Ψυχολογικά τεστ
www.pokoleniye.ru Ιστοσελίδα της Ομοσπονδίας Εκπαίδευσης Διαδικτύου
www.μέθοδος. people.ru Εκπαιδευτικοί Πόροι
www.spb. www.osi.ru/ic/distant Εξ αποστάσεως εκπαίδευση στο Διαδίκτυο
www.examen.ru Εξετάσεις και τεστ
www.kbsu.ru/~book/ Εγχειρίδιο Πληροφορικής
Mega. km.ru Εγκυκλοπαίδειες και λεξικά

Αναζήτηση πληροφοριών στο Διαδίκτυο: παγίδες

Προβλήματα που δεν βρίσκονται στην επιφάνεια συχνά γίνονται αισθητά μόνο "εκ των υστέρων", αφού έχει ολοκληρωθεί ένα ορισμένο στάδιο των εργασιών αναζήτησης και, ίσως, με βάση τα αποτελέσματά του, έχει ήδη ληφθεί κάποια απόφαση. Τι εμποδίζει να γίνει διαφανής η κατάσταση από την αρχή της λειτουργίας αυτού ή εκείνου του συστήματος ανάκτησης πληροφοριών (IPS); Η απάντηση είναι αρκετά απλή: η έλλειψη ολοκληρωμένων πληροφοριών αυτού του είδους από την πλευρά του προγραμματιστή. Άμεση συνέπεια αυτού είναι η αναξιοπιστία των δεδομένων που λαμβάνονται και η ανεξέλεγκτη απώλειά τους. Είναι σπάνιο να βρείτε μια μηχανή αναζήτησης στον Ιστό που να μην έχει κάποιες «μη τεκμηριωμένες» δυνατότητες. Φαίνεται ότι ο χρήστης δεν χρειάζεται τόσες πολλές πληροφορίες, δηλαδή:

πώς συμπληρώνεται η βάση δεδομένων IPS και ποιος είναι ο όγκος της.

πλήρες φάσμα δυνατοτήτων της γλώσσας αναζήτησης του συστήματος.

τα κύρια χαρακτηριστικά της παρουσίασης των αποτελεσμάτων αναζήτησης, κυρίως ο αλγόριθμος για την κατάταξη εγγραφών από τη λίστα των απαντήσεων σε ένα ερώτημα αναζήτησης.

Δυστυχώς, η πηγή τέτοιων πληροφοριών δεν είναι συνήθως ένα έγγραφο που διατίθεται από την κύρια σελίδα του διακομιστή αναζήτησης, αλλά δημοσιεύσεις μεμονωμένων συγγραφέων διάσπαρτες στον Ιστό, βιβλία και περιοδικά υπολογιστών. Οι λόγοι για αυτήν την κατάσταση πραγμάτων, προφανώς, περιλαμβάνουν όχι μόνο την αμέλεια του προγραμματιστή, αλλά και έναν παράγοντα που ονομάζεται πολιτική μάρκετινγκ. Με απλά λόγια, η παροχή στη μηχανή αναζήτησης με τις πιο ολοκληρωμένες πληροφορίες για τον εαυτό της δεν έχει πάντα θετική επίδραση στην κατάταξή της. Ωστόσο, σε ορισμένες περιπτώσεις, ο χρήστης είναι αρκετά ικανός να πάρει την κατάσταση υπό έλεγχο. Είναι συχνά δυνατό να μάθετε τις δυνατότητες της επιλεγμένης υπηρεσίας αναζήτησης με τη βοήθεια δοκιμών. Η δημιουργία ειδικών ερωτημάτων δοκιμής που διευκρινίζουν γρήγορα ακριβώς εκείνη την πτυχή της λειτουργίας του συστήματος που είναι πιο σημαντική για την τρέχουσα εργασία αποδεικνύεται σε πολλές περιπτώσεις μη τετριμμένη. Πώς να αποφύγετε μερικά από τα προβλήματα κατά την εργασία με IPS, θα αφιερώσουμε τη συζήτησή μας. Ως παραδείγματα που επεξηγούν την παρουσίαση, θα ληφθούν υπόψη ευρέως γνωστές μηχανές αναζήτησης στο Διαδίκτυο.