Τι είναι αυτό

Το DuckDuckGo είναι μια αρκετά γνωστή μηχανή αναζήτησης ανοιχτού κώδικα. πηγαίος κώδικας. Οι διακομιστές βρίσκονται στις ΗΠΑ. Εκτός από το δικό της ρομπότ, η μηχανή αναζήτησης χρησιμοποιεί τα αποτελέσματα άλλων πηγών: Yahoo, Bing, Wikipedia.

Το καλύτερο

Το DuckDuckGo τοποθετείται ως η απόλυτη αναζήτηση απορρήτου και απορρήτου. Το σύστημα δεν συλλέγει δεδομένα σχετικά με τον χρήστη, δεν αποθηκεύει αρχεία καταγραφής (χωρίς ιστορικό αναζήτησης), χρήση μπισκόταπεριορισμένη στο μέγιστο.

Το DuckDuckGo δεν συλλέγει ούτε μοιράζεται προσωπικές πληροφορίες από χρήστες. Αυτή είναι η πολιτική απορρήτου μας.

Gabriel Weinberg, ιδρυτής του DuckDuckGo

Γιατί το χρειάζεστε αυτό

Όλες οι μεγάλες μηχανές αναζήτησης προσπαθούν να εξατομικεύσουν τα αποτελέσματα αναζήτησης με βάση δεδομένα σχετικά με το άτομο που βρίσκεται μπροστά από την οθόνη. Αυτό το φαινόμενο ονομάζεται "φούσκα φίλτρου": ο χρήστης βλέπει μόνο εκείνα τα αποτελέσματα που είναι συνεπή με τις προτιμήσεις του ή που το σύστημα θεωρεί ως τέτοια.

Σχηματίζει μια αντικειμενική εικόνα που δεν εξαρτάται από την προηγούμενη συμπεριφορά σας στον Ιστό και εξαλείφει τη θεματική διαφημίσεις googleκαι "Yandex", με βάση τα αιτήματά σας. Με τη βοήθεια του DuckDuckGo, είναι εύκολο να αναζητήσετε πληροφορίες σε ξένες γλώσσες, ενώ η Google και η Yandex προτιμούν ιστότοπους στη ρωσική γλώσσα από προεπιλογή, ακόμη και αν το ερώτημα έχει εισαχθεί σε άλλη γλώσσα.


Τι είναι αυτό

Το not Evil είναι ένα σύστημα που αναζητά το ανώνυμο δίκτυο Tor. Για να το χρησιμοποιήσετε, πρέπει να μεταβείτε σε αυτό το δίκτυο, για παράδειγμα, ξεκινώντας ένα εξειδικευμένο .

not Evil δεν είναι η μόνη μηχανή αναζήτησης του είδους της. Υπάρχει η LOOK (προεπιλεγμένη αναζήτηση στο πρόγραμμα περιήγησης Tor, προσβάσιμη από το κανονικό Διαδίκτυο) ή η TORCH (μία από τις παλαιότερες μηχανές αναζήτησης στο δίκτυο Tor) και άλλες. Καταλήξαμε στο not Evil λόγω της αλάνθαστης υπαινιγμού για την Google (απλώς κοιτάξτε την αρχική σελίδα).

Το καλύτερο

Ψάχνει για το πού απαγορεύεται κατ' αρχήν η πρόσβαση στο Google, το Yandex και άλλες μηχανές αναζήτησης.

Γιατί το χρειάζεστε αυτό

Υπάρχουν πολλοί πόροι στο δίκτυο Tor που δεν μπορούν να βρεθούν στο νομοταγές Διαδίκτυο. Και ο αριθμός τους θα αυξηθεί καθώς ο έλεγχος των αρχών επί του περιεχομένου του Ιστού θα σφίγγει. Το Tor είναι ένα είδος δικτύου μέσα στον Ιστό με τα κοινωνικά δίκτυα, τους ιχνηλάτες torrent, τα μέσα, πλατφόρμες συναλλαγών, ιστολόγια, βιβλιοθήκες και ούτω καθεξής.

3. YaCy

Τι είναι αυτό

Το YaCy είναι μια αποκεντρωμένη μηχανή αναζήτησης που λειτουργεί με βάση την αρχή των δικτύων P2P. Κάθε υπολογιστής που έχει πρωτεύοντα μονάδα λογισμικού, σαρώνει μόνο του το Διαδίκτυο, δηλαδή είναι ανάλογο ενός ρομπότ αναζήτησης. Τα αποτελέσματα που λαμβάνονται συλλέγονται σε μια κοινή βάση δεδομένων, η οποία χρησιμοποιείται από όλους τους συμμετέχοντες στο YaCy.

Το καλύτερο

Είναι δύσκολο να πούμε εδώ αν αυτό είναι καλύτερο ή χειρότερο, καθώς το YaCy είναι μια εντελώς διαφορετική προσέγγιση στην οργάνωση της αναζήτησης. Η έλλειψη ενός μόνο διακομιστή και εταιρείας κατόχου καθιστά τα αποτελέσματα εντελώς ανεξάρτητα από τις προτιμήσεις του καθενός. Η αυτονομία κάθε κόμβου αποκλείει τη λογοκρισία. Το YaCy είναι σε θέση να πραγματοποιήσει αναζήτηση στον ιστό σε βάθος και σε μη ευρετηριασμένα δημόσια δίκτυα.

Γιατί το χρειάζεστε αυτό

Εάν είστε υποστηρικτής ανοιχτού κώδικα και δωρεάν internet, δεν επηρεάζεται από κυβερνητικούς φορείς και μεγάλες εταιρείες, τότε το YaCy είναι η επιλογή σας. Μπορεί επίσης να χρησιμοποιηθεί για την οργάνωση αναζητήσεων σε ένα εταιρικό ή άλλο αυτόνομο δίκτυο. Και παρόλο που το YaCy δεν είναι πολύ χρήσιμο στην καθημερινή ζωή, είναι μια άξια εναλλακτική της Google όσον αφορά τη διαδικασία αναζήτησης.

4. Πιπλ

Τι είναι αυτό

Το Pipl είναι ένα σύστημα που έχει σχεδιαστεί για την αναζήτηση πληροφοριών για ένα συγκεκριμένο άτομο.

Το καλύτερο

Οι συντάκτες του Pipl ισχυρίζονται ότι οι εξειδικευμένοι αλγόριθμοί τους αναζητούν πιο αποτελεσματικά από τις «κανονικές» μηχανές αναζήτησης. Ειδικότερα, τα προφίλ έχουν προτεραιότητα κοινωνικά δίκτυα, σχόλια, λίστες συμμετεχόντων και διάφορες βάσεις δεδομένων όπου δημοσιεύονται πληροφορίες για άτομα, όπως βάσεις δεδομένων δικαστικών αποφάσεων. Η ηγεσία της Pipl σε αυτόν τον τομέα επιβεβαιώνεται από το Lifehacker.com, το TechCrunch και άλλες εκδόσεις.

Γιατί το χρειάζεστε αυτό

Εάν πρέπει να βρείτε πληροφορίες για ένα άτομο που ζει στις ΗΠΑ, τότε το Pipl θα είναι πολύ πιο αποτελεσματικό από την Google. Οι βάσεις δεδομένων των ρωσικών δικαστηρίων, προφανώς, δεν είναι προσβάσιμες στη μηχανή αναζήτησης. Επομένως, δεν τα καταφέρνει τόσο καλά με τους πολίτες της Ρωσίας.

Τι είναι αυτό

Το FindSounds είναι μια άλλη εξειδικευμένη μηχανή αναζήτησης. Πραγματοποιεί αναζήτηση σε ανοιχτές πηγές για διάφορους ήχους: σπίτι, φύση, αυτοκίνητα, ανθρώπους και ούτω καθεξής. Η υπηρεσία δεν υποστηρίζει αιτήματα στα ρωσικά, αλλά υπάρχει μια εντυπωσιακή λίστα ετικετών στη ρωσική γλώσσα που μπορείτε να αναζητήσετε.

Το καλύτερο

Στην έκδοση μόνο ήχων και τίποτα παραπάνω. Στις ρυθμίσεις μπορείτε να ορίσετε την επιθυμητή μορφή και ποιότητα ήχου. Όλοι οι ήχοι που βρέθηκαν είναι διαθέσιμοι για λήψη. Υπάρχει αναζήτηση προτύπων.

Γιατί το χρειάζεστε αυτό

Εάν θέλετε να βρείτε γρήγορα τον ήχο ενός μουσκέτου, το χτύπημα ενός δρυοκολάπτη που ρουφάει ή το κλάμα του Homer Simpson, τότε αυτή η υπηρεσία είναι για εσάς. Και το επιλέξαμε μόνο από τα διαθέσιμα ερωτήματα στη ρωσική γλώσσα. Στο αγγλική γλώσσατο φάσμα είναι ακόμη ευρύτερο.

Σοβαρά, μια εξειδικευμένη υπηρεσία συνεπάγεται ένα εξειδικευμένο κοινό. Θα σου φανεί όμως χρήσιμο και σε σένα;

Τι είναι αυτό

Η Wolfram|Alpha είναι μια υπολογιστική μηχανή αναζήτησης. Αντί για συνδέσμους σε άρθρα που περιέχουν λέξεις-κλειδιά, δίνει μια έτοιμη απάντηση στο ερώτημα του χρήστη. Για παράδειγμα, εάν εισάγετε στη φόρμα αναζήτησης "συγκρίνετε τον πληθυσμό της Νέας Υόρκης και του Σαν Φρανσίσκο" στα αγγλικά, τότε το Wolfram|Alpha θα εμφανίσει αμέσως πίνακες και γραφήματα με σύγκριση.

Το καλύτερο

Αυτή η υπηρεσία είναι καλύτερη από άλλες για την εύρεση γεγονότων και τον υπολογισμό δεδομένων. Το Wolfram|Alpha συσσωρεύει και συστηματοποιεί τη γνώση που είναι διαθέσιμη στον Ιστό από διάφορες περιοχέςσυμπεριλαμβανομένης της επιστήμης, του πολιτισμού και της ψυχαγωγίας. Εάν αυτή η βάση δεδομένων περιέχει μια έτοιμη απάντηση σε ένα ερώτημα αναζήτησης, το σύστημα την εμφανίζει, εάν όχι, υπολογίζει και εμφανίζει το αποτέλεσμα. Σε αυτήν την περίπτωση, ο χρήστης βλέπει μόνο και τίποτα περισσότερο.

Γιατί το χρειάζεστε αυτό

Εάν είστε, για παράδειγμα, φοιτητής, αναλυτής, δημοσιογράφος ή ερευνητής, μπορείτε να χρησιμοποιήσετε το Wolfram|Alpha για να βρείτε και να υπολογίσετε δεδομένα που σχετίζονται με τις δραστηριότητές σας. Η υπηρεσία δεν κατανοεί όλα τα αιτήματα, αλλά συνεχώς εξελίσσεται και γίνεται πιο έξυπνη.

Τι είναι αυτό

Η μηχανή Metasearch Dogpile εμφανίζει μια συνδυασμένη λίστα αποτελεσμάτων από τις μηχανές αναζήτησης. Google SERP, Yahoo και άλλα δημοφιλή συστήματα.

Το καλύτερο

Πρώτον, το Dogpile εμφανίζει λιγότερες διαφημίσεις. Δεύτερον, η υπηρεσία χρησιμοποιεί έναν ειδικό αλγόριθμο για εύρεση και εμφάνιση κορυφαίες βαθμολογίεςαπό διαφορετικές μηχανές αναζήτησης. Σύμφωνα με τους προγραμματιστές του Dogpile, το σύστημά τους δημιουργεί το πιο ολοκληρωμένο ζήτημα σε ολόκληρο το Διαδίκτυο.

Γιατί το χρειάζεστε αυτό

Εάν δεν μπορείτε να βρείτε πληροφορίες στο Google ή σε άλλη τυπική μηχανή αναζήτησης, αναζητήστε τις σε πολλές μηχανές αναζήτησης ταυτόχρονα χρησιμοποιώντας το Dogpile.

Τι είναι αυτό

Το BoardReader είναι ένα σύστημα αναζήτησης κειμένου για φόρουμ, υπηρεσίες Q&A και άλλες κοινότητες.

Το καλύτερο

Η υπηρεσία σάς επιτρέπει να περιορίσετε το πεδίο αναζήτησης σε ιστότοπους κοινωνικής δικτύωσης. Χάρη σε ειδικά φίλτρα, μπορείτε να βρείτε γρήγορα αναρτήσεις και σχόλια που ταιριάζουν με τα κριτήριά σας: γλώσσα, ημερομηνία δημοσίευσης και όνομα ιστότοπου.

Γιατί το χρειάζεστε αυτό

Το BoardReader μπορεί να είναι χρήσιμο για ειδικούς δημοσίων σχέσεων και άλλους επαγγελματίες των μέσων ενημέρωσης που ενδιαφέρονται για τη γνώμη των μέσων μαζικής ενημέρωσης για ορισμένα θέματα.

Τελικά

Η ζωή των εναλλακτικών μηχανών αναζήτησης είναι συχνά φευγαλέα. Η Lifehacker ρώτησε τον πρώην διευθύνοντα σύμβουλο του ουκρανικού υποκαταστήματος της εταιρείας Yandex Sergey Petrenko σχετικά με τις μακροπρόθεσμες προοπτικές τέτοιων έργων.


Σεργκέι Πετρένκο

Πρώην διευθύνων σύμβουλος της Yandex.Ukraine.

Όσο για την τύχη των εναλλακτικών μηχανών αναζήτησης, είναι απλό: να είναι πολύ εξειδικευμένα έργα με μικρό κοινό, επομένως, χωρίς σαφείς εμπορικές προοπτικές ή, αντίθετα, με την πλήρη σαφήνεια της απουσίας τους.

Αν κοιτάξετε τα παραδείγματα στο άρθρο, μπορείτε να δείτε ότι τέτοιες μηχανές αναζήτησης είτε ειδικεύονται σε μια στενή αλλά περιζήτητη θέση, η οποία, ίσως μόνο μέχρι στιγμής, δεν έχει αναπτυχθεί αρκετά ώστε να γίνει αντιληπτή στα ραντάρ της Google ή της Yandex, ή δοκιμάζουν μια αρχική υπόθεση στην κατάταξη, η οποία δεν είναι ακόμη εφαρμόσιμη στη συμβατική αναζήτηση.

Για παράδειγμα, εάν μια αναζήτηση Tor ξαφνικά αποδειχθεί ότι έχει ζήτηση, δηλαδή τουλάχιστον ένα ποσοστό του κοινού της Google θα χρειαστεί τα αποτελέσματα από εκεί, τότε, φυσικά, οι συνηθισμένες μηχανές αναζήτησης θα αρχίσουν να λύνουν το πρόβλημα του τρόπου βρείτε τα και δείξτε τα στον χρήστη. Εάν η συμπεριφορά του κοινού δείχνει ότι ένα σημαντικό ποσοστό χρηστών σε σημαντικό αριθμό ερωτημάτων φαίνεται να έχει πιο σχετικά αποτελέσματα, δεδομένα χωρίς να λαμβάνονται υπόψη παράγοντες που εξαρτώνται από τον χρήστη, τότε η Yandex ή η Google θα αρχίσουν να δίνουν τέτοια αποτελέσματα.

«Το να είσαι καλύτερος» στο πλαίσιο αυτού του άρθρου δεν σημαίνει «να είσαι καλύτερος σε όλα». Ναι, από πολλές απόψεις οι ήρωές μας απέχουν πολύ από το Yandex (ακόμα και μακριά από το Bing). Όμως κάθε μία από αυτές τις υπηρεσίες δίνει στον χρήστη κάτι που οι γίγαντες της βιομηχανίας αναζήτησης δεν μπορούν να προσφέρουν. Σίγουρα γνωρίζετε και εσείς παρόμοια έργα. Μοιραστείτε μαζί μας - ας συζητήσουμε.

ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΑΝΑΖΗΤΗΣΗ ΠΛΗΡΟΦΟΡΙΩΝ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Η αναζήτηση στο Διαδίκτυο είναι ένα σημαντικό στοιχείο της εργασίας στον Ιστό. Ο ακριβής αριθμός των πόρων Ιστού του σύγχρονου Διαδικτύου δεν είναι σχεδόν γνωστός σε κανέναν με βεβαιότητα. Σε κάθε περίπτωση, ο λογαριασμός πάει στα δισεκατομμύρια. Για να μπορέσετε να χρησιμοποιήσετε τις πληροφορίες που χρειάζονται τη συγκεκριμένη στιγμή, είτε για επαγγελματικούς είτε για ψυχαγωγικούς σκοπούς, πρέπει πρώτα να τις βρείτε σε αυτόν τον συνεχώς ανανεούμενο ωκεανό πόρων.

Για να είναι επιτυχής μια αναζήτηση στο Διαδίκτυο, πρέπει να πληρούνται δύο προϋποθέσεις: τα ερωτήματα πρέπει να είναι καλά διατυπωμένα και να τίθενται σε κατάλληλα σημεία. Με άλλα λόγια, ο χρήστης απαιτείται, αφενός, να μπορεί να μεταφράσει τα ενδιαφέροντά του αναζήτησης στη γλώσσα ερώτημα αναζήτησης, και από την άλλη, καλή γνώση των μηχανών αναζήτησης, των διαθέσιμων εργαλείων αναζήτησης, των πλεονεκτημάτων και των μειονεκτημάτων τους, που θα σας επιτρέψουν να επιλέξετε τα καταλληλότερα εργαλεία αναζήτησης σε κάθε συγκεκριμένη περίπτωση.

Επί του παρόντος, δεν υπάρχει κανένας πόρος που να ικανοποιεί όλες τις απαιτήσεις για αναζήτηση στο Διαδίκτυο. Επομένως, με μια σοβαρή προσέγγιση στην αναζήτηση, αναπόφευκτα πρέπει να χρησιμοποιήσετε διαφορετικά εργαλεία, χρησιμοποιώντας το καθένα στην πιο κατάλληλη περίπτωση.

Κύριος εργαλεία αναζήτησης στο διαδίκτυομπορούν να χωριστούν στις ακόλουθες κύριες ομάδες:

μηχανές αναζήτησης;

Καταλόγους Ιστού.

Πηγές αναφοράς.

Τοπικά προγράμματα για αναζήτηση στο Διαδίκτυο.

Η πιο δημοφιλής μηχανή αναζήτησης είναιμηχανές αναζήτησης- οι λεγόμενες μηχανές αναζήτησης στο Διαδίκτυο (Search Engines). Οι τρεις κορυφαίοι ηγέτες σε παγκόσμια κλίμακα είναι αρκετά σταθεροί - αυτοί είναι η Google, η Yahoo! και το Bing. Πολλές χώρες προσθέτουν τις δικές τους τοπικές μηχανές αναζήτησης βελτιστοποιημένες για τοπικό περιεχόμενο σε αυτήν τη λίστα. Με τη βοήθειά τους, θεωρητικά, μπορείτε να βρείτε οποιαδήποτε συγκεκριμένη λέξη στις σελίδες πολλών εκατομμυρίων ιστότοπων. Από την πλευρά του χρήστη, το κύριο μειονέκτημα των μηχανών αναζήτησης είναι η αναπόφευκτη παρουσίαθόρυβος πληροφοριώνστα αποτελέσματα. Έτσι συνηθίζεται να ονομάζουμε αποτελέσματα που, για τον έναν ή τον άλλο λόγο, περιλαμβάνονται στη λίστα των αποτελεσμάτων που δεν ταιριάζουν με το ερώτημα.

Παρά τις πολλές διαφορές, όλες οι μηχανές αναζήτησης στο Διαδίκτυο λειτουργούν με παρόμοιες αρχές και, από τεχνική άποψη, αποτελούνται από παρόμοια υποσυστήματα. Το πρώτο δομικό μέρος της μηχανής αναζήτησης - ειδικά προγράμματα, χρησιμοποιείται για αυτόματη αναζήτηση και επακόλουθη ευρετηρίαση ιστοσελίδων. Τέτοια προγράμματα ονομάζονται συνήθως spiders ή bots. Εξετάζουν τον κώδικα των ιστοσελίδων, βρίσκουν συνδέσμους που βρίσκονται σε αυτές και έτσι ανακαλύπτουν νέες ιστοσελίδες. Υπάρχουν επίσης εναλλακτικό τρόποσυμπερίληψη του ιστότοπου στο ευρετήριο. Πολλές μηχανές αναζήτησης προσφέρουν στους ιδιοκτήτες πόρων την ευκαιρία να προσθέσουν έναν ιστότοπο στη βάση δεδομένων τους μόνοι τους. Όπως και να έχει, τότε γίνεται λήψη, ανάλυση και ευρετηρίαση των ιστοσελίδων. Σε αυτά επισημαίνονται δομικά στοιχεία, εντοπίζονται λέξεις-κλειδιά, προσδιορίζονται οι σύνδεσμοι τους με άλλους ιστότοπους και ιστοσελίδες. Εκτελούνται επίσης και άλλες λειτουργίες, το αποτέλεσμα των οποίων είναι ο σχηματισμός της βάσης ευρετηρίου της μηχανής αναζήτησης. Αυτή η βάση είναι το δεύτερο κύριο στοιχείο κάθε μηχανής αναζήτησης. Επί του παρόντος, δεν υπάρχει καμία απολύτως πλήρης βάση δεδομένων ευρετηρίου που να περιέχει πληροφορίες για όλο το περιεχόμενο του Διαδικτύου. Δεδομένου ότι διαφορετικές μηχανές αναζήτησης χρησιμοποιούν διαφορετικά προγράμματα αναζήτησης ιστοσελίδων και δημιουργούν το ευρετήριό τους χρησιμοποιώντας διαφορετικούς αλγόριθμους, οι βάσεις ευρετηρίων μηχανών αναζήτησης μπορεί να διαφέρουν σημαντικά. Ορισμένοι ιστότοποι ευρετηριάζονται από πολλές μηχανές αναζήτησης, αλλά υπάρχει πάντα ένα ορισμένο ποσοστό πόρων που περιλαμβάνονται στη βάση δεδομένων μιας μόνο μηχανής αναζήτησης. Το γεγονός ότι κάθε μηχανή αναζήτησης έχει ένα τόσο πρωτότυπο και μη επικαλυπτόμενο τμήμα του ευρετηρίου σας επιτρέπει να βγάλετε ένα σημαντικό πρακτικό συμπέρασμα: εάν χρησιμοποιείτε μόνο μία μηχανή αναζήτησης, ακόμη και τη μεγαλύτερη, σίγουρα θα χάσετε ένα ορισμένο ποσοστό χρήσιμων συνδέσμων .

Το επόμενο μέρος της μηχανής αναζήτησης στο Διαδίκτυο είναι το πραγματικό πρόγραμμα αναζήτησης και ταξινόμησης. Αυτά τα προγράμματα επιλύουν δύο κύριες εργασίες: πρώτον, βρίσκουν σελίδες και αρχεία στη βάση δεδομένων που αντιστοιχούν στο εισερχόμενο αίτημα και, στη συνέχεια, ταξινομούν τον πίνακα δεδομένων που προκύπτει σύμφωνα με διάφορα κριτήρια. Η επιτυχία στην επίτευξη των στόχων της αναζήτησης εξαρτάται σε μεγάλο βαθμό από την αποτελεσματικότητα της δουλειάς τους.

Το τελευταίο στοιχείο μιας μηχανής αναζήτησης στο Διαδίκτυο είναι η διεπαφή χρήστη. Εκτός από τις συνήθεις απαιτήσεις για αισθητική και ευκολία για οποιονδήποτε ιστότοπο, οι διεπαφές μηχανών αναζήτησης έχουν μια άλλη σημαντική απαίτηση: πρέπει να προσφέρουν διάφορα εργαλεία για τη συλλογή και τη βελτίωση των ερωτημάτων, καθώς και την ταξινόμηση και το φιλτράρισμα των αποτελεσμάτων. Τα πλεονεκτήματα των μηχανών αναζήτησης είναι η εξαιρετική κάλυψη των πηγών, η σχετικά γρήγορη ενημέρωση του περιεχομένου της βάσης δεδομένων και μια καλή επιλογή Επιπρόσθετα χαρακτηριστικά.

Το κύριο εργαλείο για την εργασία με τις μηχανές αναζήτησης είναι ένα ερώτημα.

Για την αναζήτηση στο Διαδίκτυο, χρησιμοποιούνται επίσης ειδικές εφαρμογές εγκατεστημένες στον τοπικό υπολογιστή. Αυτά μπορεί να είναι τόσο απλά προγράμματα όσο και μάλλον πολύπλοκα συμπλέγματα αναζήτησης και ανάλυσης δεδομένων. Οι πιο κοινές προσθήκες προγράμματος περιήγησης είναι οι προσθήκες προγράμματος περιήγησης, οι πίνακες προγράμματος περιήγησης που έχουν σχεδιαστεί για να λειτουργούν με μια συγκεκριμένη υπηρεσία αναζήτησης και τα πακέτα μετα-αναζήτησης με δυνατότητες ανάλυσης αποτελεσμάτων.

Καταλόγους Ιστού - αυτοί είναι πόροι στους οποίους οι ιστότοποι διανέμονται ανά θεματικές κατηγορίες. Εάν ο χρήστης συνεργάζεται με τις μηχανές αναζήτησης μόνο μέσω ερωτημάτων, τότε ο κατάλογος έχει τη δυνατότητα να προβάλλει ολόκληρες τις θεματικές ενότητες. Η δεύτερη θεμελιώδης διαφορά μεταξύ των καταλόγων και των αυτόματων μηχανών αναζήτησης είναι ότι, κατά κανόνα, οι άνθρωποι συμμετέχουν άμεσα στο περιεχόμενό τους, οι οποίοι βλέπουν πόρους και αποδίδουν τον ιστότοπο σε μια ή την άλλη κατηγορία. Οι κατάλογοι Ιστού συνήθως χωρίζονται σε καθολικούς και θεματικούς. Η Universal προσπαθήστε να καλύψετε όσο το δυνατόν περισσότερα θέματα. Μπορείτε να βρείτε οτιδήποτε σε αυτά: από ιστότοπους για ποίηση μέχρι πόρους υπολογιστών. Με άλλα λόγια, έχουν το μέγιστο εύρος αναζήτησης. Οι θεματικοί κατάλογοι, από την άλλη πλευρά, ειδικεύονται σε ένα συγκεκριμένο θέμα, παρέχοντας το μέγιστο βάθος αναζήτησης μειώνοντας το εύρος κάλυψης των πόρων.

Το πλεονέκτημα των καταλόγων είναι η σχετικά υψηλή ποιότητα των πόρων, αφού κάθε τοποθεσία σε αυτόν προβάλλεται και επιλέγεται από ένα άτομο. Η θεματική ομαδοποίηση ιστότοπων σάς επιτρέπει να εντοπίζετε εύκολα ιστότοπους με παρόμοια θέματα. Αυτός ο τρόπος λειτουργίας είναι καλός για την ανακάλυψη νέων τοποθεσιών για εσάς σε ένα θέμα που σας ενδιαφέρει - είναι πιο ακριβής από τη χρήση μιας μηχανής αναζήτησης. Συνιστάται η χρήση καταλόγων ιστού για την πρώτη γνωριμία με οποιαδήποτε θεματική περιοχή, καθώς και η αναζήτηση ασαφών ερωτημάτων - θα έχετε την ευκαιρία να "περιπλανηθείτε" στις ενότητες του καταλόγου και να προσδιορίσετε με μεγαλύτερη ακρίβεια τι χρειάζεστε.

Τα μειονεκτήματα των καταλόγων web είναι γνωστά. Πρώτα απ 'όλα, πρόκειται για αργή αναπλήρωση της βάσης δεδομένων, καθώς η συμπερίληψη ενός ιστότοπου στον κατάλογο απαιτεί τη συμμετοχή ενός ατόμου. Όσον αφορά την αποτελεσματικότητα, ο κατάλογος Ιστού δεν είναι αντίπαλος των μηχανών αναζήτησης. Επιπλέον, οι κατάλογοι Ιστού είναι σημαντικά κατώτεροι από τις μηχανές αναζήτησης όσον αφορά το μέγεθος της βάσης δεδομένων.

Όταν μιλάμε για αναζήτηση στο Διαδίκτυο, δεν μπορούμε να αγνοήσουμε έναν αριθμό όρων που σχετίζονται στενά με αυτόν τον τομέα και χρησιμοποιούνται συχνά για να περιγράψουν και να αξιολογήσουν τις μηχανές αναζήτησης. Για παράδειγμα:πλάτος και βάθος αναζήτηση στο διαδίκτυο. Μια ευρεία αναζήτηση είναι μια αναζήτηση που συλλαμβάνει όσο το δυνατόν περισσότερες πηγές πληροφοριών. Ταυτόχρονα, τουλάχιστον μια αναφορά σε έναν συγκεκριμένο ιστότοπο που ταιριάζει με το ερώτημα θεωρείται επαρκής. Το βάθος αναζήτησης αναφέρεται στις λεπτομέρειες της ευρετηρίασης και της επακόλουθης αναζήτησης κάθε συγκεκριμένου πόρου. Για παράδειγμα, πολλές μηχανές αναζήτησης έχουν διαφορετικές προσεγγίσεις για την ευρετηρίαση διαφορετικών τοποθεσιών. Οι μεγάλοι και δημοφιλείς ιστότοποι ευρετηριάζονται στο μέγιστο βαθμό, τα ρομπότ προσπαθούν να μην χάσουν ούτε μια σελίδα από έναν τέτοιο πόρο. Ταυτόχρονα, σε άλλους ιστότοπους, μόνο η κύρια σελίδα και μερικές σελίδες περιεχομένου μπορούν να ευρετηριαστούν. Αυτές οι συνθήκες, φυσικά, επηρεάζουν τη μετέπειτα αναζήτηση. Η βαθιά αναζήτηση λειτουργεί με βάση την αρχή "είναι καλύτερο να συμπεριλάβετε περιττές πληροφορίες στα αποτελέσματα παρά να χάσετε οποιαδήποτε δεδομένα σχετικά με το θέμα αναζήτησης".

Είναι αρκετά συνηθισμένο να συναντάμε έννοιες όπως π.χπαγκόσμια και τοπική αναζήτηση στο διαδίκτυο. Η τοπική αναζήτηση στο Διαδίκτυο λαμβάνει υπόψη τη γεωγραφική θέση του χρήστη και δίνει προτίμηση σε αποτελέσματα που σχετίζονται με κάποιο τρόπο με μια συγκεκριμένη χώρα ή τοποθεσία. Μια καθολική αναζήτηση αγνοεί αυτές τις πληροφορίες και αναζητά όλους τους διαθέσιμους πόρους.

Κατά τη σύνταξη ενός ερωτήματος σε μηχανές αναζήτησης στο Διαδίκτυο, διάφορους τρόπους λειτουργίαςΑναζήτηση. Οι τυπικές λειτουργίες αναζήτησης που βρίσκονται στα περισσότερα μηχανήματα Διαδικτύου περιλαμβάνουναπλό και εκτεταμένο Αναζήτηση. Η απλή αναζήτηση σάς επιτρέπει να καθορίσετε μόνο μία δυνατότητα αναζήτησης σε ένα ερώτημα. Η σύνθετη αναζήτηση καθιστά δυνατή τη δημιουργία ερωτήματος από διάφορες συνθήκες, συνδέοντάς τις με λογικούς τελεστές.

Χρησιμοποιούνται διάφορες μέθοδοι για τη βελτίωση των ερωτημάτων αναζήτησης.φίλτρα . Φίλτρα ονομάζονται εκείνα ή άλλα βοηθητικά μέσα για τη σύνταξη ενός ερωτήματος που δεν σχετίζονται με την πλευρά περιεχομένου των συνθηκών ερωτήματος, αλλά περιορίζουν τα αποτελέσματα αναζήτησης σε κάποιο επίσημο σημάδι. Έτσι, για παράδειγμα, κατά την εφαρμογή ενός φίλτρου τύπου αρχείου κατά την αναζήτηση, ο χρήστης δεν παρέχει στο σύστημα πληροφορίες σχετικά με το αντικείμενο του αιτήματός του, αλλά απλώς περιορίζει τα αποτελέσματα που λαμβάνονται σε έναν συγκεκριμένο τύπο αρχείου που καθορίζεται στην συνθήκη του αιτήματός του.

Για τους περισσότερους χρήστες, οι καθολικές μηχανές αναζήτησης είναι το κύριο και συχνά το μόνο μέσο αναζήτησης στο Διαδίκτυο. Προσφέρουν καλή κάλυψη πηγών, καθώς και ένα σύνολο εργαλείων επαρκών για βασικές εργασίες αναζήτησης.

Η αγορά για τις καθολικές μηχανές αναζήτησης είναι αρκετά μεγάλη. Προσπαθήσαμε να αναλύσουμε τις πιο διάσημες μηχανές αναζήτησης και τα αποτελέσματα παρουσιάζονται με τη μορφή του Πίνακα 1.

Κατά την επιλογή μιας καθολικής μηχανής αναζήτησης, η ποιότητα των πόρων που βρέθηκαν με τη βοήθειά της παίζει σημαντικό ρόλο. Μπορείτε να προσδιορίσετε την προτιμώμενη μηχανή αναζήτησης για συγκεκριμένες εργασίες χρησιμοποιώντας τη "μέθοδο δείκτη". Η ουσία του έγκειται στο γεγονός ότι αρχικά συντάσσεται ένα συγκεκριμένο θεματικό ερώτημα αναζήτησης, μετά το οποίο μια ομάδα ανθρώπων - ειδικών σε αυτόν τον τομέα ερωτάται για να εντοπίσει τους καλύτερους, κατά τη γνώμη τους, πόρους του Διαδικτύου για το επιλεγμένο θέμα. Με βάση τα δεδομένα της έρευνας, σχηματίζεται μια λίστα με τοποθεσίες σήμανσης που είναι εγγυημένη ότι σχετίζονται με το ερώτημα και περιέχουν πληροφορίες υψηλής ποιότητας. Στη συνέχεια, το αίτημα αποστέλλεται στις δοκιμασμένες μηχανές αναζήτησης. Η λογική της αξιολόγησης είναι απλή: όσο υψηλότερα βρίσκονται οι ιστότοποι δεικτών στα αποτελέσματα αναζήτησης, τόσο καλύτερα ένας συγκεκριμένος πόρος είναι κατάλληλος για την εύρεση πληροφοριών σχετικά με ένα θέμα δοκιμής.



Μιλήστε για το τι υπάρχει στην εποχή μας Τεχνολογίες πληροφορικήςκαι η ατελείωτη αύξηση του όγκου των δεδομένων που είναι διαθέσιμα τόσο σε ένα άτομο όσο και στην κοινωνία, υπάρχουν πολλά προβλήματα με την επεξεργασία πληροφοριών και την αναζήτησή τους - αυτό είναι ήδη βλασφημία. Ποιος μόνο δεν θέτει αυτό το θέμα. Και για να μην σας φορτώσω με υποκειμενικές και εν μέρει αντικειμενικές κρίσεις που προέρχονται από διάφορες πηγές πληροφοριών σχετικά με το πρόβλημα, θα προχωρήσω απευθείας στη λύση του. Ας μιλήσουμε για την αναζήτηση σήμερα. Δηλαδή για προγράμματα και σοβαρά πληροφοριακά συστήματα που αναζητούν τα έγγραφα και τα δεδομένα που χρειαζόμαστε.

Αναβάθμιση "απευθείας αναζήτησης"

Όχι πολύ καιρό πριν, όταν τα δέντρα ήταν μεγάλα, και πληροφορίες ακόμη και μέσα τοπικό δίκτυοΔεν υπήρχαν τόσες πολλές επιχειρήσεις, οποιαδήποτε έρευνα διενεργήθηκε με μια συνηθισμένη απαρίθμηση μιας χούφτας διαθέσιμων αρχείων και έναν συνεπή έλεγχο των ονομάτων και του περιεχομένου τους. Μια τέτοια αναζήτηση ονομάζεται άμεση και τα προγράμματα (βοηθητικά προγράμματα) που χρησιμοποιούν τεχνολογία άμεσης αναζήτησης είναι παραδοσιακά παρόντα σε όλα λειτουργικά συστήματακαι πακέτα εργαλείων. Όμως, ακόμη και η ισχύς των σύγχρονων υπολογιστών δεν είναι αρκετή για μια γρήγορη και επαρκή αναζήτηση σε γιγαντιαίες ποσότητες δεδομένων κατά την άμεση αναζήτηση. Η αναζήτηση σε μερικές εκατοντάδες έγγραφα σε έναν δίσκο και η αναζήτηση σε μια τεράστια βιβλιοθήκη και αρκετές δεκάδες γραμματοκιβώτια είναι δύο διαφορετικά πράγματα. Επομένως, τα προγράμματα άμεσης αναζήτησης σήμερα ξεθωριάζουν σαφώς στο παρασκήνιο - αν μιλάμε για καθολικά εργαλεία.

Φυσικά, στον εταιρικό τομέα, αυτό το είδος αναζήτησης δεν έχει ζήτηση εδώ και πολύ καιρό. Οι όγκοι δεν είναι ίδιοι. Και, ως εκ τούτου, για πολλά χρόνια, και πρόσφατα αναμφίβολα, τεχνολογίες ικανές να εκτελέσουν μια γρήγορη και ακριβή αναζήτηση εγγράφων διάφορες μορφέςκαι από διάφορες πηγές, κάτι παραπάνω από σχετικό. Πριν από λίγο καιρό, ο «πατέρας» της Microsoft Bill Gates, ζηλεύοντας, προφανώς, την εκπληκτική επιτυχία της μηχανής αναζήτησης Google στο Διαδίκτυο, σε μια από τις συνεντεύξεις τύπου ανακοίνωσε την επιθυμία του λογισμικού (ήδη και όχι μόνο) να προωθήσει με κάθε δυνατό τρόπο , να αναπτύξουν και να εμβαθύνουν τη δημιουργία μηχανών αναζήτησης και τεχνολογιών. Αλλά πριν από τη δημιουργία οποιουδήποτε εκπληκτικού προγράμματος εργασίας από τη Microsoft ή ενός ανταγωνιστικού διακομιστή στο Διαδίκτυο, είναι ακόμα πολύ νωρίς (το MSN εξακολουθεί να υπολείπεται του Google). Ως εκ τούτου, στρεφόμαστε στις υπάρχουσες εξελίξεις. Ευρετήριο, ερώτημα, συνάφεια

Στον πυρήνα σύγχρονες τεχνολογίεςυπάρχουν δύο θεμελιώδεις διαδικασίες. Πρώτον, είναι η ευρετηρίαση των διαθέσιμων πληροφοριών και η επεξεργασία του αιτήματος, ακολουθούμενη από την έξοδο των αποτελεσμάτων. Όσο για το πρώτο, κάθε πρόγραμμα (είτε είναι μια μηχανή αναζήτησης επιτραπέζιου υπολογιστή, ένα εταιρικό σύστημα πληροφοριών ή μια μηχανή αναζήτησης στο Διαδίκτυο) δημιουργεί τη δική του περιοχή αναζήτησης. Δηλαδή, επεξεργάζεται έγγραφα και σχηματίζει ένα ευρετήριο αυτών των εγγράφων (μια οργανωμένη δομή που περιέχει πληροφορίες για τα επεξεργασμένα δεδομένα). Στο μέλλον, είναι το δημιουργημένο ευρετήριο που χρησιμοποιείται για εργασία - γρήγορη λήψη μιας λίστας απαραίτητων εγγράφων σύμφωνα με το αίτημα. Περαιτέρω, αν και σε καμία περίπτωση δεν είναι απλό από άποψη τεχνολογίας, αλλά είναι αρκετά κατανοητό απλός χρήστης. Το πρόγραμμα επεξεργάζεται το αίτημα (κατά λέξη-κλειδί) και εμφανίζει μια λίστα εγγράφων που περιέχουν αυτήν τη φράση-κλειδί. Δεδομένου ότι οι πληροφορίες περιέχονται σε ένα δομημένο ευρετήριο, η επεξεργασία του ερωτήματος είναι πολύ (δεκάδες και εκατοντάδες φορές!) ταχύτερη από ό,τι στην περίπτωση μιας άμεσης αναζήτησης (η επιλογή εγγράφου δεν πραγματοποιείται με απαρίθμηση αρχείων, αλλά με ανάλυση πληροφοριών κειμένου στο δείκτης).

Το πρόγραμμα εμφανίζει τα έγγραφα που βρέθηκαν στη λίστα που προκύπτει ανάλογα με τη συνάφεια - την αντιστοιχία του εγγράφου στο κείμενο του ερωτήματος. Σε διάφορες τεχνολογίες, βέβαια, υπάρχουν διάφορες μεθόδουςαναζήτηση και προσδιορισμός της συνάφειας του εγγράφου (ο αριθμός των "εμφανίσεων" της λέξης και η συχνότητα αναφοράς της στο έγγραφο, η αναλογία αυτών των παραμέτρων προς τον συνολικό αριθμό των λέξεων στο έγγραφο, η απόσταση μεταξύ των λέξεων του ερωτήματος φράση στα αρχεία που αναζητήθηκαν και ούτω καθεξής). Με βάση αυτές τις παραμέτρους, προσδιορίζεται το "βάρος" του εγγράφου και, ανάλογα με αυτό, ένα ή άλλο αρχείο εμφανίζεται στη λίστα των αποτελεσμάτων σε μια συγκεκριμένη θέση. Στην περίπτωση της αναζήτησης στο Διαδίκτυο, η κατάσταση είναι ακόμη πιο περίπλοκη. Πράγματι, σε αυτήν την περίπτωση, πρέπει να ληφθούν υπόψη πολλοί άλλοι παράγοντες (το Page Rank Google είναι ένα παράδειγμα). Αλλά αυτό είναι ένα θέμα για ένα ξεχωριστό άρθρο, επομένως δεν θα αγγίξουμε το Διαδίκτυο Επισκόπηση των μηχανών αναζήτησης

Αυτό το άρθρο συζητά τις δυνατότητες πολλών δημοφιλή προγράμματααναζήτηση, η οποία μπορεί να υπερηφανεύεται για αξιοπρεπείς ταχύτητες και καλή λειτουργικότητα. Αλλά η επίδειξη σε ένα φυλλάδιο είναι ένα πράγμα, αλλά το να στέκεσαι μπροστά στο βλέμμα ενός ειδικού είναι κάτι άλλο. Και δεν υπήρχαν ούτε πολλοί ούτε λίγοι ειδικοί, ένα πλήρες γραφείο εραστών για να ασχοληθούν με το λογισμικό για τη χρηστικότητά του. Στον δοκιμαστικό υπολογιστή (Athlon 2,2 MHz, με μνήμη τυχαίας προσπέλασηςΣκληρός δίσκος 1 GB, 160 GB Seagate 7200 rpm IDE και Σύστημα Windows XP) εγκαταστάθηκε ένα σύνολο προγραμμάτων: dtSearch Desktop, Snoop Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. Για δοκιμές, δημιουργήθηκε μια βάση κειμένου εγγράφων σε μορφές doc, txt και html με συνολικό μέγεθος όχι περισσότερο, ούτε λιγότερο, αλλά 20 gigabyte. Μια ομάδα συντρόφων, υπό την καθοδήγηση του ταπεινού υπηρέτη σας, δοκίμασαν, συνέκριναν και μοιράστηκαν τις υποκειμενικές εντυπώσεις τους σε κάθε λογισμικό. Διαβάστε παρακάτω για μια περίληψη των ευρημάτων. dtSearchDesktop

Ένα πρόγραμμα που, σύμφωνα με τους προγραμματιστές, ισχυρίζεται ότι είναι η ταχύτερη, πιο βολική και καλύτερη μηχανή αναζήτησης. Όπως, γενικά, και όλα τα υπόλοιπα αυτής της κριτικής. Η διεπαφή του dtSearch είναι αρκετά απλή, αλλά ορισμένα παράθυρα ή καρτέλες είναι κάπως υπερφορτωμένα με στοιχεία, γεγονός που δίνει την εντύπωση ότι είναι δύσχρηστα. Αλλά στην πραγματικότητα, δεν υπάρχουν ιδιαίτερες δυσκολίες. Η μόνη πραγματικά δυσάρεστη στιγμή είναι η έλλειψη υποστήριξης για το λογισμικό της ρωσικής γλώσσας (παρά το γεγονός ότι το πρόγραμμα μπορεί να αναζητήσει έγγραφα σε πολλές γλώσσες, η διεπαφή του είναι αποκλειστικά αγγλική).

Αλλά το dtSearch είναι ένα από τα λίγα προγράμματα που μπορούν να ευρετηριάσουν ιστοσελίδες σε ένα "βάθος" που καθορίζεται από τον χρήστη (ωστόσο, λαμβάνοντας υπόψη την "πρόσθετη αγορά" στο κιτ πρόσθετου dtSearch Spider). Αυτό είναι εκτός από την υποστήριξη αρχείων στο δίσκο διαφόρων μορφές κειμένουκαι email από γραμματοκιβώτιοάποψη. Ταυτόχρονα, το πρόγραμμα δεν ξέρει πώς να δουλεύει με βάσεις δεδομένων, οι οποίες είναι τόσο νόστιμο για τις μηχανές αναζήτησης λόγω του μεγάλου όγκου πληροφοριών που περιέχουν και της ευρείας διανομής σε εταιρείες, άρα και σε εταιρικά δίκτυα. Η ταχύτητα δημιουργίας ευρετηρίου των εγγράφων dtSearch ήταν μέχρι το σημείο. Κοιτάζοντας μπροστά, θα πω ότι αυτό το πρόγραμμα αντιμετώπισε την ευρετηρίαση μιας δεδομένης ποσότητας πληροφοριών στο ίδιο επίπεδο με έναν άλλο διαγωνιζόμενο - το iSYS - και μοιράστηκε τη δεύτερη θέση μαζί του στη λίστα με τα περισσότερα γρήγορα συστήματα. Δοκιμάστε 20 gigabyte πληροφοριών dtSearch που ευρετηριάστηκε σε 6 ώρες και 13 λεπτά, δημιουργώντας ένα ευρετήριο 7,9 GB για τις ανάγκες της επόμενης αναζήτησης.

Όσο για τις δυνατότητες αναζήτησης, εδώ είναι στο έπακρο. Πρώτον, το dtSearch έχει μια μορφολογική αναζήτηση (αναζήτηση μιας λέξης σε όλες τις μορφολογικές της μορφές). Χρησιμοποιώντας αυτήν την ευκαιρία, απελευθερώνεστε, ας πούμε, από σκέψεις όπως "σε ποια περίπτωση χρησιμοποιήθηκε μια συγκεκριμένη λέξη στο έγγραφο που χρειάζομαι;". Η χρήση της μορφολογικής αναζήτησης είναι σχεδόν πάντα δικαιολογημένη, επομένως θα πρέπει να υπάρχει σε οποιαδήποτε επαγγελματική μηχανή αναζήτησης.

Η αναζήτηση ήχου είναι μια μη τυπική λειτουργία ακόμη και για επαγγελματίες που αναζητούν. Η ουσία του έγκειται στο γεγονός ότι το πρόγραμμα θα αναζητήσει λέξεις που ακούγονται ίδια με τη λέξη που εισαγάγατε. Και το καλύτερο είναι ότι αυτή η δυνατότητα λειτουργεί και για τη ρωσική γλώσσα! Για παράδειγμα, η πληκτρολόγηση της λέξης "αυτί" σε ένα ερώτημα αναζήτησης θα έχει ως αποτέλεσμα όχι μόνο τις λέξεις "αυτί", αλλά και "αυτί".

Η αναζήτηση διόρθωσης σφαλμάτων είναι ένα πολύ σημαντικό χαρακτηριστικό. Χρησιμοποιείται για την αναζήτηση λέξεων που περιέχουν συντακτικά λάθη - αυτά μπορεί να είναι είτε τυπογραφικά λάθη είτε λάθη σε έγγραφα που λαμβάνονται χρησιμοποιώντας συστήματα αναγνώρισης χαρακτήρων, για παράδειγμα. Ένα απλό παράδειγμα είναι ότι ψάχνετε για τη λέξη πληκτρολόγιο. Κάποιο έγγραφο περιέχει τη λέξη "πληκτρολόγιο", είναι προφανές ότι στην πραγματικότητα αυτή η λέξη είναι "πληκτρολόγιο", απλώς ένα άτομο που πληκτρολογεί όταν πληκτρολογεί. Τώρα, η αναζήτηση με διόρθωση σφαλμάτων, θα εντοπίσει και θα συμπεριλάβει το έγγραφο με τη λέξη "πληκτρολόγιο" στο αποτέλεσμα. Επίσης στο dtSearch υπάρχει μια ρύθμιση που σας επιτρέπει να προσδιορίσετε τον βαθμό πιθανών λανθασμένων χαρακτήρων.

Αναζήτηση χρησιμοποιώντας συνώνυμα. Αυτή η δυνατότητα χρησιμοποιεί μια λίστα συνωνύμων για διάφορες λέξεις. Έτσι, για παράδειγμα, εισάγοντας τη λέξη "γρήγορα", το πρόγραμμα θα βρει επίσης τις λέξεις "υψηλής ταχύτητας" και άλλες που είναι συνώνυμες της λέξης "γρήγορα", εάν υπάρχουν, φυσικά, στη λίστα των συνωνύμων . Μια έτοιμη λίστα συνωνύμων δεν παρέχεται με το πρόγραμμα dtSearch, ωστόσο, μπορείτε να χρησιμοποιήσετε τις λίστες στο Διαδίκτυο (κατά συνέπεια, απαιτείται σύνδεση, η οποία δεν είναι πάντα βολική) ή μπορείτε να δημιουργήσετε τη δική σας λίστα με συνώνυμα.

Εκτός από τις αναφερόμενες λειτουργίες, το dtSearch μπορεί να πραγματοποιήσει αναζήτηση χρησιμοποιώντας φράσεις που αποτελούνται από λέξεις που συνδέονται με λογικές πράξεις. Σε κάθε λέξη στο ερώτημα μπορεί να αποδοθεί το δικό της «βάρος», δηλαδή η σημασία. Μια χρήσιμη επιλογή είναι να χρησιμοποιήσετε ένα λεξικό που αποτελείται από ασήμαντες λέξεις για να μην τις λαμβάνετε υπόψη κατά την αναζήτηση, αλλά αυτό το λεξικό είναι επίσης κενό και θα πρέπει να το συμπληρώσετε μόνοι σας.

Στη συνέχεια, εξετάστε τις δυνατότητες του προγράμματος όταν εργάζεστε στο δίκτυο. Στην πραγματικότητα, το dtSearch δεν προσφέρει συγκεκριμένες δυνατότητες δικτύωσης. Ωστόσο, είναι πολύ πιθανό να το χρησιμοποιήσετε στο δίκτυο. Εναλλακτικά, μπορείτε να δημιουργήσετε κάποιο ευρετήριο και να το τοποθετήσετε σε έναν δημόσιο (κοινόχρηστο) φάκελο. Το ίδιο το πρόγραμμα μπορεί να εγκατασταθεί για κάθε χρήστη σε έναν υπολογιστή ή να το τοποθετήσει επίσης σε έναν ανοιχτό φάκελο δημόσια πρόσβαση, και δημιουργήστε συντομεύσεις με ειδικό τρόπο για κάθε χρήστη ξεχωριστά, χρησιμοποιώντας παραμέτρους γραμμής εντολών, ο σκοπός των οποίων περιγράφεται στο αρχείο βοήθειας που παρέχεται με το πρόγραμμα. Επίσης, υπάρχει δυνατότητα αυτόματη εγκατάστασηπρογράμματα στο δίκτυο χρησιμοποιώντας ένα αρχείο MSI. Αυτό θα λάβει υπόψη τις ρυθμίσεις για κάθε συνδεδεμένο χρήστη.

Γενικά - ένα καλό πρόγραμμα από την κατηγορία των επαγγελματικών μηχανών αναζήτησης. Μπορεί να πληροί τις προϋποθέσεις για καλή βαθμολογία, ωστόσο, η απόκτηση εμπιστοσύνης και σεβασμού από τους χρήστες μπορεί να είναι δύσκολη για το dtSearch λόγω πολλών παραγόντων (δεν είναι όλα ομαλά με τη διεπαφή, οι Ρώσοι χρήστες στερούνται, δεν υπάρχουν φωτεινά χαρακτηριστικά για εργασία με το δίκτυο) . Όσον αφορά την απευθείας αναζήτηση εγγράφων, το πρόγραμμα δεν είχε επικαλύψεις με ρωσικό κείμενο. Όπως δεν υπήρχαν με τη δηλωμένη μορφολογία, ή με ασαφή αναζήτηση. Το σύστημα βρήκε επαρκώς τα απαραίτητα έγγραφα τόσο με ένα απλό αίτημα με μια λέξη όσο και χρησιμοποιώντας μερικές παραγράφους ή οποιοδήποτε έγγραφο ως φράση-κλειδί.

Επίσημη ιστοσελίδα:
Μέγεθος διανομής: 23 MbSnoop Prof Deluxe

Με βάση το όνομα, μπορείτε να μαντέψετε ότι υπάρχει υποστήριξη για τη ρωσική γλώσσα σε αυτό το πρόγραμμα. Είναι ήδη ωραίο. Όσο για τη διεπαφή, γενικά, είναι κάπως ασυνήθιστη, αλλά πολύ ελκυστική στην εμφάνιση. Ένα άλλο πράγμα είναι η ευκολία. Ένα πολύ αμφιλεγόμενο κριτήριο, αλλά παρόλα αυτά, πιθανώς, μια λύση πολλαπλών παραθύρων δεν είναι η καλύτερη επιλογή (το αίτημα εισάγεται σε ένα παράθυρο, το αποτέλεσμα εμφανίζεται σε άλλο κ.λπ.).

Το Bloodhound εξακολουθεί να χρησιμοποιεί τα ίδια ευρετήρια για την εκτέλεση γρήγορων αναζητήσεων, αλλά η ευρετηρίαση είναι πολύ πιο αργή από άλλα προγράμματα. Αυτό είναι πολύ περίεργο, ειδικά αν σκεφτεί κανείς ότι η ικανότητά του να επεξεργάζεται ερωτήματα αναζήτησης είναι πολύ αδύναμη, πράγμα που σημαίνει ότι η δομή του ευρετηρίου δεν είναι περίπλοκη. Πιθανότατα, το θέμα εδώ είναι στους μη βελτιστοποιημένους αλγόριθμους. Αυτό το πρόγραμμα αποδείχθηκε ότι ήταν ξεκάθαρο εκτός ευρετηρίου και ταχυτήτων αναζήτησης: ο χρόνος που δαπανάται για τη δημιουργία ενός ευρετηρίου είναι έξι φορές μεγαλύτερος από εκείνον του ίδιου dtSearch και iSYS. Η δημιουργία ευρετηρίου κειμένων 20 gigabyte για ένα bloodhound είχε ως αποτέλεσμα 38 ώρες και 46 λεπτά εργασίας. Και η δημιουργημένη "περιοχή αναζήτησης" κατέλαβε το ίδιο μέγεθος στον σκληρό δίσκο με τα αρχικά δεδομένα με ένα μικρό μείον - 19 gigabyte.

Το Bloodhound μπορεί να παρουσιαστεί ως εναλλακτική τυπική αναζήτησηστα Windows, δύσκολα μπορεί να κάνει περισσότερα. Το γεγονός ότι η πρωταρχική εργασία του Bloodhound είναι η απλούστερη αναζήτηση αρχείων υποδεικνύεται όχι μόνο από έναν μικρό αριθμό συναρτήσεων για την ανάλυση του κειμένου των ερωτημάτων αναζήτησης και μια σύνθετη αναζήτηση κατά χαρακτηριστικά αρχείου, αλλά ακόμη και από ένα παράθυρο αποτελεσμάτων που παρέχει απευθείας συνδέσμους προς τα αρχεία που βρέθηκαν, καθώς και στους φακέλους που περιέχουν αυτά τα αρχεία. Το παράθυρο αποτελεσμάτων δεν είναι πολύ κατατοπιστικό με την έννοια ότι μπορείτε να διαβάσετε ολόκληρο το αρχείο που βρέθηκε μόνο εκτελώντας το, δηλαδή δεν έχει ενσωματωμένο πρόγραμμα προβολής αρχείων. Αλλά δίνεται ένα απόσπασμα από το αρχείο, όπου βρέθηκε η λέξη που αναζητήθηκε, γενικά, ένα τέτοιο σχήμα εμφάνισης θυμίζει πολύ τις μηχανές αναζήτησης στο Διαδίκτυο.

Μιλώντας για τις συγκεκριμένες δυνατότητες επεξεργασίας ερωτημάτων αναζήτησης, αξίζει να σημειωθεί ότι δεν υπάρχει κάτι όπως "αναζήτηση κειμένου", το μέγιστο που μπορεί να αναζητηθεί είναι μια φράση, έστω και μόνο επειδή δεν υπάρχει πεδίο εισαγωγής κειμένου πολλών γραμμών. Ωστόσο, μπορείτε επίσης να αναλύσετε τη φράση που εισαγάγατε και το Bloodhound μας προσφέρει ένα τυπικό σύνολο αναζήτησης εδώ: λογικές πράξεις, αναζήτηση με μάσκα και αναζήτηση εισαγωγικών ... όχι πολύ. Υπάρχουν κάποια βασικά στοιχεία μορφολογικής αναζήτησης στο πρόγραμμα, αλλά πιθανώς τόσο ακατέργαστα που μάλλον παρεμποδίζει τη σωστή εργασία (κατά τη διάρκεια των δοκιμών, παρατηρήθηκαν πολλές επικαλύψεις με λανθασμένη χρήση μορφολογίας).

Αλλά το πρόγραμμα σάς επιτρέπει να καθορίσετε χαρακτηριστικά αρχείου (ημερομηνία εγγράφου, όνομα αρχείου, όνομα φακέλου) κατά την αναζήτηση και σε αυτά τα ερωτήματα μπορείτε επίσης να χρησιμοποιήσετε το ίδιο σύνολο αναζήτησης. Επίσης, μπορείτε να αναζητήσετε μηνύματα καθορίζοντας τις παραμέτρους (Από, Θέμα... κ.λπ.).

Λοιπόν, καταλάβαμε την ίδια την αναζήτηση, τι άλλο είναι ενδιαφέρον για το πρόγραμμα, για το οποίο έλαβε τόσα πολλά βραβεία, σύμφωνα με πληροφορίες από την επίσημη ιστοσελίδα; Είναι δύσκολο να πούμε τι είναι τόσο ιδιαίτερο σε αυτό, πιθανότατα, η διεπαφή του Bloodhound είναι ευνοϊκή για τον εαυτό της (απλώς εξωτερικά, για να μην αναφέρουμε τη χρηστικότητα).

Οι λειτουργίες με ευρετήρια είναι πολύ τυπικές, το ωραίο είναι η δυνατότητα ενημέρωσης ευρετηρίων σε ένα χρονοδιάγραμμα. Επιπλέον, τα ευρετήρια μπορούν να χρησιμοποιηθούν και στο διαδίκτυο. Από εδώ και πέρα ​​πρέπει να γίνουμε πιο συγκεκριμένοι.

Παρά τον πρωτόγονο χαρακτήρα των ερωτημάτων αναζήτησης, το πρόγραμμα μπορεί να χρησιμοποιηθεί για την αναζήτηση αρχείων, επομένως η χρήση του μπορεί να δικαιολογηθεί σε δίκτυα. Αν και με μεγάλη έκταση, αφού σε ένα μεγάλο δίκτυο η προτεραιότητα είναι η γρήγορη αναζήτηση δεδομένων χρησιμοποιώντας σύνθετα ερωτήματα αναζήτησης λόγω του τεράστιου όγκου πληροφοριών - και σαφώς υπάρχουν προβλήματα με την ταχύτητα της αναζήτησης και του προγράμματος. Πρέπει να πω ότι η δουλειά με το δίκτυο στο Bloodhound είναι μελετημένη όπως θα έπρεπε. Μια ξεχωριστή εφαρμογή έχει σχεδιαστεί ειδικά για αυτό - ο διακομιστής Bloodhound. Λειτουργεί με τον ίδιο τρόπο όπως ακριβώς το Bloodhound (έχουν μία μηχανή αναζήτησης), μόνο για έγγραφα που φιλοξενούνται σε έναν κεντρικό διακομιστή ή σε κοινόχρηστους πόρους στο εταιρικό δίκτυο. Ο διακομιστής Bloodhound δημιουργεί νέα ευρετήρια σε κοινόχρηστους πόρους ή χρησιμοποιεί αυτούς που έχουν δημιουργηθεί προηγουμένως. Οποιοσδήποτε χρήστης στο εταιρικό δίκτυο μπορεί να συνδεθεί στον διακομιστή Bloodhound και να τον χρησιμοποιήσει για πρόσβαση σε οποιοδήποτε έγγραφο (που βρίσκεται στο τρέχον ευρετήριο) χρησιμοποιώντας ένα πρόγραμμα περιήγησης στο Διαδίκτυο. Συμφωνώ, ένα τέτοιο σχήμα είναι εξαιρετικά βολικό: αποδεικνύεται ότι τα αρχεία στο δικό σας δίκτυο μπορούν να αναζητηθούν με τον ίδιο τρόπο όπως και οι πληροφορίες στο Διαδίκτυο μέσω, για παράδειγμα, της Google.

Αξιολογώντας όλα τα πλεονεκτήματα και τα μειονεκτήματα αυτού του προγράμματος, το συμπέρασμα υποδηλώνει ότι για τα εταιρικά δίκτυα οι δυνατότητές του πιθανότατα δεν θα είναι αρκετές (παρά την καλή οργάνωση της εργασίας με το δίκτυο), αλλά για έναν οικιακό υπολογιστή ή ακόμα και για ένα οικιακό δίκτυο. είναι, καταρχήν, μπορεί να ταιριάζει. Αν και ούτε η ταχύτητα της δουλειάς, ούτε οι δυνατότητες αναζήτησης εμπνέουν αισιοδοξία…

Επίσημος ιστότοπος στα ρωσικά:
Μέγεθος διανομής: 6 MbGoogle Desktop Search + GDS Enterprise

Φυσικά, δεν θα μπορούσαμε να αγνοήσουμε έναν τόσο επιφανή προγραμματιστή. Το όνομα Google μιλά ήδη πολύ. Οι άνθρωποι που χρησιμοποιούν την πιο ισχυρή μηχανή αναζήτησης στο Διαδίκτυο για χρόνια θα αποφασίσουν πιθανώς να εγκαταστήσουν τη συγκεκριμένη μηχανή αναζήτησης στον υπολογιστή τους χωρίς καμία αμφιβολία. Είναι σαν να σκέφτεσαι: Google στον οικιακό σου υπολογιστή! Ωστόσο, χωρίς να υποκύψουμε σε προκλήσεις με μια ευρέως προωθούμενη επωνυμία, ας προσπαθήσουμε να εξετάσουμε νηφάλια, και κυρίως αντικειμενικά, τις δυνατότητες της «επιτραπέζιας» μηχανής αναζήτησης από την Google.

Το πρώτο πράγμα που τραβάει την προσοχή σας είναι η έλλειψη του δικού του κελύφους για το πρόγραμμα. Το Google Desktop Search εξακολουθεί να βρίσκεται στο παράθυρο του προγράμματος περιήγησης, αντίστοιχα, ολόκληρη η διεπαφή της έκδοσης για επιτραπέζιους υπολογιστές πήγε στο λογισμικό από τον μεγαλύτερο αδελφό του Διαδικτύου. Το αν αυτό είναι καλό ή κακό είναι ένα συζητήσιμο ζήτημα: σε κάποιον αρέσει ο μινιμαλισμός στη σχεδίαση αυτής της μηχανής αναζήτησης και κάποιος θέλει να δει μια πλήρη εφαρμογή γεμάτη με κάθε είδους κουμπιά και ούτω καθεξής.

Τι τραβάει την προσοχή σας αμέσως μετά το σχέδιο; Και το γεγονός ότι αυτή η ίδια Google Desktop Search αρχίζει να ευρετηριάζει τα πάντα στον υπολογιστή, χωρίς καμία απαίτηση για αυτό! Και αυτό που είναι πιο ενδιαφέρον, είναι αδύνατο να επιλέξετε μονοπάτια ευρετηρίασης χρησιμοποιώντας την Αναζήτηση στο Google Desktop. Θα πρέπει να κατεβάσετε ένα ξεχωριστό πρόγραμμα (TweakGDS), το οποίο θα σας επιτρέψει να επεκταθείτε ελαφρώς ρυθμίσεις googleΕπιφάνεια εργασίας, συμπεριλαμβανομένου του καθορισμού των θέσεων που είναι απαραίτητες για την ευρετηρίαση. Αν και, ενώ τα καταλαβαίνετε όλα, θα δημιουργήσει ήδη ευρετήριο του τυπικού σκληρού δίσκου, επομένως αυτή η ρύθμιση χρειάζεται περισσότερο όταν εργάζεστε με μεγάλες ποσότητες δεδομένων, κάτι που είναι πολύ σημαντικό όταν χρησιμοποιείται σε εταιρικά δίκτυα (έκδοση Enterprise). Ωστόσο, δεν είναι γεγονός ότι μετά τη λήψη του TweakGDS, τα προβλήματά σας θα λυθούν. Εξάλλου, χρειάζεται τη Microsoft . Πλαίσιο δικτύουκαι Microsoft Scripting Runtime. Ναι... η εγκατάσταση, καθώς και η πρόσβαση στις ρυθμίσεις, θα μπορούσαν να έχουν διευκολυνθεί, αν και, κατά πάσα πιθανότητα, οι προγραμματιστές μπορούν να καταλάβουν: γιατί να γράψετε κάτι νέο όταν υπάρχει ήδη μια έτοιμη μηχανή αναζήτησης, να το μεταφέρετε σε τοπικός υπολογιστήςκαι ας το «απολαύσει» ο χρήστης, και το γνωστό όνομα να φτιάξει άλλο ένα αριστούργημα από «αυτό». Άντε, ας τελειώσουμε αυτή τη λυρική παρέκβαση και ας προχωρήσουμε στην αναζήτηση.

Όσον αφορά την ανάλυση των ερωτημάτων αναζήτησης και την έκδοση αποτελεσμάτων, όλα εδώ είναι απολύτως πανομοιότυπα με το Google στο Διαδίκτυο: το ίδιο σύστημα εμφάνισης αποτελεσμάτων, το ίδιο τυπικό σύνολο λογικών λειτουργιών για ερωτήματα αναζήτησης. Σε γενικές γραμμές, η Αναζήτηση στο Google Desktop, όπως προηγούμενο πρόγραμμα, έχει σχεδιαστεί αποκλειστικά για αναζήτηση αρχείων - φυσικά, δεν υπάρχει εσωτερικό πρόγραμμα προβολής για αυτά τα αρχεία. Ο αριθμός των μορφών αρχείων που υποστηρίζονται από την Αναζήτηση στο Google Desktop είναι αρκετά επαρκής και είναι επίσης ωραίο να πραγματοποιεί αναζήτηση στις σελίδες του Διαδικτύου που επισκέπτεστε, λαμβάνοντας δεδομένα από τη μνήμη cache. Οι ταχύτητες αναζήτησης και ευρετηρίασης είναι αρκετά αποδεκτές. Είναι αλήθεια, για οικιακή χρήση. Με εντυπωσιακά 20 gigabyte κειμένων, η Αναζήτηση Google Desktop κατάφερε σε 8 ώρες και 17 λεπτά. Αφιερώστε λίγες μέρες στην επεξεργασία πληροφοριών από το εταιρικό δίκτυο μιας μεγάλης επιχείρησης δεν χαμογελά σε κανέναν διαχειριστή συστήματος. Στα θετικά: το μέγεθος του δημιουργημένου ευρετηρίου αποδείχθηκε ότι είναι στο επίπεδο (4,5 GB) με μια άλλη μηχανή αναζήτησης που δοκιμάστηκε σε αυτήν την αναθεώρηση - SearchInform.

Ένα μεγάλο πλεονέκτημα (ή παράλειψη - εσείς αποφασίζετε) της Google Desktop Search είναι ότι υποστηρίζει πρόσθετα που μπορούν να αλλάξουν πολλά προς το καλύτερο. Ένα άλλο πράγμα είναι ότι η σύνδεση των προσθηκών και η διαμόρφωσή τους περιπλέκει τόσο πολύ το έργο της εγκατάστασης μιας μηχανής αναζήτησης που αρχίζετε να αναρωτιέστε εάν όλα αυτά είναι απαραίτητα όταν μπορείτε να εγκαταστήσετε ένα κανονικό, πλήρες πρόγραμμα στο οποίο όλα θα υπάρχουν ήδη. Εξάλλου, για να χρησιμοποιήσετε κάθε δυνατότητα, θα πρέπει να εγκαταστήσετε ένα νέο πρόσθετο. Ακόμη και για να λειτουργήσει πλήρως το πρόγραμμα με τα αρχεία, χρειάζεται ξεχωριστή λοσιόν. Συναρπάζει και σαγηνεύει το δωρεάν όλων αυτών των πρόσθετων ενοτήτων. Ωστόσο, εάν δεν λάβετε υπόψη την έκδοση για επιτραπέζιους υπολογιστές της μηχανής αναζήτησης, τότε η σωστή ρύθμιση του GDS Enterprise ενδέχεται να μην είναι στη δύναμή σας - δεν είναι μάταιο ότι οι ειδικοί της Google προσφέρουν τις υπηρεσίες τους για να δημιουργήσουν τις δικές τους λογισμικόγια το δίκτυό σας μόνο με 10.000 $.

Εάν παρόλα αυτά κατακτήσετε τη διαδικασία εγκατάστασης και εγκατάστασης (ή πληρώσετε 10.000 $ στην ομάδα γρήγορης απόκρισης της Google), θα καταλάβετε ότι η πολυπλοκότητα της εγκατάστασης υπερκαλύπτεται από πολύ ευέλικτες ρυθμίσεις όταν χρησιμοποιείται σε εταιρικά δίκτυα. Μια σημαντική πτυχή της εργασίας του Google Desktop σε ένα εταιρικό δίκτυο είναι η χρήση πολιτικές ομάδας, που καθιστά δυνατό τον ορισμό προτιμήσεων για κάθε χρήστη.

Συνοψίζοντας, πρέπει να ειπωθεί ότι η πιο λογική χρήση αυτού του προγράμματος είναι ένας υπολογιστής στο σπίτι ή στην εργασία. Πράγματι, για έναν κανονικό υπολογιστή, αρκεί απλώς να εγκαταστήσετε το πρόγραμμα - θα κάνει τα υπόλοιπα μόνο του (δεν θα σας ρωτήσει καν για τίποτα).

Ωστόσο, το Google Desktop Search Enterprise θα είναι αποδεκτό σε περιπτώσεις όπου υπάρχει επείγουσα ανάγκη για ευέλικτες ρυθμίσεις πολιτικής δικτύου για τη χρήση της μηχανής αναζήτησης, ενώ η δυνατότητα επεξεργασίας ερωτημάτων αναζήτησης θα είναι στη δεύτερη θέση σε σημασία και σε χρόνο (ή χρήμα) που δαπανώνται για τη ρύθμιση του προγράμματος θα είναι πρώτη.

Επίσημη ιστοσελίδα:
Μέγεθος διανομής με το TweakGDS: 1,2 MbCopernic Desktop Search

Κάντε κλικ στην εικόνα για μεγέθυνση

Η διεπαφή του προγράμματος προκαλεί εξαιρετικά θετικά συναισθήματα - όλα γίνονται σύμφωνα με τα γενικά αποδεκτά πρότυπα, τίποτα περιττό, με μια λέξη, ένα ευχάριστο σχέδιο. Θα είναι πολύ εύκολο για έναν αρχάριο να κατανοήσει τη διεπαφή του Copernic Desktop Search. Αν και, είναι κάπως ενοχλητικό το γεγονός ότι οι σχεδιαστές δημιούργησαν ρητά τη διεπαφή του προγράμματος, λαμβάνοντας υπόψη το γεγονός ότι το πρόγραμμα θα λειτουργεί στο τυπικό θέμα των Windows XP. Όταν χρησιμοποιείτε το ίδιο κλασικό θέμα, το πρόγραμμα δεν φαίνεται τόσο όμορφο. Αλλά αυτό είναι περισσότερο θέμα γούστου.

Στην πρώτη εκκίνηση, το πρόγραμμα προσφέρει τη δημιουργία ευρετηρίων για αναζήτηση. Φαινόταν κάπως ασυνήθιστο ότι μετά την επιλογή φακέλων για ευρετηρίαση, το πρόγραμμα δεν προσφέρει να πατήσει κανένα κουμπί, όπως "Έναρξη ευρετηρίασης", ενώ η ευρετηρίαση δεν ξεκινά αυτόματα, μόνο τότε παρατηρήθηκε ότι το Copernic προσπαθεί να ξεκινήσει την ευρετηρίαση όταν ο υπολογιστής είναι αδρανής . Θα πρέπει να ψάξετε λίγο στις επιλογές του προγράμματος για να ρυθμίσετε τα πάντα σωστά. Θα πρέπει να σημειωθεί ότι υπάρχουν αρκετά ευρείες επιλογές για προσαρμογή. αυτόματη δημιουργίαευρετήριο: ενσωματωμένος προγραμματιστής, δυνατότητα δημιουργίας ευρετηρίου ενώ ο υπολογιστής είναι αδρανής, στο παρασκήνιο, με χαμηλή προτεραιότητα. Η ευρετηρίαση δεν ήταν πολύ γρήγορη - 10 ώρες 51 λεπτά - είναι πιο αργή από ό,τι σε άλλες μηχανές αναζήτησης (εκτός από το Bloodhound, ωστόσο το Copernic είναι μια τάξη μεγέθους ταχύτερο από την ανάπτυξη της iSleuthHound Technologies.

Τώρα σχετικά με τη δομή του δείκτη. Γενικά, δεν υπάρχει τίποτα ιδιαίτερο σε αυτό. Είναι δυνατή η επιλογή τύπων αρχείων, τόσο σε γενικευμένη όσο και σε λεπτομερή μορφή. Δηλαδή, αρχικά μπορείτε να επιλέξετε τι θέλετε να δημιουργήσετε ευρετήριο - Έγγραφα, Εικόνες, Βίντεο, Μουσική. Στην άλλη καρτέλα του παραθύρου επιλογών, θα μπορείτε να επιλέξετε συγκεκριμένους τύπους αρχείων κατά επέκταση. Επιπλέον, μπορείτε να διαμορφώσετε το ευρετήριο με τέτοιο τρόπο ώστε, για παράδειγμα, να μην καταχωρούνται στο ευρετήριο εικόνες με μέγεθος μικρότερο από 16x16 ή να μην ευρετηριάζονται αρχεία ήχου διάρκειας μικρότερης των 10 δευτερολέπτων. Εκτός από την ευρετηρίαση αρχείων από φακέλους, το Copernic μπορεί να εργαστεί με μηνύματα ηλεκτρονικού ταχυδρομείου και επαφές από το βιβλίο διευθύνσεων του Microsoft Outlook και του Microsoft Outlook Express, είναι δυνατή η ευρετηρίαση Αγαπημένων και Ιστορικού από τον Internet Explorer.

Όσο για τις δυνατότητες αναζήτησης, εδώ είναι πολύ αδύναμες. Κατά τη διάρκεια των δοκιμών, αποκαλύφθηκε ακόμη ότι το πρόγραμμα δεν αναζητά έγγραφα σε μορφές txt και html στα ρωσικά, επιτρέποντάς σας να τα βρείτε μόνο με επικεφαλίδες και σε καμία περίπτωση με περιεχόμενο. Το μόνο πράγμα που παρέχει το πρόγραμμα για τη βελτίωση της αποτελεσματικότητας αναζήτησης είναι η χρήση του τυπικό σετλογικές πράξεις, και ακόμη και τότε, αυτή η πιθανότητα ανακαλύφθηκε πειραματικά, αφού δεν τεκμηριώθηκε. Παρεμπιπτόντως, η βοήθεια του προγράμματος δεν είναι επίσης εντάξει - είναι διαθέσιμη μόνο μέσω του Διαδικτύου, το οποίο, βλέπετε, είναι πολύ άβολο και δεν υπάρχουν πάρα πολλές πληροφορίες βοήθειας στο δίκτυο. Προφανώς, οι προγραμματιστές αποφάσισαν ότι η απλή διεπαφή του προγράμματος δεν συνεπάγεται την παρουσία κανονικής βοήθειας. Συνεχίζοντας τη συζήτηση σχετικά με τις δυνατότητες αναζήτησης, πρέπει να σημειωθεί ότι, παρά την κακή ανάλυση των ερωτημάτων, το πρόγραμμα παρέχει ένα ενδιαφέρον σύστημα αναζήτησης - ο χρήστης μπορεί να επιλέξει τον τύπο των αρχείων (εικόνες, βίντεο, μουσική κ.λπ.), να εισαγάγει ένα ερώτημα αναζήτησης και επιλέξτε χαρακτηριστικά που είναι συγκεκριμένα για τον επιλεγμένο τύπο αρχείου. Για παράδειγμα, για αρχεία ήχου, αυτές μπορεί να είναι τιμές από ετικέτες mp3 (καλλιτέχνης, άλμπουμ, ημερομηνία κ.λπ.), για εικόνες, για παράδειγμα, μπορείτε να επιλέξετε το μέγεθός τους (κατά ανάλυση), γενικά, κάθε τύπος έχει τις δικές του ρυθμίσεις. Μετά την αναζήτηση ενός συγκεκριμένου τύπου αρχείων, το πρόγραμμα θα εμφανίσει μια πολύ ενημερωτική λίστα στο παράθυρο αποτελεσμάτων και εάν το αίτημά σας περιλαμβάνει αρχεία άλλων τύπων, μπορείτε να τα ανοίξετε κάνοντας κλικ σε έναν συγκεκριμένο σύνδεσμο.

Ξεχωριστά, αξίζει να αναφέρουμε το παράθυρο εμφάνισης αποτελεσμάτων. Τα περιεχόμενα αυτών των αρχείων εμφανίζονται κάτω από τη λίστα των αρχείων που βρέθηκαν (ένα παρόμοιο σχήμα χρησιμοποιείται συχνά σε πελάτες αλληλογραφίας). Είναι αλήθεια ότι το κείμενο μπορεί να προβληθεί μόνο στην εγγενή του μορφή και δεν υπάρχει λειτουργία εμφάνισης απλού κειμένου, κάτι που δεν είναι πάντα βολικό, καθώς το άνοιγμα ενός εγγράφου σε αυτήν την περίπτωση απαιτεί περισσότερο χρόνο. Όμως, δεδομένου ότι το Copernic μπορεί να αναζητήσει εικόνες και μουσική, υπάρχει η δυνατότητα προβολής αυτών των αρχείων πολυμέσων.

Οι βασικές αρχές αυτού του προγράμματος έχουν περιγραφεί, τώρα ας δούμε τι μπορεί να μας προσφέρει το Copernic Desktop Search για εργασία με το δίκτυο ... Κατ 'αρχήν, μπορείτε να παρακολουθήσετε για πολύ μεγάλο χρονικό διάστημα, αλλά είναι απίθανο να δείτε τίποτα. Με άλλα λόγια, αυτό το πρόγραμμα δεν σχεδιάστηκε ως δικτυακό. Το Copernic Desktop Search είναι αποκλειστικά μια μηχανή αναζήτησης στο σπίτι.

Προφανώς, η μόνη (πιο λογική) χρήση αυτού του προγράμματος είναι οικιακός υπολογιστής. Εδώ, θα ανταπεξέλθει πλήρως σε όλα τα απλά ερωτήματα αναζήτησης των χρηστών, που αποτελούνται από μία ή δύο λέξεις, θα βρει τις απαραίτητες πληροφορίες και τον διαχωρισμό των αναζητήσεων ανά τύπους αρχείων και υποστήριξη για αρχεία πολυμέσων, μαζί με ευρετηρίαση φόντου σε λειτουργία χαμηλής προτεραιότητας , σε συνδυασμό με μια ευχάριστη διεπαφή, δίνουν στο πρόγραμμα μόνο δύναμη για να κερδίσει την εμπιστοσύνη μεταξύ άπειρων χρηστών.

Επίσημη ιστοσελίδα
Μέγεθος διανομής: 2,6 MbISYS Desktop

Κάντε κλικ στην εικόνα για μεγέθυνση

Ένα πολύ δυνατό πρόγραμμα. Όσον αφορά το επίπεδο εξοπλισμού με κάθε είδους λειτουργίες, βρίσκεται κάπου κοντά στην επόμενη μηχανή αναζήτησης SearchInform στη λίστα. Ταυτόχρονα, το μέγεθος του αρχείου εγκατάστασης είναι πάνω από 40Mb! Είναι δύσκολο να πούμε τι θα μπορούσε να γεμισθεί σε τέτοια μεγέθη, γιατί το ίδιο SearchInform, με παρόμοια λειτουργικότητα, παίρνει 15 Mb.

Η διαδικασία εγκατάστασης εδώ δεν είναι επίσης πολύ ευχάριστη, ή μάλλον ούτε καν η διαδικασία εγκατάστασης. Ακόμη και πριν από τη λήψη του προγράμματος, θα σας ζητηθεί να εγγραφείτε, διαφορετικά - τίποτα. Στη συνέχεια, η διεπαφή. Είναι φτιαγμένο πολύ όμορφα, τίποτα το περιττό δεν τραβάει τα βλέμματα, ωστόσο αυτές είναι οι εντυπώσεις ενός ανθρώπου που τον έχει ήδη κάπως συνηθίσει. Δεν θα είναι εύκολο για έναν αρχάριο να καταλάβει πού και τι είναι, πού να κάνει κλικ και πού τελικά να ψάξει. Συνιστάται ιδιαίτερα να διαβάσετε τη βοήθεια πριν ξεκινήσετε την εργασία - εξοικονομήστε πολλά νεύρα και χρόνο. Εκτός από όλα τα άλλα, είναι επίσης πλήρης απουσίαΥποστήριξη ρωσικής γλώσσας στο πρόγραμμα. ΟΧΙ καλα. Επιπλέον, τα παράθυρα εδώ δεν είναι υπερφορτωμένα με χειριστήρια, αλλά αυτό έγινε με το κόστος της πολλαπλής μονάδας και της χρήσης πρόσθετων παραθύρων. Για παράδειγμα, τα ερωτήματα αναζήτησης εισάγονται εκτελώντας ένα πρόγραμμα και η διαχείριση των ευρετηρίων γίνεται με χρήση άλλου προγράμματος. Τα ερωτήματα αναζήτησης εισάγονται επίσης εδώ σε ξεχωριστά πλαίσια που εμφανίζονται. Είναι δύσκολο να πούμε ποια είναι καλύτερη - υπερφορτωμένη διεπαφή ή πανταχού παρόν πολλαπλών παραθύρων, μάλλον, είναι θέμα γούστου.

Όσον αφορά τη δημιουργία ευρετηρίων, το πρόγραμμα παρέχει επιλογές για την απλοποίηση της διαδικασίας ρύθμισης επιλογών για ένα νέο ευρετήριο. Αυτά τα χαρακτηριστικά περιλαμβάνουν πολλά έτοιμα πρότυπαγια να δημιουργήσετε ευρετήρια στο My Documents, Mail, Mail and Documents, Συγκεκριμένος φάκελος, φάκελος με επιλεγμένους τύπους αρχείων, κ.λπ. Αυτά τα πρότυπα διευκολύνουν τη δημιουργία ευρετηρίων στο πρώτο στάδιο. Το βοηθητικό πρόγραμμα για εργασία με ευρετήρια έχει μια όχι πολύ καλή διεπαφή που φοβίζει κάποια πολυπλοκότητα (αυτή είναι μια πολύ υποκειμενική εκτίμηση, για να είμαι ειλικρινής), αλλά αν το κοιτάξετε, παρέχει πολλές χρήσιμες επιλογές και γενικά η χρήση του δεν προκαλεί πολλή δυσκολία. Το ISYS Desktop μπορεί να ευρετηριάσει δεδομένα από διάφορες πηγές δεδομένων και επίσης παρέχει πολλές ευέλικτες ρυθμίσεις για τέτοια ευρετηρίαση. Αναμεταξύ Επιπρόσθετα χαρακτηριστικάγια ευρετηρίαση: υποστήριξη για SQL, FTP, TRIM Context, WORLDOX 2002, σενάρια. Κατά τη δημιουργία ευρετηρίου, εάν επιλέξατε την επιλογή "Φάκελος με επιλογή τύπων αρχείων", έχετε τη δυνατότητα να επιλέξετε τους τύπους αρχείων που θα ευρετηριαστούν χειροκίνητα (κατά επέκταση). Πρέπει να πούμε ότι υπάρχει απλώς ένας τεράστιος αριθμός υποστηριζόμενων τύπων αρχείων, αλλά δεν θα είναι δυνατό να προσθέσετε τον δικό σας τύπο (επέκταση) στην υπάρχουσα λίστα. Μπορείτε επίσης να σημειώσετε την παρουσία ενός προγραμματιστή ευρετηρίου. Το ISYS Desktop χρειάστηκε 6 ώρες και 13 λεπτά για να δημιουργήσει ένα ευρετήριο και να επεξεργαστεί 20 gigabyte πληροφοριών, δείχνοντας τελικά την καλή ώρα και το μέγεθος του αρχείου που δημιουργήθηκε - 7,9 GB.

Οι δυνατότητες αναζήτησης αυτού του προγράμματος δεν είναι κακές. Αυτό που χρησιμοποιείται στο ISYS είναι πολύ πιο ισχυρό από τη συνηθισμένη υποστήριξη για λογικές λειτουργίες. Από τις δυνατότητες σύνθετης αναζήτησης, το πρόγραμμα προσφέρει τη χρήση συνωνύμων, φίλτρο ταξινόμησης (κατά διαδρομή, όνομα και ημερομηνία δημιουργίας του αρχείου). Το σύνολο των λογικών τελεστών είναι κάπως ευρύτερο από το τυπικό σύνολο. Εκτός από τις λογικές λειτουργίες, το πρόγραμμα σάς επιτρέπει να εργάζεστε με πολλούς άλλους τελεστές, οι οποίοι, κατ 'αρχήν, μπορούν να αντικαταστήσουν ορισμένους τύπους αναζήτησης, για παράδειγμα, η αναζήτηση με ανάλυση μπορεί να αντικατασταθεί πλήρως χρησιμοποιώντας ειδικούς τελεστές. Ήμουν πολύ έκπληκτος που το πρόγραμμα δεν έχει αναζήτηση χρησιμοποιώντας μορφολογία. Αυτό είναι μια σοβαρή παράλειψη, καθώς η αποτελεσματικότητα αναζήτησης βελτιώνεται σημαντικά όταν χρησιμοποιείται μορφολογική ανάλυση. Επιπλέον, δεν υπάρχει λίστα με σημαντικές λέξεις, αλλά υπάρχει ένας εκτενής κατάλογος με μη σημαντικές λέξεις. Δηλώθηκαν επίσης τέτοιες συναρτήσεις στην αναζήτηση ως "προσεγγιστική αναζήτηση" και "ευρετική ανάλυση".

Το ISYS παρέχει μια επιλογή από διάφορους τύπους ερωτημάτων αναζήτησης, και συγκεκριμένα οπτικών. Αυτό γίνεται χρησιμοποιώντας διαφορετικούς τύπους παραθύρων για την εισαγωγή ερωτημάτων αναζήτησης, ωστόσο, στην πραγματικότητα, κανένα παράθυρο δεν σας επιτρέπει να χρησιμοποιείτε τεχνολογίες άλλες από αυτές που αναφέρονται παραπάνω.

Τα αποτελέσματα αναζήτησης είναι πολύ κατατοπιστικά και εμφανίζονται ως λίστα εγγράφων ταξινομημένα κατά συνάφεια. Ακολουθεί μια προεπισκόπηση του επιλεγμένου εγγράφου. Σε αντίθεση με το Copernic Desktop Search, η προεπισκόπηση εδώ είναι διαθέσιμη μόνο με τη μορφή απλού κειμένου, δεν ήταν δυνατή η εμφάνιση εγγράφων στην εγγενή μορφή, είτε πρόκειται για Word, Html είτε PDF, αν και κατ' αρχήν αυτό δεν είναι πολύ κρίσιμο. Το πρόγραμμα σάς επιτρέπει να χωρίσετε τα έγγραφα που βρέθηκαν σε ομάδες σύμφωνα με ορισμένα κριτήρια (από προεπιλογή, χωρίζονται κατά συνάφεια). Μπορείτε επίσης να προβάλετε έγγραφα που έχουν ήδη βρεθεί επιλέγοντας μεμονωμένους φακέλους (αυτό είναι χρήσιμο όταν το αποτέλεσμα παράγει πολύ μεγάλο αριθμό εγγράφων).

Η χρήση του προγράμματος σε εταιρικό δίκτυο είναι επίσης αρκετά δικαιολογημένη, καθώς παρέχει καλές ευκαιρίες για την οργάνωση αναζητήσεων δικτύου. Το σύστημα αναζήτησης βασίζεται στη δημιουργία ενός δημόσιου ευρετηρίου, το οποίο περιέχει ευρετηριασμένα δεδομένα από δημόσιους πόρους δικτύου.

Μάλιστα, το πρόγραμμα από το ISYS αξίζει προσοχής, τουλάχιστον εξοικείωσης μαζί του. Αυτό το πρόγραμμα είναι ένα ώριμο έργο με τεράστιο ποσόλειτουργίες (όχι πάντα και όχι για όλους, φυσικά, χρειάζονται, αλλά ακόμα). Οι πιθανότητες το πρόγραμμα να έχει κάποιες βελτιώσεις όσον αφορά την επεξεργασία των ερωτημάτων αναζήτησης δεν είναι γνωστές, αλλά αυτή τη στιγμήμπορεί να προταθεί για σχεδόν καθολική χρήση. Και δεδομένου ότι εξακολουθεί να είναι πολύ βαρύ για οικιακά συστήματα, τα κύρια μέρη για την εγκατάστασή του είναι τα εταιρικά δίκτυα.

Επίσημη ιστοσελίδα:
Μέγεθος διανομής: 40 MbSearchInform

Κάντε κλικ στην εικόνα για μεγέθυνση

Μάλλον δεν αξίζει να ξεκινήσετε αμέσως με μια περιγραφή της διεπαφής SearchInform. Θα πρέπει πρώτα να περιγράψουμε τη διαδικασία εγκατάστασης, ή μάλλον μια από τις λεπτομέρειες: δεν θα μπορείτε να εγκαταστήσετε το πρόγραμμα χωρίς σύνδεση στο Διαδίκτυο. Το γεγονός είναι ότι πριν από την πρώτη εκκίνηση, το πρόγραμμα απαιτεί εγγραφή χρήστη (δωρεάν) και στέλνει όλα τα δεδομένα που έχουν εισαχθεί στον διακομιστή. Προφανώς, οι προγραμματιστές έπρεπε να λάβουν τέτοια μέτρα για την καταπολέμηση της πειρατείας, αλλά αυτό δεν επηρέασε θετικά την ευκολία εγκατάστασης.

Η διεπαφή προγράμματος είναι κατασκευασμένη σύμφωνα με όλους τους γενικά αποδεκτούς κανόνες, ωστόσο, με την πρώτη ματιά, είναι κάπως δυσκίνητη. Χρησιμοποιώντας το πρόγραμμα για πρώτη φορά, φαίνεται ότι είναι πολύ περίπλοκο, μερικές φορές δεν είναι εύκολο να θυμηθεί κανείς σε ποιο μενού ή καρτέλα βρίσκεται η επιθυμητή επιλογή, ωστόσο, με μεγαλύτερη χρήση, η διεπαφή δεν φαίνεται πλέον τόσο τρομερά περίπλοκη. Το κύριο πράγμα είναι να διαβάσετε πρώτα τη βοήθεια.

Έχοντας ασχοληθεί λίγο με τη διεπαφή, μπορείτε να ξεκινήσετε τη δημιουργία ενός ευρετηρίου. Η ίδια η διαδικασία είναι πολύ απλή και η ταχύτητα ευρετηρίασης, ακόμη και με το μάτι, είναι πολύ υψηλότερη από όλες τις άλλες μηχανές αναζήτησης από την κριτική. Οι καθαροί αριθμοί δοκιμών δείχνουν ότι το SearchInform είναι διπλάσιο από το dtSearch και το iSYS όσον αφορά την ταχύτητα ευρετηρίασης! Το πρόγραμμα ευρετηρίασε τα παρεχόμενα δεδομένα σε ποσότητα 20 gigabyte σε χρόνο ρεκόρ - 3 ώρες 17 λεπτά. Και το μέγεθος του ευρετηρίου που δημιουργήθηκε αποδείχθηκε ότι ήταν το μικρότερο 4,4 GB - 100 megabyte λιγότερο από αυτό της Αναζήτησης στο Google Desktop.

Το πρόγραμμα υποστηρίζει, εκτός από κανονικά αρχεία και φακέλους, ευρετηρίαση email, σύνδεση και ευρετηρίαση βάσεων δεδομένων (!) και άλλες εξωτερικές πηγές (DMS, CRM), αμέσως κατά την ευρετηρίαση, μπορείτε να καθορίσετε ένα λεξικό για μορφολογική αναζήτηση και όλα τα χαρακτηριστικά μπορούν να είναι ευρετηριασμένα αρχεία. Αφού δημιουργήσετε ένα ευρετήριο, όταν προσπαθείτε να πραγματοποιήσετε την πρώτη δοκιμαστική αναζήτηση για έγγραφα, μπορεί να προκύψει κάποια σύγχυση: "υπάρχουν δύο τύποι αναζήτησης, αλλά ποιος χρειάζομαι;". Όπως αναφέρθηκε προηγουμένως, το κύριο πράγμα είναι να διαβάσετε τη βοήθεια, τότε όλα θα γίνουν ξεκάθαρα. Το πρόγραμμα είναι πραγματικά σε θέση να εκτελέσει δύο τύπους αναζήτησης - μια αναζήτηση φράσης και αναζήτηση για έγγραφα που είναι παρόμοια σε περιεχόμενο με το κείμενο του ερωτήματος.

Η περιγραφή όλων των βασικών λειτουργιών για την ανάλυση ενός ερωτήματος αναζήτησης δόθηκε παραπάνω, επομένως τώρα θα αναφέρουμε μόνο τις δυνατότητες αναζήτησης που παρέχονται από αυτό το πρόγραμμα. Ας ξεκινήσουμε με την αναζήτηση φράσης: φυσικά, μορφολογική αναζήτηση, αναζήτηση εισαγωγικών, λογικές πράξεις, αναζήτηση ανάλυσης λέξεων (αναζήτηση από την αρχή της λέξης, μέχρι το τέλος, από το μεσαίο τμήμα ή πλήρη αντιστοίχιση), αναζήτηση μικτών εισαγωγικών (όταν όλες οι λέξεις από το ερώτημα πρέπει να υπάρχουν στο έγγραφο, αλλά όχι απαραίτητα με τη σειρά που εισάγεται), αναζητήσεις διόρθωσης σφαλμάτων, χρήση συνωνύμων, "αναζήτηση σχεδόν εισαγωγικών" (αναζήτηση για την εισαγόμενη φράση ως προσφορά, αλλά μπορεί να υπάρχουν άλλες λέξεις μεταξύ των εισαγόμενων λέξεων) κ.λπ. Ορισμένες από τις επιλογές που αναφέρονται έχουν τις δικές τους συγκεκριμένες ρυθμίσεις. Επιπλέον, είναι δυνατό να χρησιμοποιήσετε ένα λεξικό ασήμαντων λέξεων και το πρόγραμμα έχει ήδη μια έτοιμη λίστα με αυτές τις λέξεις, μπορείτε επίσης να χρησιμοποιήσετε ένα λεξικό λέξεων προτεραιότητας για αναζήτηση (φυσικά, θα πρέπει να το συμπληρώσετε ο ίδιος).

Εδώ, καταρχήν, εξετάσαμε εν συντομία όλα τα κύρια χαρακτηριστικά της αναζήτησης φράσεων.

Ας προχωρήσουμε στην εξέταση των χαρακτηριστικών αυτού του προγράμματος - την αναζήτηση για παρόμοια έγγραφα. Οι προγραμματιστές ισχυρίζονται ότι δεν πρόκειται σε καμία περίπτωση για απλή αναζήτηση κειμένου, πρόκειται ακριβώς για "αναζήτηση για παρόμοια" - έτσι την περιγράφουν παντού, αλλά εντάξει, μπορείτε να την ονομάσετε όπως θέλετε - το κύριο πράγμα είναι. Μια σύντομη αναζήτηση στο Διαδίκτυο μπορεί γρήγορα να αποκαλύψει ότι η λεγόμενη «παρόμοια αναζήτηση» είναι μια νέα εξέλιξη στον τομέα της ανάλυσης κειμένου. Αυτό το σύστημα σάς επιτρέπει να βρείτε κείμενα που είναι παρόμοια ως προς το σημασιολογικό περιεχόμενο. Το πιο ευχάριστο ήταν ότι μετά τη διενέργεια δοκιμαστικών ερωτημάτων αναζήτησης, αποδείχθηκε ότι η θεωρία είναι αρκετά συνεπής με την πράξη! Το πρόγραμμα αναζητά πραγματικά έγγραφα παρόμοιου περιεχομένου και τα εμφανίζει σε μια λίστα, ταξινομημένα κατά ποσοστό ομοιότητας.

Στη συνέχεια, ας δούμε τι προσφέρει το SearchInform (ιδίως την εταιρική του έκδοση SearchInform Corporate) για εργασία σε εταιρικό δίκτυο. Υπάρχουν δύο τύποι εφαρμογών: η πλευρά του διακομιστή και η πλευρά του χρήστη. Το τμήμα διακομιστή επεξεργάζεται ανεξάρτητα τα καθορισμένα ευρετήρια και οι χρήστες μπορούν να τα χρησιμοποιήσουν για αναζήτηση, ανάλογα με τα δικαιώματα πρόσβασης που τους έχουν εκχωρηθεί. Οι χρήστες μπορούν να διαμορφωθούν αυτόματα χρησιμοποιώντας στοιχεία σύνδεσης. καταχωρήσεις των Windows(ρητό επαγγελματική γλώσσα, το SearchInform χρησιμοποιεί έλεγχο ταυτότητας Windows NTFS) ή μη αυτόματα (οι χρήστες θα πρέπει να προστεθούν ξεχωριστά). Σε κάθε χρήστη μπορεί να επιτραπεί ή να απαγορευτεί η πρόσβαση σε ορισμένα ευρετήρια, μπορείτε επίσης να συνδυάσετε χρήστες σε ομάδες. Γενικά, οι ρυθμίσεις δικτύου του SearchInform προηγούνται της Google όσον αφορά την ευελιξία και του Snoop Server από την άποψη της ευκολίας και της απλότητας.

Επίσημη ιστοσελίδα:
Μέγεθος διανομής: 14,7 Mb Σύγκριση ταχύτητας ευρετηρίασης

Σύστημα αναζήτησηςΧρόνος ευρετηρίασηςΜέγεθος ευρετηρίου
Bloodhound Pro Deluxe 4.538 ώρες 46 λεπτά19 GB
Isys Desktop 7.06 ώρες 13 λεπτά7,9 GB
DtSearch 7.06 ώρες 3 λεπτά8,6 GB
Google Desktop Search Enterprise8 ώρες 17 λεπτά4,5 GB
Αναζήτηση στην επιφάνεια εργασίας Copernic*10 ώρες 51 λεπτά7 GB
SearchInform 1.5.023 ώρες 17 λεπτά4,4 GB

* Τα περισσότερα από τα έγγραφα .html και .txt που περιέχουν ρωσικό κείμενο, παρόλο που ήταν ευρετηριασμένα, δεν μπόρεσαν να βρεθούν εκτός από τα ονόματά τους. Περίληψη

Όλα τα προγράμματα είναι άξια προσοχής.

Με βάση τις δοκιμές και την προσεκτική εξέταση κάθε προγράμματος που παρουσιάζεται στην ανασκόπηση, μπορούν να εξαχθούν ορισμένα συμπεράσματα. Έτσι, το Google Desktop Search Copernic Desktop Search είναι αρκετά κατάλληλο για έναν άπειρο χρήστη ως σύστημα αναζήτησης πληροφοριών σπιτιού. Κάνουν καλή δουλειά με απλά αιτήματα, δεν φορτώνουν πολύ τον χρήστη με ρυθμίσεις και, επιπλέον, είναι εντελώς δωρεάν. Η προσπάθεια της Google να εισέλθει στην αγορά των εταιρικών μηχανών αναζήτησης δεν έχει ακόμη πλήρως δικαιολογηθεί: για πλήρη εργασία, το πρόγραμμα πρέπει να κρεμαστεί με πρόσθετες ενότητες και δεν είναι καθόλου εύκολο να ρυθμιστεί. Επομένως, μιλώντας τα ονόματα της Desktop Search, της Copernic, της Google αφήνουν πίσω τους μια θέση από μηχανές αναζήτησης "desktop".

Αληθινές, πιο ισχυρές λύσεις - τα dtSearch, iSYS και SearchInform δεν είναι επίσης ασυνήθιστα και προσφέρουν στους χρήστες τις εκδόσεις "desktop" τους. Αλλά σε λογική τιμή, σε αντίθεση με το δωρεάν λογισμικό από την Google και την Copernic. Φυσικά, πρέπει να πληρώσετε για ισχύ, ταχύτητα και λειτουργικότητα. Ωστόσο, οι προγραμματιστές των dtSearch, iSYS και SearchInform επικεντρώνονται φυσικά στον εταιρικό τομέα. Δικτύωση, λειτουργικότητα, ευρετηρίαση και ταχύτητα αναζήτησης - αυτό είναι που ξεχωρίζει αυτά τα προϊόντα από τους «ανταγωνιστές» τους. Σύμφωνα με τα αποτελέσματα της δοκιμής, καθορίστηκε το φαβορί - SearchInform. Το πρόγραμμα παρέχει τη δυνατότητα αναζήτησης παρόμοιων εγγράφων, έχει την υψηλότερη ταχύτητα ευρετηρίασης και αναζήτησης και έχει ένα καλό σύνολο δυνατοτήτων.

Η εύρεση των σωστών και ενημερωμένων πληροφοριών στο Διαδίκτυο είναι μερικές φορές πολύ δύσκολη. Η ποσότητα των ενημερωτικών σκουπιδιών στον Ιστό αυξάνεται σαν χιονόμπαλα και μερικές φορές είναι απλά αδύνατο να φτάσετε στα δεδομένα που πραγματικά χρειάζεστε χρησιμοποιώντας το παραδοσιακό Yandex και το Google. Το βιβλίο που κρατάτε στα χέρια σας θα αυξήσει πολλαπλάσια την αποτελεσματικότητα της αναζήτησής σας για πληροφορίες στο Διαδίκτυο. Περιγράφει τεχνικές, ιστότοπους αναζήτησης και προγράμματα για εξειδικευμένη ανάκτηση πληροφοριών. Θεωρούνται σύγχρονες ποικιλίες αναζήτησης στο Διαδίκτυο: καθολική αναζήτηση, κάθετη αναζήτηση, συστήματα μετα-αναζήτησης, δημιουργία προσωπικών μηχανών αναζήτησης, αναζήτηση οπτικοακουστικού περιεχομένου, αναζήτηση στο κρυφό Διαδίκτυο. Για όλα τα εξεταζόμενα συστήματα, δίνονται τα χαρακτηριστικά τους και οι συμβουλές για την πιο αποτελεσματική χρήση.

Εισαγωγή

Η αναζήτηση στο Διαδίκτυο είναι ένα σημαντικό στοιχείο της εργασίας στον Ιστό. Ο ακριβής αριθμός των πόρων Ιστού του σύγχρονου Διαδικτύου δεν είναι σχεδόν γνωστός σε κανέναν με βεβαιότητα. Σε κάθε περίπτωση, ο λογαριασμός πάει στα δισεκατομμύρια. Για να μπορέσετε να χρησιμοποιήσετε τις πληροφορίες που χρειάζονται τη συγκεκριμένη στιγμή, είτε για επαγγελματικούς είτε για ψυχαγωγικούς σκοπούς, πρέπει πρώτα να τις βρείτε σε αυτόν τον συνεχώς ανανεούμενο ωκεανό πόρων. Αυτό δεν είναι καθόλου εύκολη υπόθεση, αφού οι πληροφορίες στο σύγχρονο Web δεν είναι δομημένες, γεγονός που δημιουργεί προβλήματα στην εύρεση τους. Δεν είναι τυχαίο ότι οι μηχανές αναζήτησης στο Διαδίκτυο έχουν γίνει ένα είδος «παράθυρα» σε αυτόν τον χώρο πληροφοριών.

Είναι απίθανο μεταξύ των χρηστών του Διαδικτύου να υπάρχουν άνθρωποι που δεν έχουν χρησιμοποιήσει ποτέ μεγάλες καθολικές μηχανές αναζήτησης. Τα ονόματα Google, Yandex και μερικά άλλα μεγάλα μηχανήματα είναι στα χείλη όλων. Τα καταφέρνουν υπέροχα με καθημερινές εργασίεςΑναζήτηση στο Διαδίκτυο και συχνά οι χρήστες δεν προσπαθούν καν να ψάξουν για αντικατάσταση. Την ίδια στιγμή, ο αριθμός των μηχανών αναζήτησης στο Διαδίκτυο στην εποχή μας είναι χιλιάδες. Οι λόγοι για μια τέτοια ποικιλία εναλλακτικών μηχανών έχουν διάφορες ρίζες. Ορισμένα έργα προσπαθούν να ανταγωνιστούν άμεσα τους ηγέτες της παγκόσμιας αγοράς μέσω προσεκτικής εργασίας με εθνικούς πόρους του Διαδικτύου. Άλλα προσφέρουν χαρακτηριστικά ερωτημάτων που δεν βρίσκονται σε καθιερωμένες μηχανές αναζήτησης. Ένας σημαντικός αριθμός εναλλακτικών μηχανημάτων ειδικεύεται στην αναζήτηση μιας συγκεκριμένης θεματικής περιοχής ή ενός συγκεκριμένου τύπου περιεχομένου, επιτυγχάνοντας εντυπωσιακά αποτελέσματα στην επίλυση αυτών των προβλημάτων. Όπως και να έχει, η συμπερίληψη τέτοιων μηχανών αναζήτησης στο οπλοστάσιο των εργαλείων αναζήτησης του Διαδικτύου του χρήστη μπορεί να βελτιώσει σημαντικά την ποιότητά του. Εδώ, ωστόσο, υπάρχει μια απόχρωση: πρέπει να γνωρίζετε για τέτοια μηχανήματα και να μπορείτε να χρησιμοποιήσετε τις δυνατότητές τους.

Υποθέτουμε ότι οι αναγνώστες αυτού του βιβλίου είναι ήδη αρκετά εξοικειωμένοι με την τεχνική της αναζήτησης χρησιμοποιώντας καθολικές μηχανές αναζήτησης. Τόσο καλά που ένιωσαν τους περιορισμούς που σχετίζονται με τη χρήση τους. Πιθανότατα, τέτοιοι άνθρωποι έχουν ήδη προσπαθήσει να αναζητήσουν και να εφαρμόσουν ορισμένα πρόσθετα εργαλεία. Η έντυπη λέξη δεν παρακάμπτει το θέμα της αναζήτησης στο Διαδίκτυο: εμφανίζονται περιοδικά και τα δύο άρθρα και βγαίνουν βιβλία. Αλλά οι ήρωες που έχουν, κατά κανόνα, είναι οι ίδιοι - αρκετές κορυφαίες καθολικές μηχανές αναζήτησης. Το βιβλίο μας είναι διαφορετικό στο ότι επιχειρεί να καλύψει όλο το φάσμα των σύγχρονων λύσεων αναζήτησης. Εδώ θα βρείτε περιγραφές και προτάσεις για τη χρήση των καλύτερων σύγχρονων υπηρεσιών που επικεντρώνονται στην επίλυση των πιο συνηθισμένων εργασιών αναζήτησης. Αυτό το βιβλίο απευθύνεται σε άτομα που εργάζονται πολύ στο Διαδίκτυο και χρησιμοποιούν τον Ιστό για να βρουν τις πληροφορίες που χρειάζονται - είτε πρόκειται για δουλειά, είτε για σπουδές ή για χόμπι.

Για να είναι επιτυχής μια αναζήτηση στο Διαδίκτυο, πρέπει να πληρούνται δύο προϋποθέσεις: τα ερωτήματα πρέπει να είναι καλά διατυπωμένα και να τίθενται σε κατάλληλα σημεία. Με άλλα λόγια, ο χρήστης απαιτείται, αφενός, να μπορεί να μεταφράσει τα ενδιαφέροντά του αναζήτησης στη γλώσσα του ερωτήματος αναζήτησης και, αφετέρου, καλή γνώση των μηχανών αναζήτησης, των διαθέσιμων εργαλείων αναζήτησης, των πλεονεκτημάτων τους και μειονεκτήματα, τα οποία θα επιτρέψουν την επιλογή των καταλληλότερων εργαλείων αναζήτησης σε κάθε συγκεκριμένη περίπτωση.

Επί του παρόντος, δεν υπάρχει κανένας πόρος που να ικανοποιεί όλες τις απαιτήσεις για αναζήτηση στο Διαδίκτυο. Επομένως, με μια σοβαρή προσέγγιση στην αναζήτηση, αναπόφευκτα πρέπει να χρησιμοποιήσετε διαφορετικά εργαλεία, χρησιμοποιώντας το καθένα στην πιο κατάλληλη περίπτωση.

Κεφάλαιο 1

Καθολικές μηχανές αναζήτησης στο Διαδίκτυο

Οι καθολικές μηχανές αναζήτησης στο Διαδίκτυο είναι το κύριο και πιο γνωστό μέσο αναζήτησης στο Διαδίκτυο. Τέτοιες μηχανές αναζήτησης παρέχουν τη μέγιστη κάλυψη διαφόρων πόρων. Είναι ο καθολικός τύπος που περιλαμβάνει τις μεγαλύτερες και πιο δημοφιλείς μηχανές αναζήτησης. Αυτές είναι πραγματικά ισχυρές λύσεις με πολλές δυνατότητες και εργαλεία που πολλοί χρήστες συχνά δεν γνωρίζουν. Η κατανόηση των χαρακτηριστικών και των δυνατοτήτων της καθολικής αναζήτησης σάς επιτρέπει να ανακαλύψετε τα δυνατά σημεία και αδύναμες πλευρέςτέτοια συστήματα και συνειδητά επιλέγουν τα πιο αποτελεσματικά εργαλεία αναζήτησης.

Η αγορά για τις καθολικές μηχανές αναζήτησης είναι αρκετά μεγάλη. Σε αυτό το κεφάλαιο, θα εξετάσουμε μόνο τα πιο ισχυρά μηχανήματα που μπορούν να δουλέψουν επαρκώς με ερωτήματα στα ρωσικά. Το κεφάλαιο ανοίγει με ιστορίες για τους ηγέτες της ρωσικής αναζήτησης - συστήματα Google.ru και Yandex. Βιβλία και πολλά άρθρα έχουν γραφτεί για καθεμία από αυτές τις μηχανές αναζήτησης. Θα εστιάσουμε στα κύρια χαρακτηριστικά που έχουν σημασία για τον τελικό χρήστη και επίσης θα προσπαθήσουμε να εντοπίσουμε τα δυνατά του σημεία.

Συνοδεύονται από μια νέα ανάπτυξη αναζήτησης από τη Microsoft Corporation - το σύστημα Bing, το οποίο μέχρι στιγμής έχει στερηθεί αισθητά την προσοχή, καθώς και μια χρήσιμη και αρκετά ισχυρή μηχανή αναζήτησης Exalead, το πλεονέκτημα της οποίας είναι καλή υποστήριξηαναζήτηση σε ευρωπαϊκούς πόρους του Διαδικτύου. Αυτό το σύστημα- εξακολουθεί να είναι ένας σπάνιος επισκέπτης στο οπλοστάσιο αναζήτησης των χρηστών μας, επομένως εξετάζεται με περισσότερες λεπτομέρειες από τους άλλους.

Σε αυτό το κεφάλαιο, κατά την ανασκόπηση Συστήματα Googleκαι Yandex, θα εστιάσουμε μόνο στις δυνατότητες αναζήτησης ιστού και η αναζήτηση σε εξειδικευμένες βάσεις δεδομένων αυτών των έργων συζητείται στα επόμενα κεφάλαια για την αναζήτηση εικόνων και βίντεο. Για άλλες καθολικές μηχανές αναζήτησης, πληροφορίες σχετικά με την αναζήτηση πολυμέσων παρέχονται αμέσως μετά τη γνωριμία τους.

Δεδομένου ότι τρεις από τους τέσσερις ήρωες αυτού του κεφαλαίου είναι ξένης καταγωγής, σημειώνουμε αμέσως ότι αναλύουμε μόνο τις δυνατότητες των ρωσικών εκδόσεων τους. Το γεγονός είναι ότι ορισμένες λειτουργίες ξένων συστημάτων, ειδικά πειραματικών, είναι συχνά διαθέσιμες μόνο στις αρχικές, κατά κανόνα, αγγλόφωνες εκδόσεις υπηρεσιών.

Google

Η μηχανή αναζήτησης Google θεωρείται επάξια ο παγκόσμιος ηγέτης στη σύγχρονη αναζήτηση στο Διαδίκτυο. Ιδρύθηκε το 1998 Googleμέχρι σήμερα παραμένει μεταξύ των κορυφαίων τάσεων στον τομέα της αναζήτησης στο Διαδίκτυο και των διαδικτυακών υπηρεσιών.

Οι προγραμματιστές της Google διακρίνονταν πάντα από την αυξημένη προσοχή στη βελτίωση των αλγορίθμων της μηχανής αναζήτησής τους, καθώς και από τον εύλογο συντηρητισμό στο πεδίο διεπαφή χρήστη. Οι δυνατότητες σύνταξης ενός ερωτήματος στο Google μπορούν να ονομαστούν κλασικές και οι τρόποι εμφάνισης των αποτελεσμάτων αναζήτησης έχουν επίσης γίνει ένα είδος προτύπου. Πρόσφατα Google Developersέκανε σημαντικές αλλαγές σε αυτούς τους τομείς - η μεγαλύτερη μηχανή αναζήτησης άρχισε να φαίνεται πολύ ντεμοντέ στο φόντο των νεαρών ανταγωνιστών.

Η Google διαθέτει μία από τις μεγαλύτερες βάσεις ευρετηρίων στον κόσμο, η οποία παρέχει ευρεία κάλυψη πηγών πληροφοριών. Οι πληροφορίες ευρετηρίου Google συνοψίζονται σε διάφορες κάθετες βάσεις. Εκτός από την πιο διάσημη βάση δεδομένων Ιστού, υπάρχουν πολλές βάσεις δεδομένων πολυμέσων (Εικόνες, Βίντεο) που λειτουργούν με πηγές σχετικών πληροφοριών και μηνυμάτων στις ροές RSS, τη βάση δεδομένων News, καθώς και τη βάση δεδομένων Blogs που ευρετηριάζει ημερολόγια δικτύου. Επιπλέον, η Google προσφέρει ένα ευρύ φάσμα πρόσθετων πόρων, μεταξύ των οποίων αξίζει να σημειωθεί μια υπηρεσία χαρτών, ένας κατάλογος τοποθεσιών και μια υπηρεσία ερωτήσεων και απαντήσεων. Αυτοί οι πόροι μπορούν επίσης να θεωρηθούν ως εργαλεία αναζήτησης.

Στη βάση δεδομένων Ιστού, η Google προσφέρει απλές και προηγμένες λειτουργίες αναζήτησης για τη σύνταξη ενός ερωτήματος. Μόνο στη λειτουργία απλής αναζήτησης, των πρόσθετων εργαλείων εικονικό πληκτρολόγιο. Η σύνθετη αναζήτηση προσφέρει περισσότερες επιλογές. Δεδομένου ότι η φόρμα σύνθετης αναζήτησης είναι διαθέσιμη σε όλα σχεδόν τα προϊόντα αναζήτησης Google, ας σταθούμε σε αυτήν με περισσότερες λεπτομέρειες (Εικ. 1.1).

Yandex

Η μηχανή αναζήτησης Yandex, που παρουσιάστηκε επίσημα στο ευρύ κοινό το 1997, αναπτύχθηκε με επιτυχία και δέκα χρόνια αργότερα, για πρώτη φορά, συγκαταλέγεται στις δέκα μεγαλύτερες μηχανές αναζήτησης στον κόσμο. Στο ρωσικό κομμάτι του Διαδικτύου έχει κατακτήσει ηγετική θέση, την οποία δεν πρόκειται να εγκαταλείψει, παρά τον αυξανόμενο ανταγωνισμό. Χαρακτηριστικά γνωρίσματα του Yandex από την αρχή της ύπαρξής του ήταν οι δικοί του αρχικοί αλγόριθμοι για τον προσδιορισμό της συνάφειας των αποτελεσμάτων αναζήτησης, τα ευέλικτα εργαλεία για την εργασία με κείμενο ερωτήματος και τη λήψη υπόψη των ιδιαιτεροτήτων της μορφολογίας της ρωσικής γλώσσας κατά την επεξεργασία τους.

Το Yandex βασίζεται στις δικές του βάσεις δεδομένων ευρετηρίου. Εκτός από την αναζήτηση μέσω εγγράφων Ιστού, το σύστημα προσφέρει μια καλή επιλογή εξειδικευμένων πόρων και πρόσθετων υπηρεσιών. Το Yandex λειτουργεί επί του παρόντος με εικόνες, βίντεο, ειδήσεις, ιστολόγια και λεξικά. Ισχυρές δυνατότητες αναζήτησης είναι επίσης ενσωματωμένες στη δική μας χαρτογραφική υπηρεσία και στο σύστημα αναζήτησης προϊόντων. Επιπλέον, η Yandex διατηρεί τον δικό της κατάλογο ιστοσελίδων. Δυνατό σημείοΤο Yandex είναι ένα αναπτυγμένο πρόγραμμα τοπικής αναζήτησης, το οποίο είναι ιδιαίτερα σημαντικό για τους χρήστες μας. Η Yandex παρέχει πρόσβαση στις βάσεις δεδομένων της σε τρίτους προγραμματιστές. Ως αποτέλεσμα, πολλά ρωσικά έργα εναλλακτικής αναζήτησης στο Διαδίκτυο χρησιμοποιούν πόρους Yandex με τον ένα ή τον άλλο τρόπο. Εκτός από το συνηθισμένο σύστημα αναζήτησης, προσφέρεται επίσης μια συντομευμένη έκδοση του Yandex, διαθέσιμη στο ya.ru. Η διεπαφή αυτής της έκδοσης αποτελείται μόνο από ένα πεδίο εισαγωγής ερωτήματος και ένα κουμπί έναρξης αναζήτησης.

Η αναζήτηση εγγράφων Ιστού προσφέρει απλές και προηγμένες λειτουργίες αναζήτησης. Η απλή αναζήτηση δεν παρέχει φίλτρα, κάτι που αντισταθμίζεται από την ικανότητα αυτόματης ανάλυσης ερωτημάτων φυσικής γλώσσας, την σίγουρη επεξεργασία σχετικά μεγάλων ερωτημάτων και ένα σύστημα αυτόματης ολοκλήρωσης ερωτημάτων. Το μέγιστο μήκος ερωτήματος είναι σαράντα λέξεις.

Η σύνθετη φόρμα αναζήτησης για τη σύνταξη ερωτήματος προσφέρει μόνο ένα πεδίο. Οι λογικοί τελεστές που συνδέουν τις λέξεις ερωτήματος προτείνεται να εισαχθούν χειροκίνητα, καλά. Το Yandex έχει μια αρκετά λεπτομερή γλώσσα ερωτημάτων. Τα υπόλοιπα εργαλεία φόρμας σύνθετης αναζήτησης είναι διάφορα φίλτρα (1.4).

Bing

Το ιστορικό αναζήτησης στο Διαδίκτυο από τη Microsoft δεν είναι εύκολο να καλέσετε. Οι υπηρεσίες που προσφέρονται με συνέπεια στο κοινό έχουν αλλάξει επανειλημμένα τους αλγόριθμους, τις βάσεις δεδομένων που χρησιμοποιούνται και, φυσικά, τα ονόματα. Μέχρι τις αρχές της δεκαετίας του 2000, η ​​μηχανή αναζήτησης δεν είχε δικές της βάσεις δεδομένων και λειτουργούσε με εξωτερικά ευρετήρια από τα AltaVista, Inktomi και Looksmart. Το αρχικό όνομα MSN Search χρησιμοποιήθηκε μέχρι το 2006 και στη συνέχεια για αρκετά χρόνια η αλλαγή των ονομάτων της μηχανής αναζήτησης έγινε παράδοση για τη Microsoft.

Μαζί με την τελική μετάβαση στην αναζήτηση στα δικά του ευρετήρια, το MSN Search μετονομάστηκε πρώτα σε Αναζήτηση Windows LiveLive. Τελικά, στις αρχές του καλοκαιριού του 2009, η Ζωντανή Αναζήτηση αντικαταστάθηκε από το νέο έργο αναζήτησης Bing.

«Το Bing θα παρέχει έναν διαφορετικό τρόπο εξέτασης των πληροφοριών στο Διαδίκτυο και θα βοηθά τους χρήστες να λαμβάνουν σημαντικές αποφάσεις», το δελτίο τύπου της Microsoft για την κυκλοφορία του Bing ξεκίνησε με μια τέτοια δήλωση. Οι φιλοδοξίες των προγραμματιστών ήταν κατανοητές: οι μηχανές αναζήτησης από τη Microsoft, παρά όλες τις προσπάθειες, στη Δύση ήταν σταθερά κατώτερες σε δημοτικότητα από τους ηγέτες - Google και Yahoo!. Αν μιλάμε για τις ρωσικές εκδόσεις προηγούμενων έργων αναζήτησης της Microsoft, τότε όσον αφορά τον αριθμό και την ποιότητα των συνδέσμων που βρέθηκαν, ήταν πολύ κατώτερες από τις μεγάλες ρωσικές μηχανές αναζήτησης. Σε μια προσπάθεια να καλύψουν τη διαφορά με τους ανταγωνιστές, οι προγραμματιστές της Bing βασίστηκαν στη βελτίωση της ποιότητας αναζήτησης και στην εισαγωγή νέων τεχνολογιών, πολλές από τις οποίες αποκτήθηκαν μαζί με τις εταιρείες που τις δημιούργησαν.

πρέπει να σημειωθεί ότι Ρωσική έκδοσηΤο Bing, όπως και οι περισσότερες άλλες μεταφρασμένες εκδόσεις, δεν διαθέτει μια σειρά από πρόσθετες λειτουργίες, όπως η αναζήτηση καταστήματος. Αφού, στην πραγματικότητα, εργάζονται μόνο στο Βορρά. Αμερική, δεν έχει νόημα να σταθώ σε αυτά λεπτομερώς.

Exalead

Ένα από τα χαρακτηριστικά της Ευρώπης, συμπεριλαμβανομένου του τομέα της αναζήτησης στο Διαδίκτυο, είναι ο μεγάλος αριθμός εθνικών γλωσσών. Μια μηχανή αναζήτησης που ισχυρίζεται ότι είναι ηγέτης στην Ευρώπη πρέπει απλώς να ευρετηριάσει καλά τα εθνικά τμήματα του Διαδικτύου και να επεξεργαστεί ερωτήματα σε πολλές ευρωπαϊκές γλώσσες, τόσο τις μεγαλύτερες όσο και τις λιγότερο κοινές, με υψηλή ποιότητα. Σε αυτόν τον τομέα η ευρωπαϊκή ανάπτυξη μπορεί να γίνει σοβαρή ανταγωνιστικό πλεονέκτημασε σύγκριση με ισχυρούς ανταγωνιστές στο εξωτερικό. Το σύστημα Exalead διεκδικεί επί του παρόντος σοβαρά το ρόλο μιας τέτοιας ευρωπαϊκής μηχανής αναζήτησης. Αυτό το έργο αναπτύχθηκε ως μέρος του ερευνητικού προγράμματος Quaere που χρηματοδοτείται από την Ευρωπαϊκή Ένωση.

Το Exalead έχει τις δικές του βάσεις δεδομένων ευρετηρίων. Οι κύριοι πόροι αναζήτησης του συστήματος είναι βάσεις δεδομένων με έγγραφα web, εικόνες, βίντεο και ειδήσεις. αρχική σελίδαΤο Exalead προσφέρει την ευκαιρία εξατομίκευση. Σε αυτή τη σελίδα, μπορείτε να τοποθετήσετε συνδέσμους προς τους αγαπημένους σας ιστότοπους - θα εμφανίζονται ως γραφικές μικρογραφίες-στιγμιότυπα οθόνης. Είναι αλήθεια ότι για αυτό θα πρέπει να εγγράψετε έναν λογαριασμό δωρεάν, καθώς και να επιτρέψετε στο πρόγραμμα περιήγησης να αποθηκεύει cookies Exalead.

Το Exalead Web Search προσφέρει απλές και προηγμένες λειτουργίες αναζήτησης. Η φόρμα σύνθετης αναζήτησης, όπως στο Bing, ανοίγει απευθείας στη σελίδα τεύχους Σημειώστε ότι το Exalead δεν προσφέρει απλώς μια οικεία φόρμα με ένα σύνολο πρόσθετων πεδίων, αλλά ένα σύνθετο αναπτυσσόμενο μενού που λειτουργεί ως οδηγός για να βελτιώσετε το ερώτημα (Εικ. 1.7). Όταν επιλέγετε ένα ή άλλο στοιχείο στο μενού του οδηγού, προστίθενται νέα στοιχεία στη συμβολοσειρά ερωτήματος και, εάν χρειάζεται, τελεστές και ειδικοί χαρακτήρες.

Εισαγωγή

Επί του παρόντος, το Διαδίκτυο ενώνει εκατοντάδες εκατομμύρια διακομιστές που φιλοξενούν δισεκατομμύρια διαφορετικούς ιστότοπους και μεμονωμένα αρχεία που περιέχουν διάφορα είδη πληροφοριών. Είναι ένα τεράστιο αποθετήριο πληροφοριών. Υπάρχουν διάφορες μέθοδοι αναζήτησης πληροφοριών στο Διαδίκτυο.

Αναζήτηση με γνωστή διεύθυνση.Οι απαιτούμενες διευθύνσεις λαμβάνονται από καταλόγους. Γνωρίζοντας τη διεύθυνση, απλώς πληκτρολογήστε την γραμμή διεύθυνσηςΠρόγραμμα περιήγησης.

Παράδειγμα 1. www.gov.ru - ο διακομιστής των κρατικών αρχών της Ρωσίας.

Κατασκευή διεύθυνσης από τον χρήστη.Γνωρίζοντας το σύστημα δημιουργίας διευθύνσεων Διαδικτύου, μπορείτε να δημιουργήσετε διευθύνσεις κατά την αναζήτηση τοποθεσιών Web.

Είναι απαραίτητο να προσθέσετε έναν θεματικό ή γεωγραφικό τομέα σε μια λέξη-κλειδί (το όνομα μιας εταιρείας, επιχείρησης, οργανισμού ή ένα απλό αγγλικό ουσιαστικό) και η διαίσθηση πρέπει να συνδεθεί.

Παράδειγμα 2 Διευθύνσεις εμπορικών ιστοσελίδων:

www.samsung.com SAMSUNG),

www.mtv.com (Μουσικές ειδήσεις MTV).

Παράδειγμα 3. Διευθύνσεις εκπαιδευτικών ιδρυμάτων:

www.ntu.edu (Εθνικό Πανεπιστήμιο των ΗΠΑ).

Μηχανές αναζήτησηςΔιαδίκτυο

Για την αναζήτηση πληροφοριών στο Διαδίκτυο, έχουν αναπτυχθεί ειδικά συστήματα ανάκτησης πληροφοριών. Οι μηχανές αναζήτησης έχουν μια κανονική διεύθυνση και εμφανίζονται ως ιστοσελίδα που περιέχει ειδικά εργαλεία για την οργάνωση της αναζήτησης (συμβολοσειρά αναζήτησης, κατάλογος θεμάτων, σύνδεσμοι). Για να καλέσετε μια μηχανή αναζήτησης, απλώς εισαγάγετε τη διεύθυνσή της στη γραμμή διευθύνσεων του προγράμματος περιήγησης.

Σύμφωνα με τη στατιστική υπηρεσία LiveInternet.ru, η διανομή των μηχανών αναζήτησης στη Ρωσία είναι περίπου η εξής:

2) Google - 35,0%

3) Αναζήτηση Mail.ru - 8,3%

4) Rambler - 0,9%

Σύμφωνα με τη μέθοδο οργάνωσης των πληροφοριών, τα συστήματα ανάκτησης πληροφοριών χωρίζονται σε δύο τύπους: ταξινόμηση (ρουμπρικτές) και λεξικό.

Rubricators (ταξινομητές)- μηχανές αναζήτησης που χρησιμοποιούν μια ιεραρχική (δενδροειδή) οργάνωση πληροφοριών. Κατά την αναζήτηση πληροφοριών, ο χρήστης εξετάζει τις θεματικές επικεφαλίδες, περιορίζοντας σταδιακά το πεδίο αναζήτησης (για παράδειγμα, εάν πρέπει να βρείτε τη σημασία μιας λέξης, τότε πρώτα πρέπει να βρείτε ένα λεξικό στον ταξινομητή και στη συνέχεια να βρείτε τη σωστή λέξη μέσα σε αυτό).



Μηχανές αναζήτησης λεξικώνείναι ισχυρά αυτόματα συστήματα λογισμικού και υλικού. Με τη βοήθειά τους, προβάλλονται (σαρώνονται) πληροφορίες στο Διαδίκτυο. Τα δεδομένα σχετικά με τη θέση αυτής ή αυτής της πληροφορίας εισάγονται σε ειδικά βιβλία αναφοράς-ευρετήρια. Σε απάντηση στο αίτημα, πραγματοποιείται αναζήτηση σύμφωνα με τη συμβολοσειρά ερωτήματος. Ως αποτέλεσμα, προσφέρονται στον χρήστη εκείνες οι διευθύνσεις (URL) όπου βρέθηκε η λέξη ή ομάδα λέξεων που αναζητήθηκε τη στιγμή της σάρωσης. Επιλέγοντας οποιονδήποτε από τους προτεινόμενους συνδέσμους, μπορείτε να μεταβείτε στο έγγραφο που βρέθηκε. Οι περισσότερες σύγχρονες μηχανές αναζήτησης είναι μικτές.

Οι πιο διάσημες και δημοφιλείς μηχανές αναζήτησης:

Υπάρχουν συστήματα που ειδικεύονται στην αναζήτηση πληροφοριακούς πόρουςπρος διάφορες κατευθύνσεις.

https://my.mail.ru

https://ru-ru.facebook.com

https://twitter.com

https://www.tumblr.com

https://www.instagram.com κ.λπ.

Μηχανές αναζήτησης θεμάτων:

Αναζήτηση λογισμικού:

Κατάλογοι (θεματικές συλλογές συνδέσμων με σχολιασμούς):

http://www.atrus.ru

Κανόνες εκτέλεσης ερωτήματος

Σε κάθε μηχανή αναζήτησης, στην ενότητα Βοήθεια, μπορείτε να λάβετε πληροφορίες σχετικά με τον τρόπο αναζήτησης, τον τρόπο σύνταξης μιας συμβολοσειράς ερωτήματος. Ακολουθούν πληροφορίες σχετικά με μια τυπική, "μέση" γλώσσα ερωτημάτων.

Απλό αίτημα

Εισαγάγετε μία λέξη που καθορίζει το θέμα αναζήτησης. Για παράδειγμα, στη μηχανή αναζήτησης Rambler.ru, αρκεί να εισαγάγετε: αυτοματοποίηση.

Βρέθηκαν έγγραφα που περιέχουν τις λέξεις που καθορίζονται στο αίτημα. Όλες οι μορφές ρωσικών λέξεων αναγνωρίζονται, κατά κανόνα, η περίπτωση των γραμμάτων αγνοείται.

Μπορείτε να χρησιμοποιήσετε τον χαρακτήρα "*" ή "?" στο ερώτημα. Σημάδι "?" στη λέξη-κλειδί, αντικαθίσταται ένας χαρακτήρας, στη θέση του οποίου μπορεί να αντικατασταθεί οποιοδήποτε γράμμα και ο χαρακτήρας "*" είναι μια ακολουθία χαρακτήρων.

Για παράδειγμα, ένα αυτόματο ερώτημα* θα βρει έγγραφα που περιλαμβάνουν τις λέξεις automatic, automatic και ούτω καθεξής.

Πολύπλοκο ερώτημα

Συχνά υπάρχει ανάγκη συνδυασμού λέξεις-κλειδιάγια πιο συγκεκριμένες πληροφορίες. Σε αυτή την περίπτωση, χρησιμοποιούνται πρόσθετες λέξεις σύνδεσης, συναρτήσεις, τελεστές, σύμβολα, συνδυασμοί τελεστών που χωρίζονται με αγκύλες.

Για παράδειγμα, το ερώτημα music & (beatles beatles) σημαίνει ότι ο χρήστης αναζητά έγγραφα που περιέχουν τις λέξεις μουσική και beatles ή μουσική και beatles.

Λίστα διακομιστών αναζήτησης και καταλόγων

Διεύθυνση Περιγραφή
www.excite.com Μηχανή αναζήτησης με κριτικές και οδηγούς κόμβων
www.alta-vista.com Διακομιστής αναζήτησης, διαθέσιμες προηγμένες δυνατότητες αναζήτησης
www.hotbot.com διακομιστή αναζήτησης
www.ifoseek.com Διακομιστής αναζήτησης (εύχρηστος)
www.ipl.org Internet Public Library, μια δημόσια βιβλιοθήκη που λειτουργεί ως μέρος του έργου World Village
www.wisewire.com WiseWire - οργάνωση αναζήτησης με χρήση τεχνητής νοημοσύνης
www.webcrawler.com WebCrawler - διακομιστής αναζήτησης, εύκολος στη χρήση
www.yahoo.com Κατάλογος Ιστού και διεπαφή για πρόσβαση στην αναζήτηση πλήρους κειμένου στον διακομιστή AltaVista
www.aport.ru Aport - Διακομιστής αναζήτησης ρωσικής γλώσσας
www.yandex.ru Yandex - διακομιστής αναζήτησης στη ρωσική γλώσσα
www.rambler.ru Rambler - διακομιστής αναζήτησης στη ρωσική γλώσσα
Πόροι βοήθειας στο Διαδίκτυο
www.yellow.com Χρυσός Οδηγός Διαδικτύου
monk.newmail.ru Μηχανές αναζήτησης διαφόρων προφίλ
www.top200.ru Κορυφαίοι 200 ​​ιστότοποι
www.allru.net
www.ru Κατάλογος ρωσικών πόρων Διαδικτύου
www.allru.net/z09.htm Εκπαιδευτικοί Πόροι
www.students.ru Διακομιστής Ρώσων φοιτητών
www.cdo.ru/index_new.asp Κέντρο Εκπαίδευσης εξ Αποστάσεως
www.open.ac.uk Open University UK
www.ntu.edu Εθνικό Πανεπιστήμιο των ΗΠΑ
www.translate.ru Ηλεκτρονικός μεταφραστής κειμένου
www.pomorsu.ru/guide.library.html Λίστα συνδέσμων προς βιβλιοθήκες δικτύου
www.elibrary.ru Επιστημονική ηλεκτρονική βιβλιοθήκη
www.citforum.ru ΗΛΕΚΤΡΟΝΙΚΗ ΒΙΒΛΙΟΘΗΚΗ
www.infamed.com/psy Ψυχολογικά τεστ
www.pokoleniye.ru Ιστοσελίδα της Ομοσπονδίας Εκπαίδευσης Διαδικτύου
www.metod.narod.ru Εκπαιδευτικοί Πόροι
www.spb.osi.ru/ic/distant Εξ αποστάσεως εκπαίδευση στο Διαδίκτυο
www.examen.ru Εξετάσεις και τεστ
www.kbsu.ru/~book/ Εγχειρίδιο Πληροφορικής
Mega.km.ru Εγκυκλοπαίδειες και λεξικά

Επαγγελματική αναζήτηση πληροφοριών στο Διαδίκτυο

Η αναζήτηση πληροφοριών είναι από τις πιο κοινές και ταυτόχρονα η πιο πολλές απαιτητικές εργασίεςπου κάθε χρήστης πρέπει να αντιμετωπίσει στον Ιστό. Ωστόσο, εάν για ένα απλό μέλος της κοινότητας του δικτύου, η γνώση αποτελεσματικών μεθόδων ανάκτησης πληροφοριών είναι επιθυμητή, αλλά μακριά από υποχρεωτική ποιότητα, τότε για τους επαγγελματίες της πληροφορίας, η ικανότητα γρήγορης πλοήγησης στους πόρους του Διαδικτύου και εύρεσης των απαιτούμενων πηγών είναι μία από τις βασικές δεξιότητες προσόντων.

Ο λόγος για τις δυσκολίες που προκύπτουν στην ανάκτηση πληροφοριών στο Διαδίκτυο καθορίζεται από δύο βασικούς παράγοντες. Πρώτον, ο αριθμός των πηγών στον Ιστό είναι εξαιρετικά μεγάλος. Στο τέλος του 2001, οι πιο πρόχειρες εκτιμήσεις έδειχναν έναν κατά προσέγγιση αριθμό 7,5 δισεκατομμυρίων εγγράφων που βρίσκονται σε διακομιστές σε όλο τον κόσμο. Δεύτερον, ο όγκος των πληροφοριών στον Ιστό δεν είναι μόνο κολοσσιαίος σε όγκο, αλλά και εξαιρετικά δυναμικός. Στο μισό λεπτό που αφιερώσατε διαβάζοντας τις πρώτες γραμμές αυτής της ενότητας, περίπου εκατό νέα ή αλλαγμένα έγγραφα εμφανίστηκαν στο εικονικό σύμπαν, δεκάδες μεταφέρθηκαν σε νέες διευθύνσεις και οι μονάδες έπαψαν να υπάρχουν για πάντα. Το Διαδίκτυο δεν «κοιμάται ποτέ», όπως δεν «κοιμάται ποτέ» ο πλανήτης μας, κατά μήκος του οποίου κυλάει συνεχώς ένα κύμα ανθρώπινης επιχειρηματικής δραστηριότητας, ακριβώς σύμφωνα με την αλλαγή των ζωνών ώρας.

Σε αντίθεση με μια σταθερή και ελεγχόμενη συλλογή εγγράφων σε μια βιβλιοθήκη, στον Ιστό έχουμε να κάνουμε με μια τεράστια και συνεχώς μεταβαλλόμενη συστοιχία πληροφοριών, η αναζήτηση δεδομένων στην οποία είναι μια πολύ, πολύ περίπλοκη διαδικασία. Η κατάσταση θυμίζει συχνά πολύ το γνωστό έργο της εύρεσης βελόνας σε μια θημωνιά και μερικές φορές πληροφορίες μεγάλης αξίας παραμένουν αζήτητες μόνο και μόνο λόγω της δυσκολίας εύρεσης.

Οι περισσότεροι από τους χρήστες του παγκόσμιου δίκτυα υπολογιστών. Τόσο οι ερασιτέχνες όσο και οι επαγγελματίες χρησιμοποιούν συχνά τα ίδια εργαλεία. Ωστόσο, τα αποτελέσματα των αναζητήσεων και ο χρόνος που αφιερώθηκε σε αυτές διαφέρουν σε πολύ μεγάλο βαθμό.

Σκοπός αυτής της ενότητας είναι να εξοικειωθεί λεπτομερώς με τα εργαλεία και τις μεθόδους ανάκτησης πληροφοριών και να αναπτύξει βιώσιμες δεξιότητες για επαγγελματική αναζήτηση στον Ιστό όλων των τύπων δεδομένων: από κείμενα σε οποιαδήποτε μορφή μέχρι βίντεο και κινούμενα σχέδια.