Ποια είναι η μηχανή αναζήτησης; Επισκόπηση προγραμμάτων για αναζήτηση εγγράφων και δεδομένων

Αυτο 11.08.2019
Επισκόπηση προγράμματος Η έκδοση υπολογιστή του Microsoft Excel Viewer θα επιτρέψει...

Chercher Πρόκειται για ειδικά προγράμματα αναζήτησης εγκατεστημένα σε μια ολόκληρη σειρά εξειδικευμένων μηχανημάτων. Με απλά λόγια, είναι ο ίδιος ιστότοπος με ένα σύνολο προγραμμάτων, μόνο σε ειδική μηχανή αναζήτησης (διακομιστή). Είναι με τη βοήθεια των μηχανών αναζήτησης που βρίσκετε όλες τις πληροφορίες που χρειάζεστε. Υπάρχουν πολλές μηχανές αναζήτησης.

1. Τι είναι μια μηχανή αναζήτησης στο Διαδίκτυο

2. Δημοφιλείς μηχανές αναζήτησης στη χώρα μας

3. Δημοφιλείς μηχανές αναζήτησης στο εξωτερικό

4. Ασυνήθιστες μηχανές αναζήτησης

5. Πώς να αναζητήσετε σωστά πληροφορίες στο Διαδίκτυο

Τα περισσότερα καλύτερος σελσυστήματα αναζήτησηςστη χώρα μας:

http://www.yandex.ru

http://www.google.com

http://www.aport.ru

http://www.rambler.ru/

http://go.mail.ru

http://www.webalta.ru/

Η πιο μη αγαπημένη και παρεμβατική μηχανή αναζήτησης από όλους.

Δημοφιλείς μηχανές αναζήτησης στο εξωτερικό

http://www.altavista.com

http://www.alltheweb.com

http://www. bing.com

http://www.google.com
http://www.excite.com
http://www.lycos.com
http://www.mamma.com

http://www.yahoo.com

http://www.dmoz.com
http://www.hotbot.com
http://www.dogpile.com
http://www.netscape.com
http://www.msn.com
http://www.webcrawler.com
http://www.jayde.com
http://www.aol.com
http://www.euroseek.com
http://www.teoma.com
http://www.about.com
http://www.ixquick.com
http://www.lookle.com
http://www.metaeureka.com
http://www.searchspot.com
http://www.slider.com
http://www.allthesites.com
http://www.clickey.com
http://www.galaxy.com
http://brainysearch.com
http://www.orura.com

Κάθε χώρα έχει τις δικές της δημοφιλείς μηχανές αναζήτησης.

Ασυνήθιστες μηχανές αναζήτησης

  • DuckDuckGo (https://duckduckgo.com/) - μια υβριδική μηχανή αναζήτησης με πολιτική απορρήτου για τον χρήστη και τα ερωτήματα αναζήτησής του.

  • TinEye (http://tineye.com/) είναι μια μηχανή αναζήτησης που ειδικεύεται στην αναζήτηση εικόνων στο Διαδίκτυο. Πρόσφατα έχασε τη σημασία του αφού η Google εισήγαγε την ίδια λειτουργία στην αναζήτηση εικόνων.

  • Guenon (http://www.genon.ru/) είναι μια μηχανή αναζήτησης που συλλέγει και δημιουργεί περιεχόμενο στον ιστότοπό της.

Σχεδόν σε κάθε μηχανή αναζήτησης, εκτός από το πλαίσιο αναζήτησης, υπάρχουν έδαφος διά παιγνίδι γκολφστους πιο δημοφιλείς ειδησεογραφικούς ιστότοπους και ιστότοπους ορισμένων θεμάτων.

Πώς να αναζητήσετε σωστά πληροφορίες στο Διαδίκτυο

Κάθε μηχανή αναζήτησης έχει τους δικούς της αλγόριθμους (κανόνες) για την αναζήτηση πληροφοριών.

Για να βρείτε κάποιες πληροφορίες στο Διαδίκτυο μέσω μιας μηχανής αναζήτησης, πρέπει να εισαγάγετε το πεδίο αναζήτησης αίτηση. Εάν εισαγάγετε μία λέξη, τότε αυτό το αίτημα θα σας δώσει χιλιάδες συνδέσμους σε ιστότοπους όπου αναφέρεται αυτή η λέξη.

Επομένως, είναι απαραίτητο να εισαγάγετε ένα όσο το δυνατόν πιο συγκεκριμένο ερώτημα, αποτελούμενο από δύο, τρεις ή περισσότερες φράσεις.

Ας δούμε ένα παράδειγμα ερωτήματος μηχανής αναζήτησης Yandex.

Ας υποθέσουμε ότι θέλετε να βρείτε πληροφορίες για την αγορά ενός υπολογιστή. Εάν γράψετε μία λέξη στο πλαίσιο αναζήτησης " Ηλεκτρονικός υπολογιστής», τότε θα λάβετε 133 εκατομμύρια απαντήσεις

Πρέπει να υποβάλετε ένα πιο συγκεκριμένο αίτημα. Είναι καλύτερα να υποδείξετε ποιον υπολογιστή θέλετε να αγοράσετε και πού (σε ποια πόλη).

Τότε η μηχανή αναζήτησης θα σας δώσει πολύ λιγότερες απαντήσεις στο ερώτημά σας.

Η μηχανή αναζήτησης δεν ενδιαφέρεται καθόλου εάν εισάγετε το ερώτημά σας με κεφαλαία ή μικρά γράμματα.

Το Yandex κάνει διάκριση μεταξύ ουσιαστικών και επιθέτων, αλλά αγνοεί εντελώς τις καταλήξεις.

Επίσης αδιαφορεί παντελώς για περιπτώσεις, πληθυντικούς και άλλα παρόμοια.

Για να κάνετε την αναζήτηση πιο ακριβή, πρέπει να βάλετε το ερώτημα σε εισαγωγικά ή να βάλετε ένα θαυμαστικό πριν από τη λέξη.

Τώρα κοιτάξτε το ίδιο ερώτημα, αλλά χωρίς τα θαυμαστικά.

Βλέπεις τη διαφορά; Με θαυμαστικά, ο αριθμός των απαντήσεων δεν είναι 2 εκατομμύρια, αλλά 186 χιλιάδες.

Εάν βάλετε ένα θαυμαστικό μπροστά από μια λέξη με κεφαλαίο γράμμα, θα λάβετε απαντήσεις στις οποίες εμφανίζεται η συγκεκριμένη λέξη με κεφαλαίο γράμμα.

Εάν η λέξη είναι στην ονομαστική πτώση και χρειάζεστε πληροφορίες για αυτήν ακριβώς τη λέξη και ακριβώς τον τρόπο που τη γράψατε, τότε βάλτε δύο θαυμαστικά μπροστά από αυτήν τη λέξη. Για παράδειγμα: !!Μπάλα .

Η αναζήτηση θα σας δώσει απαντήσεις για αυτήν ακριβώς τη λέξη " Μπάλα" όπως το έγραψες. Όχι" μπάλα", Όχι" μπάλες", και με κεφαλαίο γράμμα.

Αν γράψετε μια φράση με τη λέξη " επί", τότε η Yandex θα αγνοήσει" επί" Για παράδειγμα: " στο ράφι" Η αναζήτηση θα πραγματοποιηθεί μόνο χρησιμοποιώντας τη λέξη " ράφι ».

Για να το λάβει υπόψη του και να μην το αγνοήσει, είναι απαραίτητο πριν από τη λέξη « επί» βάλε ένα σύμβολο συν – « +on ».

Κάθε μηχανή αναζήτησης έχει τον δικό της αλγόριθμο αναζήτησης, οπότε αν χρησιμοποιείτε μια συγκεκριμένη μηχανή αναζήτησης και θέλετε να μάθετε πώς να συνθέτετε σωστά ερωτήματα, τότε απλά πρέπει να πληκτρολογήσετε " κανόνες αναζήτησης σεGoogle "ή" κανόνες αναζήτησης στο Yandex ", ακολουθήστε τον σύνδεσμο για την απάντηση στο αίτημά σας και διαβάστε τις απαραίτητες πληροφορίες.

Για να βρείτε τα αρχεία που χρειάζεστε στον υπολογιστή σας, έχουμε ήδη εξετάσει τις τυπικές δυνατότητες που είναι εγγενείς στο σύστημα των Windows. Μπορείτε να διαβάσετε περισσότερα σχετικά με την τυπική αναζήτηση στα Windows στα άρθρα: και.

Το πλεονέκτημα της τυπικής αναζήτησης είναι ότι δεν χρειάζεται να εγκαταστήσετε κάτι επιπλέον στον υπολογιστή σας!

Αλλά υπάρχει επίσης ένα σοβαρό μειονέκτημα - η τυπική αναζήτηση όλων δεν λειτουργεί ή δεν λειτουργεί τόσο καλά όσο θα θέλαμε!

Ως εκ τούτου, σε αυτό το άρθρο θα εξετάσουμε ένα ξεχωριστό εξαιρετικό Δωρεάν το πρόγραμμα Όλα, που σας επιτρέπει πολύ γρήγορα, θα έλεγε κανείς αμέσως (εν πτήσει), να βρείτε τα απαραίτητα αρχεία στον υπολογιστή σας!

Χρησιμοποιώντας το πρόγραμμα Όλα, μπορείτε να αναζητήσετε αρχεία στον υπολογιστή σας όχι μόνο με πλήρη ονόματα αρχείων, αλλά ακόμη και με μέρος μιας λέξης! Αυτή είναι μια εξαιρετική δυνατότητα για περιπτώσεις όπου δεν θυμόμαστε το όνομα ολόκληρου του αρχείου.

Απλώς εισάγουμε μια λέξη ή μέρος μιας λέξης στο πεδίο αναζήτησης και παίρνουμε αμέσως το αποτέλεσμα! Ταυτόχρονα, παραδόξως, το Everything δεν επιβραδύνει καθόλου τον υπολογιστή, όπως συμβαίνει με άλλα προγράμματα.

Όλα είναι ένα γρήγορο, ελαφρύ και βολικό πρόγραμμα για την αναζήτηση αρχείων και φακέλων στον υπολογιστή σας.

Ας ξεκινήσουμε με μια βήμα προς βήμα ανάλυση της εγκατάστασης και χρήσης αυτού του προγράμματος.

Πώς να κατεβάσετε τα πάντα στα ρωσικά

Ας πούμε ότι δεν θυμάμαι πού είναι αποθηκευμένο αυτό το βιβλίο στον υπολογιστή μου.

Για να το βρείτε χρησιμοποιώντας το πρόγραμμα Πάντα, δεν χρειάζεται να πληκτρολογήσω όλο αυτόν τον μεγάλο τίτλο του βιβλίου. Μπορώ να εισάγω μόνο μια λέξη βιβλίοκαι λάβετε αυτό το αποτέλεσμα:

Σε αυτήν την περίπτωση, η αναζήτηση μου έδειξε ότι έχω 33 στοιχεία στα οποία εμφανίζεται η λέξη βιβλίο. Επιπλέον, τα αποτελέσματα αναζήτησης εμφανίζουν όλα τα στοιχεία ανά τύπο αρχείου, επισημαίνοντας τη λέξη που αναζητούσα.

Και μπορώ ήδη να βρω το αρχείο που χρειάζομαι στην εμφανιζόμενη λίστα και να πάω σε αυτό, απλά κάνοντας γρήγορα δύο κλικ σε αυτό. Αν είναι αρχείο, θα ανοίξει αμέσως. Εάν πρόκειται για φάκελο με αρχεία, ο φάκελος θα ανοίξει.

Ή μπορώ να περιορίσω την αναζήτηση ώστε η λίστα να είναι μικρότερο αρχείο. Για παράδειγμα, θα γράψω τη λέξη τα περισσότερα. Αμέσως λαμβάνω τον φάκελο που χρειάζομαι:

Όπως μπορείτε να δείτε, η εύρεση αρχείων και φακέλων στον υπολογιστή σας είναι πολύ εύκολη με τα πάντα. Χαίρομαι που είναι δωρεάν, στα ρωσικά και παρέχει αποτελέσματα αναζήτησης πολύ γρήγορα!

Πρόσθετες ρυθμίσεις για τα πάντα

Πρόγραμμα Πάντααρχικά έχουν ήδη διαμορφωθεί βέλτιστα για τους περισσότερους χρήστες. Ωστόσο, υπάρχουν πρόσθετες λειτουργίες που μπορείτε να χρησιμοποιήσετε εάν είναι απαραίτητο.

Έτσι, για παράδειγμα, χρησιμοποιώντας το μενού Ερευναμπορείτε να καθορίσετε με ποια κριτήρια θα εμφανίζονται τα αποτελέσματα: από αρχεία συγκεκριμένων μορφών, ανά φακέλους ή οτιδήποτε άλλο. Τέτοιοι περιορισμοί μπορεί να είναι χρήσιμοι εάν το όνομα εμφανίζεται σε διαφορετικά αρχεία και η λίστα τέτοιων αρχείων είναι μεγάλη. Και χάρη στον περιορισμό σε ορισμένες κατηγορίες, μπορείτε να περιορίσετε την αναζήτησή σας με ακρίβεια:

Θα ήταν επίσης χρήσιμο να ελέγξετε απλώς τις λειτουργίες που μπορείτε να βρείτε στο μενού Υπηρεσία-> Ρυθμίσεις. Επαναλαμβάνω ότι από προεπιλογή όλα είναι ήδη ρυθμισμένα για τις ανάγκες των περισσότερων χρηστών, αλλά ίσως θέλετε να ενεργοποιήσετε ή να απενεργοποιήσετε ορισμένες πρόσθετες ρυθμίσεις.

Φορητή έκδοση του προγράμματος αναζήτησης Όλα

Στην αρχή του άρθρου, μιλήσαμε ήδη για μια τέτοια φορητή έκδοση αυτού του προγράμματος. Χρησιμοποιήστε τη φορητή έκδοση καθώς και τη σταθερή. Αξίζει μόνο να αναφέρουμε ότι η φορητή έκδοση είναι αρχειοθετημένη.

Επομένως, μετά τη λήψη του αρχείου της φορητής έκδοσης, χρειάζεστε έναν αρχειοθέτη για να μπορείτε να ανοίξετε το αρχείο. Εάν το αρχείο λήψης δεν μπορεί να ανοίξει, σημαίνει ότι το αρχείο αρχειοθέτησης δεν είναι εγκατεστημένο στον υπολογιστή. Σε αυτήν την περίπτωση, πραγματοποιήστε λήψη και εγκατάσταση, την εγκατάσταση και τη χρήση των οποίων έχουμε ήδη συζητήσει σε ξεχωριστό άρθρο.

Εάν σκοπεύετε να χρησιμοποιήσετε τη φορητή έκδοση σε έναν υπολογιστή του οποίου το βάθος bit δεν γνωρίζετε, χρησιμοποιήστε ένα αρχείο σχεδιασμένο για συστήματα 32 bit. Ή είναι καλύτερα να κατεβάσετε και τις δύο εκδόσεις - η μία θα ξεκινήσει σίγουρα, αλλά διαφορετικά θα εμφανίσει απλώς το μήνυμα:

Ετσι:Αν χρειάζεται να αναζητήσετε αρχεία ή φακέλους στον υπολογιστή σας από καιρό σε καιρό, είμαι σίγουρος ότι θα εκτιμήσετε αυτό το δωρεάν πρόγραμμα!

Κατεβάστε, χρησιμοποιήστε, μοιραστείτε τις εντυπώσεις σας στα σχόλια!

Έχουν γίνει εδώ και καιρό αναπόσπαστο μέρος του ρωσικού Διαδικτύου. Οι μηχανές αναζήτησης είναι πλέον τεράστιοι και περίπλοκοι μηχανισμοί που αντιπροσωπεύουν όχι μόνο ένα εργαλείο αναζήτησης πληροφοριών, αλλά και δελεαστικές περιοχές για τις επιχειρήσεις.

Οι περισσότεροι χρήστες μηχανών αναζήτησης δεν έχουν σκεφτεί ποτέ (ή το σκέφτηκαν, αλλά δεν βρήκαν απάντηση) για την αρχή λειτουργίας των μηχανών αναζήτησης, το σχέδιο επεξεργασίας των αιτημάτων των χρηστών, τι αποτελούνται αυτά τα συστήματα και πώς λειτουργούν...

Αυτό το master class έχει σχεδιαστεί για να απαντήσει στο ερώτημα πώς λειτουργούν οι μηχανές αναζήτησης. Ωστόσο, δεν θα βρείτε εδώ παράγοντες που επηρεάζουν την κατάταξη των εγγράφων. Επιπλέον, δεν πρέπει να υπολογίζετε σε μια λεπτομερή εξήγηση του αλγορίθμου Yandex. Αυτός, σύμφωνα με τον Ilya Segalovich, διευθυντή τεχνολογίας και ανάπτυξης της μηχανής αναζήτησης Yandex, μπορεί να αναγνωριστεί "υπό βασανιστήριο" μόνο από τον ίδιο τον Ilya Segalovich...

2. Έννοια και λειτουργίες μιας μηχανής αναζήτησης

Ένα σύστημα αναζήτησης είναι ένα συγκρότημα λογισμικού και υλικού που έχει σχεδιαστεί για την αναζήτηση στο Διαδίκτυο και την απάντηση σε ένα αίτημα χρήστη, που καθορίζεται με τη μορφή μιας φράσης κειμένου (ερώτημα αναζήτησης), με την παραγωγή μιας λίστας συνδέσμων προς πηγές πληροφοριών, κατά σειρά συνάφειας ( σύμφωνα με το αίτημα). Οι μεγαλύτερες διεθνείς μηχανές αναζήτησης: "Google", Yahoo , MSN . Στο ρωσικό Διαδίκτυο αυτά είναι τα Yandex, Rambler, Aport.

Ας ρίξουμε μια πιο προσεκτική ματιά στην έννοια του ερωτήματος αναζήτησης χρησιμοποιώντας τη μηχανή αναζήτησης Yandex ως παράδειγμα. Το ερώτημα αναζήτησης πρέπει να διατυπώνεται από τον χρήστη σύμφωνα με αυτό που θέλει να βρει, όσο το δυνατόν πιο συνοπτικά και απλά. Ας υποθέσουμε ότι θέλουμε να βρούμε πληροφορίες στο Yandex σχετικά με τον τρόπο επιλογής αυτοκινήτου. Για να το κάνετε αυτό, ανοίξτε την κύρια σελίδα του Yandex και εισαγάγετε το κείμενο του ερωτήματος αναζήτησης "πώς να επιλέξετε ένα αυτοκίνητο". Στη συνέχεια, το καθήκον μας έγκειται στο άνοιγμα των συνδέσμων που παρέχονται κατόπιν αιτήματός μας σε πηγές πληροφοριών στο Διαδίκτυο. Ωστόσο, είναι πολύ πιθανό να μην βρούμε τις πληροφορίες που χρειαζόμαστε. Εάν συμβεί αυτό, τότε είτε πρέπει να αναδιατυπώσετε το αίτημά σας ή η βάση δεδομένων της μηχανής αναζήτησης δεν έχει πραγματικά καμία σχετική πληροφορία σχετικά με το αίτημά μας (αυτό μπορεί να συμβεί όταν κάνετε πολύ «στενές» ερωτήσεις, όπως, για παράδειγμα, «πώς να επιλέξετε ένα αυτοκίνητο στο Αρχάγγελσκ»)

Ο πρωταρχικός στόχος κάθε μηχανής αναζήτησης είναι να παρέχει στους ανθρώπους ακριβώς τις πληροφορίες που αναζητούν. Και διδάξτε τους χρήστες να κάνουν «σωστά» αιτήματα στο σύστημα, π.χ. ερωτήματα που συμμορφώνονται με τις αρχές λειτουργίας των μηχανών αναζήτησης είναι αδύνατον. Επομένως, οι προγραμματιστές δημιουργούν αλγόριθμους και αρχές λειτουργίας για τις μηχανές αναζήτησης που θα επιτρέπουν στους χρήστες να βρίσκουν τις πληροφορίες που αναζητούν.

Αυτό σημαίνει ότι η μηχανή αναζήτησης πρέπει να «σκέφτεται» με τον ίδιο τρόπο που σκέφτεται ο χρήστης όταν αναζητά πληροφορίες. Όταν ένας χρήστης κάνει ένα αίτημα σε μια μηχανή αναζήτησης, θέλει να βρει αυτό που χρειάζεται όσο το δυνατόν πιο γρήγορα και εύκολα. Λαμβάνοντας το αποτέλεσμα, αξιολογεί την απόδοση του συστήματος, καθοδηγούμενος από αρκετές βασικές παραμέτρους. Βρήκε αυτό που έψαχνε; Αν δεν το βρήκε, πόσες φορές έπρεπε να αναδιατυπώσει το ερώτημα για να βρει αυτό που έψαχνε; Πόσες σχετικές πληροφορίες μπορούσε να βρει; Πόσο γρήγορα επεξεργάστηκε το ερώτημα η μηχανή αναζήτησης; Πόσο βολικά παρουσιάστηκαν τα αποτελέσματα αναζήτησης; Το αποτέλεσμα που αναζητούσατε ήταν το πρώτο ή το εκατοστό; Πόσα περιττά σκουπίδια βρέθηκαν μαζί με χρήσιμες πληροφορίες; Θα βρεθούν οι απαραίτητες πληροφορίες κατά την πρόσβαση σε μια μηχανή αναζήτησης, ας πούμε, σε μια εβδομάδα ή σε ένα μήνα;

Για να ικανοποιηθούν όλες αυτές οι ερωτήσεις με απαντήσεις, οι προγραμματιστές μηχανών αναζήτησης βελτιώνουν συνεχώς τους αλγόριθμους και τις αρχές αναζήτησης, προσθέτουν νέες λειτουργίες και δυνατότητες και προσπαθούν με κάθε δυνατό τρόπο να επιταχύνουν τη λειτουργία του συστήματος.

3. Κύρια χαρακτηριστικά της μηχανής αναζήτησης

Ας περιγράψουμε τα κύρια χαρακτηριστικά των μηχανών αναζήτησης:

  • Πληρότητα

    Η πληρότητα είναι ένα από τα κύρια χαρακτηριστικά ενός συστήματος αναζήτησης, το οποίο είναι η αναλογία του αριθμού των εγγράφων που βρέθηκαν κατόπιν αιτήματος προς τον συνολικό αριθμό των εγγράφων στο Διαδίκτυο που ικανοποιούν το συγκεκριμένο αίτημα. Για παράδειγμα, εάν υπάρχουν 100 σελίδες στο Διαδίκτυο που περιέχουν τη φράση "πώς να επιλέξετε ένα αυτοκίνητο" και μόνο 60 από αυτές βρέθηκαν για το αντίστοιχο ερώτημα, τότε η πληρότητα της αναζήτησης θα είναι 0,6. Προφανώς, όσο πιο ολοκληρωμένη είναι η αναζήτηση, τόσο λιγότερο πιθανό είναι ο χρήστης να μην βρει το έγγραφο που χρειάζεται, με την προϋπόθεση ότι υπάρχει καθόλου στο Διαδίκτυο.

  • Ακρίβεια

    Η ακρίβεια είναι ένα άλλο βασικό χαρακτηριστικό μιας μηχανής αναζήτησης, το οποίο καθορίζεται από το βαθμό στον οποίο τα έγγραφα που βρέθηκαν ταιριάζουν με το αίτημα του χρήστη. Για παράδειγμα, εάν το ερώτημα "πώς να επιλέξετε ένα αυτοκίνητο" περιέχει 100 έγγραφα, τα 50 από αυτά περιέχουν τη φράση "πώς να επιλέξετε ένα αυτοκίνητο" και τα υπόλοιπα περιέχουν απλώς αυτές τις λέξεις ("πώς να επιλέξετε το σωστό ραδιόφωνο και να το εγκαταστήσετε στο ένα αυτοκίνητο»), τότε η ακρίβεια αναζήτησης θεωρείται ίση με 50/100 (=0,5). Όσο πιο ακριβής είναι η αναζήτηση, τόσο πιο γρήγορα θα βρει ο χρήστης τα έγγραφα που χρειάζεται, τόσο λιγότερα διάφορα είδη «σκουπιδιών» θα βρεθούν ανάμεσά τους, τόσο λιγότερο συχνά τα έγγραφα που βρέθηκαν δεν θα ανταποκρίνονται στο αίτημα.

  • Συνάφεια

    Η συνάφεια είναι ένα εξίσου σημαντικό στοιχείο της αναζήτησης, το οποίο χαρακτηρίζεται από το χρόνο που περνά από τη στιγμή που δημοσιεύονται τα έγγραφα στο Διαδίκτυο μέχρι να εισαχθούν στη βάση δεδομένων ευρετηρίων της μηχανής αναζήτησης. Για παράδειγμα, την επόμενη μέρα που εμφανίστηκαν ενδιαφέρουσες ειδήσεις, ένας μεγάλος αριθμός χρηστών στράφηκε σε μηχανές αναζήτησης με σχετικά ερωτήματα. Αντικειμενικά, έχει περάσει λιγότερο από μια μέρα από τη δημοσίευση των ειδήσεων σχετικά με αυτό το θέμα, αλλά τα κύρια έγγραφα έχουν ήδη ευρετηριαστεί και είναι διαθέσιμα για αναζήτηση, χάρη στην ύπαρξη της λεγόμενης «γρήγορης βάσης δεδομένων» μεγάλων μηχανών αναζήτησης, η οποία ενημερώνεται πολλές φορές την ημέρα.

  • Ταχύτητα αναζήτησης

    Η ταχύτητα αναζήτησης σχετίζεται στενά με την αντίσταση φορτίου. Για παράδειγμα, σύμφωνα με τη Rambler Internet Holding LLC, σήμερα κατά τις εργάσιμες ώρες η μηχανή αναζήτησης Rambler λαμβάνει περίπου 60 αιτήματα ανά δευτερόλεπτο. Αυτός ο φόρτος εργασίας απαιτεί τη μείωση του χρόνου επεξεργασίας ενός μεμονωμένου αιτήματος. Εδώ τα ενδιαφέροντα του χρήστη και της μηχανής αναζήτησης συμπίπτουν: ο επισκέπτης θέλει να λάβει αποτελέσματα όσο το δυνατόν γρηγορότερα και η μηχανή αναζήτησης πρέπει να επεξεργαστεί το αίτημα όσο το δυνατόν γρηγορότερα, ώστε να μην επιβραδύνει τον υπολογισμό των επόμενων ερωτημάτων.

  • Ορατότητα

4. Σύντομη ιστορία της ανάπτυξης των μηχανών αναζήτησης

Στην αρχική περίοδο ανάπτυξης του Διαδικτύου, ο αριθμός των χρηστών του ήταν μικρός και ο όγκος των διαθέσιμων πληροφοριών ήταν σχετικά μικρός. Ως επί το πλείστον, μόνο το ερευνητικό προσωπικό είχε πρόσβαση στο Διαδίκτυο. Αυτή τη στιγμή, το έργο της αναζήτησης πληροφοριών στο Διαδίκτυο δεν ήταν τόσο επείγον όσο είναι τώρα.

Ένας από τους πρώτους τρόπους οργάνωσης της πρόσβασης σε πόρους πληροφοριών δικτύου ήταν η δημιουργία ανοιχτών καταλόγων ιστότοπων, συνδέσμων σε πόρους στους οποίους ομαδοποιήθηκαν ανάλογα με το θέμα. Το πρώτο τέτοιο έργο ήταν ο ιστότοπος Yahoo.com, ο οποίος άνοιξε την άνοιξη του 1994. Αφού αυξήθηκε σημαντικά ο αριθμός των τοποθεσιών στον κατάλογο, προστέθηκε η δυνατότητα αναζήτησης των απαραίτητων πληροφοριών στον κατάλογο. Με την πλήρη έννοια, δεν ήταν ακόμη μηχανή αναζήτησης, καθώς η περιοχή αναζήτησης περιοριζόταν μόνο στους πόρους που υπήρχαν στον κατάλογο και όχι σε όλους τους πόρους του Διαδικτύου.

Οι κατάλογοι συνδέσμων χρησιμοποιήθηκαν ευρέως στο παρελθόν, αλλά έχουν χάσει σχεδόν εντελώς τη δημοτικότητά τους προς το παρόν. Δεδομένου ότι ακόμη και οι σύγχρονοι κατάλογοι, τεράστιοι σε όγκο, περιέχουν πληροφορίες μόνο για ένα αμελητέο μέρος του Διαδικτύου. Ο μεγαλύτερος κατάλογος του δικτύου DMOZ (ονομάζεται επίσης Open Directory Project) περιέχει πληροφορίες για 5 εκατομμύρια πόρους, ενώ η βάση δεδομένων της μηχανής αναζήτησης Google αποτελείται από περισσότερα από 8 δισεκατομμύρια έγγραφα.

Το 1995 εμφανίστηκαν οι μηχανές αναζήτησης Lycos και AltaVista. Η τελευταία είναι εδώ και πολλά χρόνια ηγέτης στον τομέα της αναζήτησης πληροφοριών στο Διαδίκτυο.

Το 1997, ο Sergey Brin και ο Larry Page δημιούργησαν τη μηχανή αναζήτησης Google ως μέρος ενός ερευνητικού έργου στο Πανεπιστήμιο του Στάνφορντ. Η Google είναι αυτή τη στιγμή η πιο δημοφιλής μηχανή αναζήτησης στον κόσμο!

Τον Σεπτέμβριο του 1997, ανακοινώθηκε επίσημα η μηχανή αναζήτησης Yandex, η οποία είναι η πιο δημοφιλής στο ρωσόφωνο Διαδίκτυο.

Επί του παρόντος, υπάρχουν τρεις κύριες μηχανές αναζήτησης (διεθνείς) - η Google, η Yahoo και, οι οποίες έχουν τις δικές τους βάσεις δεδομένων και αλγόριθμους αναζήτησης. Οι περισσότερες άλλες μηχανές αναζήτησης (από τις οποίες υπάρχει μεγάλος αριθμός) χρησιμοποιούν με τη μια ή την άλλη μορφή τα αποτελέσματα των τριών που αναφέρονται. Για παράδειγμα, η αναζήτηση AOL (search.aol.com) χρησιμοποιεί τη βάση δεδομένων Google, ενώ οι AltaVista, Lycos και AllTheWeb χρησιμοποιούν τη βάση δεδομένων Yahoo.

5. Σύνθεση και αρχές λειτουργίας του συστήματος αναζήτησης

Στη Ρωσία, η κύρια μηχανή αναζήτησης είναι η Yandex και ακολουθούν οι Rambler.ru, Google.ru, Aport.ru, Mail.ru. Επιπλέον, αυτή τη στιγμή, το Mail.ru χρησιμοποιεί τη μηχανή αναζήτησης και τη βάση δεδομένων Yandex.

Σχεδόν όλες οι μεγάλες μηχανές αναζήτησης έχουν τη δική τους δομή, διαφορετική από άλλες. Ωστόσο, είναι δυνατό να εντοπιστούν τα κύρια στοιχεία που είναι κοινά σε όλες τις μηχανές αναζήτησης. Οι διαφορές στη δομή μπορούν να είναι μόνο με τη μορφή υλοποίησης των μηχανισμών αλληλεπίδρασης αυτών των στοιχείων.

Μονάδα ευρετηρίασης

Η ενότητα ευρετηρίασης αποτελείται από τρία βοηθητικά προγράμματα (ρομπότ):

Το Spider είναι ένα πρόγραμμα που έχει σχεδιαστεί για τη λήψη ιστοσελίδων. Η αράχνη κατεβάζει τη σελίδα και ανακτά όλους τους εσωτερικούς συνδέσμους από αυτήν τη σελίδα. Γίνεται λήψη του κώδικα html κάθε σελίδας. Τα ρομπότ χρησιμοποιούν πρωτόκολλα HTTP για τη λήψη σελίδων. Η αράχνη λειτουργεί ως εξής. Το ρομπότ στέλνει το αίτημα «get/path/document» και κάποιες άλλες εντολές αιτήματος HTTP στον διακομιστή. Σε απόκριση, το ρομπότ λαμβάνει μια ροή κειμένου που περιέχει πληροφορίες υπηρεσίας και το ίδιο το έγγραφο.

  • URL σελίδας
  • ημερομηνία λήψης της σελίδας
  • Επικεφαλίδα http απόκρισης διακομιστή
  • σώμα σελίδας (κώδικας html)

Το Crawler («ταξιδεύοντας» αράχνη) είναι ένα πρόγραμμα που ακολουθεί αυτόματα όλους τους συνδέσμους που βρίσκονται στη σελίδα. Επιλέγει όλους τους συνδέσμους που υπάρχουν στη σελίδα. Η δουλειά του είναι να καθορίσει πού πρέπει να πάει η αράχνη στη συνέχεια, με βάση συνδέσμους ή με βάση μια προκαθορισμένη λίστα διευθύνσεων. Το Crawler, ακολουθώντας τους συνδέσμους που βρέθηκαν, αναζητά νέα έγγραφα που είναι ακόμα άγνωστα στη μηχανή αναζήτησης.

Το Indexer (robot indexer) είναι ένα πρόγραμμα που αναλύει ιστοσελίδες που κατεβαίνουν από αράχνες. Ο δείκτης αναλύει τη σελίδα στα συστατικά μέρη της και τα αναλύει χρησιμοποιώντας τους δικούς του λεξιλογικούς και μορφολογικούς αλγόριθμους. Αναλύονται διάφορα στοιχεία σελίδας, όπως κείμενο, επικεφαλίδες, σύνδεσμοι, χαρακτηριστικά δομής και στυλ, ετικέτες HTML ειδικών υπηρεσιών κ.λπ.

Έτσι, η μονάδα ευρετηρίασης σάς επιτρέπει να ανιχνεύσετε ένα δεδομένο σύνολο πόρων χρησιμοποιώντας συνδέσμους, να κάνετε λήψη σελίδων που συναντήθηκαν, να εξαγάγετε συνδέσμους σε νέες σελίδες από τα ληφθέντα έγγραφα και να εκτελέσετε μια πλήρη ανάλυση αυτών των εγγράφων.

Βάση δεδομένων

Μια βάση δεδομένων, ή ευρετήριο μηχανής αναζήτησης, είναι ένα σύστημα αποθήκευσης δεδομένων, ένας πίνακας πληροφοριών στον οποίο αποθηκεύονται οι ειδικά μετατρεπόμενες παράμετροι όλων των εγγράφων που λήφθηκαν και υποβάλλονται σε επεξεργασία από τη μονάδα ευρετηρίου.

Διακομιστής αναζήτησης

Ο διακομιστής αναζήτησης είναι το πιο σημαντικό στοιχείο ολόκληρου του συστήματος, καθώς η ποιότητα και η ταχύτητα της αναζήτησης εξαρτώνται άμεσα από τους αλγόριθμους που διέπουν τη λειτουργία του.

Ο διακομιστής αναζήτησης λειτουργεί ως εξής:

  • Το αίτημα που λαμβάνεται από τον χρήστη υποβάλλεται σε μορφολογική ανάλυση. Δημιουργείται το περιβάλλον πληροφοριών κάθε εγγράφου που περιέχεται στη βάση δεδομένων (το οποίο στη συνέχεια θα εμφανίζεται με τη μορφή, δηλαδή πληροφορίες κειμένου που αντιστοιχούν στο αίτημα στη σελίδα αποτελεσμάτων αναζήτησης).
  • Τα δεδομένα που λαμβάνονται διαβιβάζονται ως παράμετροι εισόδου σε μια ειδική μονάδα κατάταξης. Τα δεδομένα υποβάλλονται σε επεξεργασία για όλα τα έγγραφα, με αποτέλεσμα κάθε έγγραφο να έχει τη δική του βαθμολογία που χαρακτηρίζει τη συνάφεια του ερωτήματος που έχει εισαχθεί από τον χρήστη και των διαφόρων στοιχείων αυτού του εγγράφου που είναι αποθηκευμένα στο ευρετήριο της μηχανής αναζήτησης.
  • Ανάλογα με την επιλογή του χρήστη, αυτή η βαθμολογία μπορεί να προσαρμοστεί από πρόσθετες συνθήκες (για παράδειγμα, τη λεγόμενη "προχωρημένη αναζήτηση").
  • Στη συνέχεια, δημιουργείται ένα απόσπασμα, δηλαδή για κάθε έγγραφο που βρέθηκε, ο τίτλος, μια σύντομη περίληψη που ταιριάζει καλύτερα με το ερώτημα και ένας σύνδεσμος προς το ίδιο το έγγραφο εξάγονται από τον πίνακα εγγράφων και επισημαίνονται οι λέξεις που βρέθηκαν.
  • Τα αποτελέσματα αναζήτησης που προκύπτουν μεταδίδονται στον χρήστη με τη μορφή SERP (Search Engine Result Page) - μια σελίδα αποτελεσμάτων αναζήτησης.

Όπως μπορείτε να δείτε, όλα αυτά τα στοιχεία συνδέονται στενά μεταξύ τους και λειτουργούν σε αλληλεπίδραση, διαμορφώνοντας έναν σαφή, μάλλον περίπλοκο μηχανισμό για τη λειτουργία ενός συστήματος αναζήτησης, που απαιτεί τεράστιες ποσότητες πόρων.

6. Συμπέρασμα

Τώρα ας συνοψίσουμε όλα τα παραπάνω.

  • Ο πρωταρχικός στόχος κάθε μηχανής αναζήτησης είναι να παρέχει στους ανθρώπους ακριβώς τις πληροφορίες που αναζητούν.
  • Κύρια χαρακτηριστικά των μηχανών αναζήτησης:
    1. Πληρότητα
    2. Ακρίβεια
    3. Συνάφεια
    4. Ταχύτητα αναζήτησης
    5. Ορατότητα
  • Η πρώτη πλήρης μηχανή αναζήτησης ήταν το έργο WebCrawler, που δημοσιεύτηκε το 1994.
  • Το σύστημα αναζήτησης περιλαμβάνει τα ακόλουθα στοιχεία:
    1. Μονάδα ευρετηρίασης
    2. Βάση δεδομένων
    3. Διακομιστής αναζήτησης

Ελπίζουμε ότι η κύρια τάξη μας θα σας επιτρέψει να εξοικειωθείτε περισσότερο με την έννοια της μηχανής αναζήτησης και να κατανοήσετε καλύτερα τις κύριες λειτουργίες, τα χαρακτηριστικά και τις αρχές λειτουργίας των μηχανών αναζήτησης.

Κάθε μέρα ο όγκος των πληροφοριών από το δίκτυο, άρα και στους υπολογιστές των χρηστών, αυξάνεται. Στους σκληρούς δίσκους του μέσου χρήστη, ο αριθμός των αρχείων μπορεί να φτάσει αρκετές εκατοντάδες και η εύρεση αυτού που χρειάζεστε στη συνολική μάζα δεν είναι καθόλου εύκολη. Η τυπική μηχανή αναζήτησης των Windows δεν λειτουργεί πάντα γρήγορα και έχει πολύ περιορισμένη λειτουργικότητα, επομένως είναι λογικό να χρησιμοποιείτε προγράμματα τρίτων κατασκευαστών.

Σε αυτήν την ανασκόπηση, θα εξετάσουμε διάφορα προγράμματα που θα σας βοηθήσουν να βρείτε τα απαραίτητα δεδομένα στον υπολογιστή σας.

Αυτό το πρόγραμμα είναι ίσως το πιο ισχυρό εργαλείο για την αναζήτηση δίσκων υπολογιστή. Έχει πολλές λεπτές ρυθμίσεις, φίλτρα και λειτουργίες. Η διανομή περιλαμβάνει επίσης πρόσθετα βοηθητικά προγράμματα για την αλληλεπίδραση με το σύστημα αρχείων.

Ένα από τα διακριτικά χαρακτηριστικά του Search My Files είναι η δυνατότητα πλήρους διαγραφής αρχείων μέσω αντικατάστασης με μηδενικά ή τυχαία δεδομένα.

SearchMyFiles

Το Search My Files συχνά συγχέεται με το προηγούμενο λογισμικό λόγω του παρόμοιου ονόματος του. Αυτό το πρόγραμμα διαφέρει ως προς το ότι είναι πιο εύκολο στη χρήση, αλλά ταυτόχρονα δεν διαθέτει ορισμένες λειτουργίες, για παράδειγμα, αναζήτηση σε μονάδες δίσκου δικτύου.

Πάντα

Ένα απλό πρόγραμμα αναζήτησης με τις δικές του δυνατότητες. Όλα μπορούν να αναζητήσουν δεδομένα όχι μόνο στον τοπικό υπολογιστή, αλλά και σε διακομιστές ETP και FTP. Ξεχωρίζει από άλλους εκπροσώπους παρόμοιου λογισμικού στο ότι σας επιτρέπει να παρακολουθείτε τις αλλαγές στο σύστημα αρχείων του υπολογιστή.

Αποτελεσματική αναζήτηση αρχείων

Ένα άλλο πολύ εύκολο στη ρύθμιση και χρήση λογισμικού. Με πολύ μικρό μέγεθος, έχει επαρκή αριθμό λειτουργιών, μπορεί να εξάγει αποτελέσματα σε αρχεία κειμένου και πίνακα και μπορεί να εγκατασταθεί σε μονάδα flash.

UltraSearch

Το UltraSearch μπορεί να βρει όχι μόνο αρχεία και φακέλους, αλλά και να αναζητήσει πληροφορίες στα περιεχόμενα των εγγράφων με φράση-κλειδί ή λέξη. Το κύριο χαρακτηριστικό του προγράμματος είναι η αυτόματη προετοιμασία των συνδεδεμένων μέσων.

R.E.M.

Το REM έχει μια πιο φιλική διεπαφή από τους προηγούμενους συμμετέχοντες. Η αρχή του προγράμματος είναι να δημιουργεί ζώνες στις οποίες τα αρχεία καταχωρούνται αυτόματα στο ευρετήριο, γεγονός που μπορεί να επιταχύνει σημαντικά τη διαδικασία αναζήτησης. Οι ζώνες μπορούν να δημιουργηθούν όχι μόνο στον τοπικό υπολογιστή, αλλά και σε δίσκους στο δίκτυο.

Αναζήτηση στο Google Desktop

Αναπτύχθηκε από μια παγκοσμίου φήμης εταιρεία, η Google Desktop Search είναι μια μικρή τοπική μηχανή αναζήτησης. Με τη βοήθειά του, μπορείτε να αναζητήσετε πληροφορίες τόσο στον υπολογιστή του σπιτιού σας όσο και στο Διαδίκτυο. Εκτός από την κύρια λειτουργία, το πρόγραμμα προβλέπει τη χρήση μπλοκ πληροφοριών - gadget για την επιφάνεια εργασίας.

Όλα τα προγράμματα αυτής της λίστας είναι εξαιρετικές αντικαταστάσεις για την εγγενή αναζήτηση των Windows. Επιλέξτε μόνοι σας: εγκαταστήστε απλούστερο λογισμικό, αλλά με μικρότερο σύνολο λειτουργιών ή μια ολόκληρη μηχανή αναζήτησης με δυνατότητα επεξεργασίας αρχείων. Εάν εργάζεστε με φακέλους και μονάδες δίσκου σε τοπικό δίκτυο, τότε το REM και το Everything είναι κατάλληλα για εσάς και αν σκοπεύετε να "κουβαλήσετε το πρόγραμμα μαζί σας", τότε δώστε προσοχή στην Αποτελεσματική αναζήτηση αρχείων ή στην Αναζήτηση στα αρχεία μου.



Συνιστούμε να διαβάσετε

Κορυφή