Μηχανές αναζήτησης πληροφοριών. Γλώσσες ερωτημάτων Διαδικτύου IRS

ΗΛΕΚΤΡΟΝΙΚΑ ΕΙΔΗ 01.05.2019
Επισκόπηση προγράμματος Η έκδοση υπολογιστή του Microsoft Excel Viewer θα επιτρέψει...

Chercher ΗΛΕΚΤΡΟΝΙΚΑ ΕΙΔΗ

Θέμα 2. Ανάκτηση και ενημέρωση πληροφοριών

συστήματα βοήθειας

Περιεχόμενο

2.4. Ασκηση

Ευρετήριο ταξινόμησης. Σειρά αναζήτησης. Αναζήτηση εικόνας του εγγράφου. Εικόνα ερωτήματος αναζήτησης. Σύστημα μεταδεδομένων. Πρόσβαση στο δίκτυο. Αυθαίρετο αίτημα. Εργαστείτε σύμφωνα με το σενάριο. Ψηφιακή βιβλιοθήκη. Μηχανικά αναγνώσιμος κατάλογος.

2.1. Πληροφορίες μηχανές αναζήτησης

Αρχές για τη διαμόρφωση μιας τυπικής δομής πληροφοριών:

Ενιαία εισαγωγή και επαναλαμβανόμενη χρήση πληροφοριών.

Πλήρης ικανοποίηση των αναγκών πληροφοριών των κύριων ομάδων χρηστών.

Άμεση αναπλήρωση των πόρων με υποχρεωτικά έγγραφα.

Βολική πρόσβαση σε πόρους στομακριά από- Και επί- γραμμήλειτουργίες?

Εκπλήρωση τόσο συγκεκριμένων, στενά θεματικών όσο και ευρύτερα θεματικών αιτημάτων.

Τα αιτήματα που δημιουργούνται από χρήστες πληροφοριακών συστημάτων υλοποιούνται με τους ακόλουθους τρόπους:

Τα μηνύματα ως απάντηση σε ένα αίτημα αποθηκεύονται στο ρητάστη βάση δεδομένων και η διαδικασία λήψης απάντησης είναι η επιλογή ενός υποσυνόλου γνώσεων από τα αρχεία βάσης δεδομένων που ικανοποιούν το αίτημα.

Η απάντηση δεν υπάρχει ρητά στη βάση δεδομένων και διαμορφώνεται μέσω της διαδικασίας της λογικής εξαγωγής συμπερασμάτων με βάση τα διαθέσιμα δεδομένα.

Θεωρία ανάκτηση πληροφορίαςξεκίνησε με μια μελέτη των χαρακτηριστικών των συστημάτων ανάκτησης πληροφοριών εγγράφων (IRS). Κάτω από ανάκτηση πληροφορίαςσε τέτοια συστήματα εννοείται ότι εκτελείται μια ορισμένη σειρά λειτουργιών για την εύρεση εγγράφων (άρθων, επιστημονικών και τεχνικών εκθέσεων, περιγραφές πιστοποιητικών πνευματικών δικαιωμάτων και διπλωμάτων ευρεσιτεχνίας, βιβλία κ.λπ.) που περιέχουν ορισμένες πληροφορίες(με την επακόλουθη έκδοση των ίδιων των εγγράφων ή των αντιγράφων τους), ή με σκοπό την έκδοση πραγματικών δεδομένων που αντιπροσωπεύουν απαντήσεις στις ερωτήσεις που τέθηκαν.

Η συστοιχία στοιχείων πληροφοριών στην οποία εκτελείται η αναζήτηση πληροφοριών ονομάζεται πίνακας αναζήτησης. Οι υπάρχοντες τύποι υπηρεσιών πληροφοριών παρουσιάζονται στο τραπέζι:

Πινακίδα ταξινόμησης

Είδος υπηρεσίας

Από πηγή πρωτοβουλίας

Αναγκαστικά?

Σύμφωνα με τα αιτήματα των καταναλωτών

Ανά τύπο εγγράφου

Με κατεύθυνση ή στόχευση

Ενημερωτικές δημοσιεύσεις (πολλές διευθύνσεις).

Επιλεκτική διανομή πληροφοριών (μία διεύθυνση)

Με συχνότητα ή επείγον

Τρέχουσα ειδοποίηση.

Αναδρομική αναζήτηση

Σύμφωνα με τη μέθοδο προσαγωγής εγγράφων στον καταναλωτή

Απευθείας διαβίβαση εγγράφων ή αντιγράφων τους στους καταναλωτές.

Υπηρεσία σε δύο στάδια (πρώτα μια δημοσίευση πληροφοριών και στη συνέχεια αντίγραφα εγγράφων που ενδιαφέρουν τον καταναλωτή

Με σκοπό, σκοπό

Εξοικείωση;

Για πρακτική χρήση

Οι μέθοδοι υλοποίησης τύπων και μορφών υπηρεσίας εξαρτώνται από τον τύπο, τον σκοπό και τη μέθοδο υλοποίησης ενός συγκεκριμένου πληροφοριακού συστήματος. Προφανώς, είναι σχεδόν αδύνατο να διαβάσετε κάθε έγγραφο στη βιβλιοθήκη για να βρείτε αυτό που χρειάζεστε. Ως εκ τούτου, σε όλη την ιστορία της ανάκτησης πληροφοριών, οι μέθοδοι αναζήτησης έχουν αναπτυχθεί και βελτιωθεί.

Σε κάθε έγγραφο που εισάγεται στον πίνακα αναζήτησης εκχωρείται μια εικόνα αναζήτησης του εγγράφου (SID), η οποία είναι ένα χαρακτηριστικό που αντικατοπτρίζει το κύριο σημασιολογικό περιεχόμενο του εγγράφου (αυτό το SID διαφέρει από τον κωδικό που έχει εκχωρηθεί στοιχείο πληροφοριώνστο πραγματικό IS). Στην ίδια μορφή σύντομη περιγραφή– μια συνταγή αναζήτησης ή μια εικόνα ερωτήματος αναζήτησης (SQI) πρέπει επίσης να διατυπώσει ένα αίτημα πληροφοριών. Χάρη σε αυτό, η διαδικασία αναζήτησης μπορεί να περιοριστεί σε μια απλή σύγκριση εικόνων αναζήτησης εγγράφων με μια συνταγή αναζήτησης.

Για τη σύγκριση POD και POP, αναπτύσσονται και εφαρμόζονται διάφορα κριτήρια αναζήτησης ή κριτήρια σημασιολογικής συμμόρφωσης. Η ακρίβεια της αναζήτησης καθορίζεται από την ακρίβεια της εμφάνισης εγγράφων και ερωτημάτων χρησιμοποιώντας τις εικόνες αναζήτησής τους και τον βαθμό σύμπτωσης μεταξύ του POD και του POP. Ως εκ τούτου, μπορεί να υπάρχει ελλιπής έκδοση εγγράφων ή, αντίθετα, «θόρυβος αναζήτησης», που αντιπροσωπεύουν ένα είδος πληρωμής για τη διευκόλυνση της διαδικασίας ανάκτησης πληροφοριών.

Η διαδικασία έκφρασης του κύριου σημασιολογικού περιεχομένου ενός εγγράφου και αιτημάτων πληροφοριών σε μια γλώσσα ανάκτησης πληροφοριών ονομάζεται ευρετηρίασηκαι αποτελεί ουσιαστικό μέρος της αναλυτικής και συνθετικής επεξεργασίας των εγγράφων. Επομένως, η ανάκτηση πληροφοριών συνίσταται στην αντικατάσταση της ουσιαστικής ανάγνωσης του πλήρους κειμένου των εγγράφων με μια επίσημη «σύγκριση» (σύγκριση για συμμόρφωση) των εικόνων αναζήτησης με ερωτήματα στη γλώσσα των ευρετηρίων.

Η ανάκτηση πληροφοριών υλοποιείται χρησιμοποιώντας σύστημα ανάκτησης πληροφοριών, το οποίο σε αφηρημένη μορφή θα πρέπει να αποτελείται από μια γλώσσα ανάκτησης πληροφοριών, κανόνες για τη μετάβαση σε αυτή τη γλώσσα και ένα κριτήριο σημασιολογικής συμμόρφωσης που καθορίζει τον όγκο των εγγράφων ή πληροφοριών έκδοσης.

Το μοντέλο οργάνωσης δεδομένων στα συστήματα αναφοράς υπερκειμένου βασίζεται σε έναν συνδυασμό συσχετιστικών υπερσυνδέσεων και στην ιεραρχική αρχή της οργάνωσης θραυσμάτων και εγγράφων. Το εννοιολογικό διάγραμμα του συστήματος ανάκτησης πληροφοριών παρουσιάζεται στο σχήμα:

Το μοντέλο οργάνωσης δεδομένων στα συστήματα αναφοράς υπερκειμένου βασίζεται σε έναν συνδυασμό συσχετιστικών υπερσυνδέσεων και στην ιεραρχική αρχή της οργάνωσης θραυσμάτων και εγγράφων.

Οι μηχανές αναζήτησης χωρίζονται σε καταλόγους και ευρετήρια. διαφέρουν ως προς την τεχνολογία προετοιμασίας υλικού αναφοράς: οι κατάλογοι καταρτίζονται από άτομα και τα ευρετήρια δημιουργούνται αυτόματα. Ο μεγαλύτερος κατάλογος στο Διαδίκτυο - Yahoo! (www.yahoo.com ) Περιέχει πάνω από ένα εκατομμύριο πόρους και υποστηρίζεται από 150 συντάκτες. Κορυφαίος κατάλογος στη Ρωσία -Λίστα. Ru (www.list.ru ): 100 χιλιάδες σύνδεσμοι ταξινομημένοι σε 18 καταλόγους.

Χρησιμοποιείται η γλώσσα των λέξεων αναζήτησης ευρετηρίαση συντεταγμένωνέγγραφα και ερωτήματα μέσω περιγραφών και λέξεων-κλειδιών. Βασίζεται σε έναν αλφαβητικό κατάλογο λεξιλογικών ενοτήτων ή σε ένα λεξικό με λέξεις-κλειδιά. Ήταν η γλώσσα των λέξεων-κλειδιών που άνοιξε τη δυνατότητα αυτοματοποίησης της αναζήτησης πληροφοριών. Σας επιτρέπει να αποκαλύπτετε τα περιεχόμενα των εγγράφων με επαρκή λεπτομέρεια και από πολλές πτυχές. Περιγραφείς και λέξεις-κλειδιάσυμπληρώνονται και ενημερώνονται εύκολα, καθώς κάθε λεξικό στοιχείο που είναι απαραίτητο για την ευρετηρίαση μπορεί να συμπεριληφθεί στον αλφαβητικό κατάλογο.

Οι κατάλογοι ανάκτησης πληροφοριών είναι παραδοσιακές τεχνολογίες για την οργάνωση της ανάκτησης πληροφοριών στις συλλογές τεκμηρίωσης των βιβλιοθηκών και των αρχείων και αντιπροσωπεύουν ένα σύστημα ταξινόμησης της γνώσης σε μια συγκεκριμένη θεματική περιοχή. Το σημασιολογικό περιεχόμενο ενός εγγράφου σε καταλόγους ανάκτησης πληροφοριών εμφανίζεται από τη μία ή την άλλη κατηγορία του καταλόγου και η ευρετηρίαση των εγγράφων συνίσταται στην εκχώρηση σε κάθε έγγραφο ενός ειδικού κωδικού (ευρετηρίου) που αντιστοιχεί σε περιεχόμενο στην κατηγορία (τάξεις) του καταλόγου και δημιουργώντας ένα ειδικό ευρετήριο σε αυτή τη βάση.

Σύστημα μεταδεδομένων είναι το κεντρικό λογικό συστατικό κάθε ηλεκτρονικής βιβλιοθήκης (EL). Ακριβώς όπως ένας κατάλογος βιβλιοθήκης οργανώνει ολόκληρο το σύνολο των αντικειμένων αποθήκευσης σε ένα σύστημα συλλογών βιβλιοθήκης γύρω από το οποίο χτίζονται όλες οι τεχνολογίες της βιβλιοθήκης, ένα σύστημα μεταδεδομένων οργανώνει μια συλλογή ηλεκτρονικών πηγών πληροφοριών (ή ψηφιακών αντικειμένων) μιας βιβλιοθήκης.

Με βάση το σύστημα μεταδεδομένων, το κύριο τεχνολογικές διαδικασίες EB:

Πλοήγηση στον χώρο πληροφοριών.

Αναζήτηση μεμονωμένων ψηφιακών αντικειμένων (πόροι πληροφοριών) ή συλλογών τους.

Εισαγωγή, επεξεργασία και οργάνωση αποθήκευσης ψηφιακών αντικειμένων, καθώς και εξαίρεση (απόσυρση) τους.

Διαχείριση δικαιωμάτων πρόσβασης σε ψηφιακά αντικείμενα, συμπεριλαμβανομένης της προστασίας πνευματικών δικαιωμάτων, της οργάνωσης τελών πρόσβασης κ.λπ.

Τύποι μεταδεδομένων:

Περιγραφικός– βιβλιογραφικές πληροφορίες ή άλλες πληροφορίες για το περιεχόμενο (σημασιολογία) ψηφιακών αντικειμένων.

Κατασκευαστικός– πληροφορίες σχετικά με μορφές, δομή, όγκο και άλλες τυπικές ιδιότητες ψηφιακών αντικειμένων.

Διοικητικός – δικαιώματα, άδειες πρόσβασης, διόρθωσης δεδομένων, δεδομένων χρήστη, δεδομένων για συστήματα πληρωμών, τεχνολογικά δεδομένα.

Ένας κοινός τύπος μεταδεδομένων είναι αναγνωριστικό, καθήκον του οποίου είναι να εκπροσωπεί αναμφίβολα ψηφιακό αντικείμενογια εξωτερικό πρόσωπο και διάφορες εφαρμογές.

Τα συστήματα μεταδεδομένων ορίζουν μια κατηγορία εργασιών που υλοποιούνται στη βιβλιοθήκη και έχουν καθοριστικό αντίκτυπο στη διαλειτουργικότητα (συμβατότητα) των συλλογών που είναι διαθέσιμες στη βιβλιοθήκη. Έτσι, η υιοθέτηση ορισμένων αρχών σχετικά με τα μεταδεδομένα καθορίζει στην πραγματικότητα το κόστος των έργων για τη δημιουργία ηλεκτρονικών βάσεων δεδομένων και τη σχέση κόστους-αποτελεσματικότητας αυτών των έργων.

Τα ακόλουθα συστήματα μεταδεδομένων είναι γνωστά:

MARC – Μηχανοαναγνώσιμος κατάλογος. CSDGM – πρότυπο για ψηφιακά γεωχωρικά δεδομένα. GILS – παγκόσμια (κυβερνητική) υπηρεσία ανάκτησης πληροφοριών. EAD – κωδικοποίηση αρχειακών περιγραφών, που χρησιμοποιείται για την τυποποίηση και ταξινόμηση μοναδικών αρχείων υλικών, κυρίως χειρογράφων.ΤΕΙ – Πρωτοβουλία κωδικοποίησης κειμένου. Μορφή του κρατικού μητρώου βάσεων δεδομένων και τραπεζών δεδομένων - περιέχει ένα σύστημα μεταδεδομένων για βάσεις δεδομένων και άλλα ηλεκτρονικά σύνολα δεδομένων.

Διεθνής ομάδα με επικεφαλής τον Stuart Weber & OCLC (με έδρα στο Δουβλίνο, Οχάιο, ΗΠΑ) ανέπτυξε το σύστημα μεταδεδομένων Dublin Core.

Το σύνολο μεταδεδομένων Dublin Core αποτελείται από 15 στοιχεία:

Τίτλος (Τίτλος) – το όνομα που έχει εκχωρηθεί στον πόρο από τον δημιουργό ή τον εκδότη.

Συγγραφέας (Δημιουργός) – το άτομο ή ο οργανισμός που είναι αρχικά υπεύθυνος για το πνευματικό περιεχόμενο του πόρου (στην περίπτωση ενός χειρόγραφου εγγράφου, αυτοί είναι οι συγγραφείς· στην περίπτωση των οπτικών πόρων, αυτοί είναι ερμηνευτές, φωτογράφοι, εικονογράφοι).

Στοιχείο (Θέμα) – θέμα του πόρου. Συνήθως το θέμα εκφράζεται με λέξεις-κλειδιά ή μια φράση που περιγράφει το θέμα ή το περιεχόμενο του πόρου. Ενθαρρύνεται η χρήση ελεγχόμενων λεξιλογίων και επίσημων σχημάτων ταξινόμησης.

Περιγραφή (Περιγραφή) – περιγραφή κειμένου του περιεχομένου του πόρου, συμπεριλαμβανομένης μιας περίληψης στην περίπτωση εγγράφων ή μιας περιγραφής του περιεχομένου στην περίπτωση ενός οπτικού πόρου.

Εκδότης (Εκδότης) – ένας οργανισμός υπεύθυνος για την κατάσταση του πόρου στην παρουσιαζόμενη μορφή του: εκδοτικός οίκος, πανεπιστημιακό τμήμα, εταιρεία.

Συμμετέχοντας στη δημιουργία του υλικού ( Συνεισφέρων) – άτομο ή οργανισμός που δεν είναι ο συγγραφέας (δεν προσδιορίζεται στο στοιχείο «συγγραφέας»), αλλά έχει συμβάλει σημαντικά πνευματικά στον πόρο· των οποίων η συνεισφορά είναι δευτερεύουσα σε οποιοδήποτε πρόσωπο ή οργανισμό που αναφέρεται μεταξύ των συγγραφέων: επιμελητής, μεταφραστής, εικονογράφος.

Ημερομηνία (Ημερομηνία) – ημερομηνία που υποδεικνύει τη δημιουργία ή την εμφάνιση του πόρου (σε προσβάσιμη μορφή).

Τύπος (Τύπος) – κατηγορία πόρων: αρχική σελίδα, μυθιστόρημα, ποίημα, άρθρο, προτύπωση, τεχνική έκθεση, δοκίμιο, λεξικό.

Μορφή (Μορφή) – μορφή για την αναπαράσταση δεδομένων πόρων (που συνήθως υποδεικνύει τον τύπο του λογισμικού και, πιθανώς, τον τύπο του υπολογιστή που μπορεί να είναι απαραίτητος για την εμφάνιση και την εργασία με τον πόρο).

Αναγνωριστικό (Αναγνωριστικό) – ένα σύνολο γραμμάτων ή αριθμών που χρησιμοποιούνται συνήθως για τον μοναδικό προσδιορισμό ενός πόρου.

Πηγή (Πηγή) – πληροφορίες σχετικά με την πηγή από την οποία ελήφθη ο παρουσιαζόμενος πόρος.

Γλώσσα (Γλώσσα) – η γλώσσα στην οποία παρουσιάζεται το πνευματικό περιεχόμενο του πόρου.

Σύνδεση (Σχέση) – αναγνωριστικό του πρωτεύοντος πόρου και η σχέση του με τον αντιπροσωπευόμενο πόρο. Αυτό το στοιχείο σάς επιτρέπει να συσχετίσετε σχετικούς πόρους μεταξύ τους, καθώς και μια περιγραφή του πόρου που πρέπει να εμφανιστεί. Για παράδειγμα, έκδοση βιβλίου και κεφάλαιο βιβλίου.

Κάλυψη (Κάλυψη) – χαρακτηριστικά της θέσης και της χρονικής διάρκειας του πόρου.

δικαιώματα (Δικαιώματα) – αξίωση πνευματικών δικαιωμάτων και διαχείριση (ένα αναγνωριστικό που σχετίζεται με μια τέτοια αξίωση· ένα αναγνωριστικό που σχετίζεται με μια υπηρεσία που παρέχει πληροφορίες σχετικά με τη διαχείριση δικαιωμάτων για έναν δεδομένο πόρο).

2.2. Συστήματα πληροφοριών και αναφοράς. Βιβλιοθήκες. Αρχεία

Η πρόσβαση στα δεδομένα γίνεται σύμφωνα με τη δομή τους, δίνεται με περιγραφήδεδομένα και είναι μια διαδικασία για τη διέλευση των κορυφών ενός δέντρου δεδομένων. Κατά τη διέλευση της τρέχουσας κορυφής, μπορείτε να εκτελέσετε ορισμένες ενέργειες με τα δεδομένα: να διαβάσετε και να αλλάξετε δεδομένα, να δημιουργήσετε νέες κορυφές, να διαγράψετε τις τρέχουσες κορυφές μαζί με τα υποδέντρα τους κ.λπ. Σε αυτήν την περίπτωση, όλες οι κινήσεις που εκτελούνται στη διαδικασία διέλευσης του δέντρου δεδομένων είναι είτε μεταβάσεις που συνάδουν με την ιεραρχία του δέντρου είτε άμεσες μεταβάσεις κατά μήκος συνδέσμων. Το σύνολο τέτοιων μεταβάσεων ονομάζεται τροχιάσε ένα δέντρο δεδομένων ή μια βάση δεδομένων.

Σύμφωνα με την τροχιά του δέντρου δεδομένων, η εκτέλεση του ερωτήματος χωρίζεται λογικά σε μέρη που σχετίζονται με την επεξεργασία ομάδων δεδομένων με διάφορες διαδικασίες. Η ακολουθία πρόσβασης στα δεδομένα κατά μήκος της τροχιάς του δέντρου δεδομένων καθορίζει τη σειρά εκτέλεσης των διαδικασιών επεξεργασίας και η διαθεσιμότητα των δεδομένων είναι το ίδιο το γεγονός της εκτέλεσης των διαδικασιών (στην πραγματικότητα, η πρόσβαση στα δεδομένα ελέγχει την εκτέλεση των διαδικασιών). Έτσι, ένα ερώτημα είναι ένα σύνθετο μείγμα ανάγνωσης δεδομένων από τη βάση δεδομένων και διαδικασιών εκτέλεσης.

Η διεπαφή διαλόγου παρέχει επίσης διάφορες μορφές αλληλεπίδρασης:

Εργαστείτε σύμφωνα με το σενάριο.

Εργασία με αυθαίρετα αιτήματα.

Εργαστείτε στη δημιουργία ενός σεναρίου.

Δουλεύοντας σύμφωνα με το σενάριο . Αυτός είναι ο κύριος τρόπος λειτουργίας για τους τελικούς χρήστες της εφαρμογής. Η αλληλεπίδραση λαμβάνει χώρα σε μια γλώσσα που αποτελείται από μενού, εντολές και φόρμες που πρέπει να συμπληρωθούν και να εκδοθούν σύμφωνα με ένα δεδομένο σενάριο. Το σενάριο αντανακλά τα επαγγελματικά ενδιαφέροντα των χρηστών και δημιουργείται με όρους που είναι κατανοητοί σε αυτούς. Το σενάριο περιλαμβάνει συμβουλές και εκπαιδευτικά εργαλεία. Ο χρήστης δεν χρειάζεται να γνωρίζει τη δομή των δεδομένων και να μάθει μια ειδική γλώσσα χειρισμού δεδομένων. Το σενάριο δημιουργείται από τον διαχειριστή και δεν μπορεί να αλλάξει αμέσως.

Εργασία με προσαρμοσμένα ερωτήματα . Αυτός είναι ο τρόπος λειτουργίας για επαγγελματίες χρήστες στον τομέα της επεξεργασίας δεδομένων. Αυτή η μορφή αλληλεπίδρασης είναι διαθέσιμη σε εκπαιδευμένους χρήστες που γνωρίζουν τη δομή της βάσης πληροφοριών και τη γλώσσα χειρισμού δεδομένων. Ο χρήστης μπορεί να εργαστεί με το σχήμα της βάσης δεδομένων (καθορισμός, διαγραφή, αλλαγή σχέσεων) εντός των ορίων της εξουσιοδότησης που του έχει εκχωρηθεί. Μια γλώσσα σχεσιακής διεπαφής χρησιμοποιείται για τον χειρισμό δεδομένων. Ο διάλογος αποτελείται από αιτήματα στη γλώσσα της σχεσιακής διεπαφής, εντολές ελέγχου και επεξεργασίας και απαντήσεις σε αυτές, που μεταδίδονται μέσω της διεπαφής διαλόγου.

Εργασία δημιουργίας σεναρίου . Αυτή είναι η λειτουργία διαχειριστή. Το σενάριο τελικού χρήστη της εφαρμογής δημιουργείται από τον διαχειριστή μαζί με τους χρήστες της εφαρμογής. Ο σχηματισμός του σεναρίου πραγματοποιείται σε διαδραστική λειτουργία. Ενώ εργάζεται, ο διαχειριστής έχει την ευκαιρία να ελέγξει το σενάριο που δημιούργησε και να το διορθώσει γρήγορα. Ο διαχειριστής δημιουργεί ένα σύστημα μενού και προτροπών που σχετίζονται με το μενού και περιγράφει φόρμες οθόνης σύμφωνα με τις απαιτήσεις των τελικών χρηστών.

Ο διάλογος του εφαρμοζόμενου τελικού χρήστη καθορίζεται από ένα ιεραρχικό σύστημα μενού που περιέχει μια περιγραφή της ακολουθίας εργασίας ως προς μια συγκεκριμένη θεματική περιοχή. Για τη διατύπωση ερωτημάτων, παρέχεται στους χρήστες ένα εξειδικευμένο πρόγραμμα επεξεργασίας πλήρους οθόνης. Η στρατηγική του διαλόγου βασίζεται στην έννοια της βοήθειας με βάση τα συμφραζόμενα που διανθίζονται με αιτήματα. Ένα τμήμα που αποτελείται από μια λέξη-κλειδί και μια συσχετισμένη πεδίο κειμένου, γίνεται ανεξάρτητο αντικείμενο. Η μεγέθυνση των αντικειμένων επεξεργασίας σάς επιτρέπει να επιταχύνετε την επεξεργασία των αιτημάτων και τα διαδραστικά εργαλεία για την εργασία με πρότυπα μειώνουν την πιθανότητα κατά λάθος εισαγωγής σφαλμάτων στο κείμενο των αιτημάτων.

Ηλεκτρονικές βιβλιοθήκες

Οι κύριοι βασικοί ορισμοί είναι:

Βιβλιογραφική βάση δεδομένων – μια βάση δεδομένων τεκμηρίωσης, μια εγγραφή που περιέχει μόνο μια βιβλιογραφική περιγραφή.

Σύστημα βιβλιοθήκης – ένα σύνολο αλληλεπιδρώντων βιβλιοθηκών, ενωμένων υπό ορισμένους συμβατικούς όρους για την πληρέστερη ικανοποίηση των αιτημάτων των χρηστών και αποτελεσματική χρήσηπόρους της βιβλιοθήκης.

Βιβλιογραφία – η διαδικασία προετοιμασίας βιβλιογραφικών πληροφοριών.

Βιβλιογραφικό λήμμα – ένα σύνολο βιβλιογραφικών πληροφοριών για ένα έγγραφο, που δίνεται σύμφωνα με ορισμένους κανόνες που καθορίζουν τη σειρά των περιοχών και των στοιχείων και προορίζονται για αναγνώριση γενικά χαρακτηριστικάέγγραφο.

Κατάλογος βιβλιοθήκης – ένα σύνολο βιβλιογραφικών εγγραφών για έγγραφα που βρίσκονται σύμφωνα με ορισμένους κανόνες, αποκαλύπτοντας τη σύνθεση και το περιεχόμενο της συλλογής μιας βιβλιοθήκης ή ενός κέντρου πληροφοριών.

Ευρετηρίαση– έκφραση του περιεχομένου ενός εγγράφου ή της έννοιας ενός αιτήματος πληροφοριών στο ΠΠ.

Ευρετήριο ταξινόμησης – μια εικόνα αναζήτησης που έχει κατασκευαστεί μέσω μιας ταξινόμησης IPL.

Αναζήτηση συνταγής – κείμενο που περιλαμβάνει την εικόνα αναζήτησης του ερωτήματος και οδηγίες σχετικά με λογικές πράξειςπου θα πραγματοποιηθεί κατά τη διαδικασία ανάκτησης πληροφοριών.

Η συνειδητοποίηση της ανάγκης και των πλεονεκτημάτων της τυποποίησης στο περιβάλλον της βιβλιοθήκης ήρθε με την έναρξη της χρήσης και της ανταλλαγής βιβλιογραφικών εγγραφών με δυνατότητα ανάγνωσης από μηχανή.

Η αρχή της ανάπτυξης συνδέεται με αυτήν την περίοδο οικιακό σύστημαπρότυπα για την επιστήμη των υπολογιστών, εκδόσεις βιβλιοθηκών - SIBID (τέλη δεκαετίας '70 - αρχές δεκαετίας '80). Καθιερώθηκαν πρότυπα GOST για βιβλιογραφική περιγραφή γενικές αρχέςκαι κανόνες για τη σύνταξη περιγραφών για διάφορους τύπους εγγράφων: ένα σύνολο στοιχείων μιας βιβλιογραφικής περιγραφής, τη σειρά της διάταξής τους, το περιεχόμενο και τη μέθοδο παρουσίασης κάθε στοιχείου, τη χρήση συμβατικών οριοθέτων.

Τα πρότυπα για τις βιβλιογραφικές περιγραφές προέκυψαν ως αποτέλεσμα της αναθεώρησης των εθνικών κανόνων καταλογογράφησης σε σχέση με τη δημιουργία το 1977 του " Διεθνές πρότυποβιβλιογραφική περιγραφή» ( ISBD). Ως γνωστόν, το ISBD έχει γίνει διεθνές πρότυπο ISO , το οποίο απαιτούσε αναθεώρηση των εθνικών κανονισμών στα κράτη μέλη ISO και δημιουργία κατάλληλων εθνικών προτύπων.

Ιδιότητες ενός αυτοματοποιημένου συστήματος βιβλιοθήκης:

Εξάλειψη σημαντικού μέρους της πρωτόγονης ή καθαρά γραφικής εργασίας.

Εξάλειψη των σφαλμάτων που εισέρχονται στο σύστημα.

Σταθερότητα πληροφοριών εντός του συστήματος.

Γρήγορη απάντηση στα αιτήματα.

Μία από τις σημαντικές λειτουργίες των αυτοματοποιημένων συστημάτων βιβλιοθήκης είναι να παρέχουν απαντήσεις στα αιτήματα των χρηστών. Κατά τη διαδικασία σχηματισμού ενός αιτήματος, ο χρήστης πρέπει να προσδιορίσει εκείνο το τμήμα της βάσης πληροφοριών που σχετίζεται με την έκδοση πιστοποιητικού και επίσης να δημιουργήσει μια συνταγή που καθορίζει τα κριτήρια επιλογής δεδομένων και τη διαδικασία εξαγωγής των απαραίτητων πληροφοριών από το βάση δεδομένων. Η διαδικασία αναζήτησης περιλαμβάνει πληροφορίες που προσδιορίζουν ένα μέρος της βάσης δεδομένων, ένα κατηγόρημα που ορίζει το κριτήριο για την επιλογή των δεδομένων και έναν τελεστή εξαγωγής.

Ψηφιακή βιβλιοθήκη – ένα κατανεμημένο σύστημα πληροφοριών που σας επιτρέπει να αποθηκεύετε αξιόπιστα και να χρησιμοποιείτε αποτελεσματικά ετερογενείς συλλογές ηλεκτρονικών εγγράφων (κείμενο, γραφικά, ήχος, βίντεο) μέσω παγκόσμιων δικτύων δεδομένων σε μορφή κατάλληλη για τον τελικό χρήστη. Η βασική μονάδα μιας ηλεκτρονικής βιβλιοθήκης είναι ένα ηλεκτρονικό αρχείο με αρθρωτή δομή.

Η ηλεκτρονική βιβλιοθήκη έχει σχεδιαστεί για να εκτελεί τις ακόλουθες λειτουργίες:

Αυτοματοποιημένη καταχώρηση εισερχόμενων υλικών.

Μεταφορά έντυπων αντιγράφων σε μαγνητικά μέσα.

Ευρετηρίαση εισερχόμενων υλικών.

Βιβλιογραφική περιγραφή του εισερχόμενου υλικού.

Περίληψη και σχολιασμός εισερχόμενων υλικών.

Δημιουργία καταλόγων αναφοράς σε εξωτερικές (δικτυακές) πηγές.

Αυτοματοποιημένη αναζήτηση πληροφοριών (ευρετηρίαση αιτημάτων πληροφοριών).

Εξοπλισμός αυτοματοποιημένων σταθμών εργασίας συνδρομητών και λειτουργία τους.

Επικοινωνία με εξωτερικές πηγές πληροφοριών ( υπηρεσία δικτύου);

Βοηθητικές εργασίες: αντιγραφή εγγράφων σε χαρτί, μαγνητικά μέσα, μικροταινία, φωτογραφικό χαρτί, μικροφωτογραφία.

Έκδοση περιληπτικών περιοδικών και ενημερωτικών δελτίων.

Οργάνωση γραφείου υποστήριξης και υπηρεσιών υποστήριξης.

Τα εργαλεία που αναπτύχθηκαν για αυτοματοποιημένα συστήματα βιβλιοθηκών ταξινομούνται σύμφωνα με το εύρος των υποστηριζόμενων διαδικασιών και υπηρεσιών βιβλιοθήκης ως εξής:

Αυτοματοποιημένα συστήματα πληροφοριών και βιβλιοθηκών (AILS).

Αυτοματοποιημένοι σταθμοί εργασίας (AWS), οι οποίοι αναπτύσσονται είτε ως ενότητες λογισμικούσύστημα βιβλιοθήκης ή ως ανεξάρτητα συστήματα πληροφοριών·

Ηλεκτρονικά συστήματα αναφοράς (συμπεριλαμβανομένου του πλήρους κειμένου).

Αυτόνομα αυτοματοποιημένα συστήματα υποστήριξης και λειτουργίας βάσεων δεδομένων πληροφοριών για διάφορους σκοπούς.

Η εργασία του χρήστη στην ηλεκτρονική βιβλιοθήκη πραγματοποιείται σε λειτουργία διαλόγου χρησιμοποιώντας ιεραρχικό σύστημαμενού. Είναι δυνατή η τροποποίηση των υπαρχόντων μενού και η δημιουργία νέων σύμφωνα με τις συγκεκριμένες ανάγκες του χρήστη.

Ηλεκτρονικά αρχεία

Κατά την ανάπτυξη εγγράφων διαχείρισης, υπάρχει συχνά ανάγκη αναφοράς σε αρχειακά έγγραφα και κατά την επακόλουθη αποθήκευση - τη διαδικασία υποβολής εγγράφων στο Κρατικό Αρχείο και τη δημιουργία των δικών σας αρχείων.

Κάτω από αρχειακό ταμείο νοείται ως σύνολο εγγράφων που αντικατοπτρίζουν την υλική και πνευματική ζωή των λαών της, έχουν ιστορική, επιστημονική, κοινωνική, οικονομική, πολιτική ή πολιτιστική σημασία και αποτελούν αναπόσπαστο μέρος της ιστορικής και πολιτιστικής κληρονομιάς των λαών της Ρωσικής Ομοσπονδίας.

Κάτω από αρχειακό έγγραφονοείται ως έγγραφο που διατηρείται ή υπόκειται σε διατήρηση λόγω της σημασίας του για την κοινωνία, καθώς και ότι έχει αξία για τον ιδιοκτήτη.

Κάτω από αρχείονοείται ως ολότητα αρχειακά έγγραφα, καθώς και αρχειακό ίδρυμα ή δομική μονάδα ιδρύματος, οργανισμού ή επιχείρησης που λαμβάνει και αποθηκεύει αρχειακά έγγραφα προς όφελος των χρηστών.

Κάτω από μυστικό αρχείοαναφέρεται σε αρχείο που δεν ανακοινώνεται δημόσια.

Κάτω από αρχειακές υποθέσειςαναφέρεται στις δραστηριότητες οργάνωσης της αποθήκευσης, καταγραφής και χρήσης αρχειακών εγγράφων.

Ηλεκτρονικό αρχείο – ένα καθολικό σύστημα διαχείρισης εγγράφων, ο κύριος σκοπός του οποίου είναι η κεντρική αποθήκευση των εγγράφων και των εκδόσεων τους, η παροχή στους υπαλλήλους πρόσβαση σε έγγραφα για προβολή ή επεξεργασία και γρήγορη αναζήτηση πληροφοριών. Τα στοιχεία του ηλεκτρονικού αρχείου φαίνονται στο σχήμα:


Η χρήση αρχείου σάς επιτρέπει να οργανώσετε την αποθήκευση των εγγράφων και να οργανώσετε την εργασία με αυτά, ενώ μειώνετε τα γενικά έξοδα που σχετίζονται με την πρόσβαση σε έγγραφα.

Μπορείτε να αποθηκεύσετε έγγραφα οποιουδήποτε τύπου σε ένα ηλεκτρονικό αρχείο - έγγραφα γραφείου, κείμενα, εικόνες, αρχεία ήχου και βίντεο, έγγραφα συστήματος σχεδίασης, αρχεία, εφαρμογές κ.λπ. Η εμπειρία δείχνει ότι τα αρχεία χρησιμοποιούνται συχνότερα για τη διαχείριση εσωτερικών, οργανωτικών και διοικητικών εγγράφων και συμβάσεων. Σε ένα ηλεκτρονικό αρχείο, τα έγγραφα αποθηκεύονται σε κατηγοριοποιημένους φακέλους, η δομή των οποίων μπορεί να οργανωθεί, για παράδειγμα, σύμφωνα με την ιεραρχία των τμημάτων μιας επιχείρησης, αναθέτοντας έναν υπεύθυνο διαχειριστή σε κάθε ενότητα. Το κύριο πλεονέκτημα ενός τέτοιου αρχείου είναι η διαθεσιμότητα επαρκών δυνατοτήτων σε προσιτή τιμή. Σε συνδυασμό με την εκτεταμένη επεκτασιμότητα του, αυτό του επιτρέπει να χρησιμοποιείται αποτελεσματικά τόσο από μικρές όσο και από μεγάλες επιχειρήσεις.

Λειτουργίες ηλεκτρονικής αρχειοθέτησης:

Αποθήκευση εγγράφων. Χρησιμοποιώντας το αρχείο, μπορείτε να δημιουργήσετε ένα κεντρικό αποθετήριο εγγράφων και να παρέχετε στους υπαλλήλους ελεγχόμενη πρόσβαση στα έγγραφα, τόσο μέσω τοπικού δικτύου όσο και μέσω Διαδικτύου. Τα έγγραφα αποθηκεύονται σε μια ευέλικτη δομή κατηγοριοποιημένων φακέλων.

Δημιουργία εγγράφων. Τα έγγραφα στο αρχείο μπορούν να δημιουργηθούν με βάση προ-δημιουργημένα πρότυπα ή με μεταφορά καταλόγων και αρχείων από τοπικό ή μονάδα δίσκου δικτύουστους απαιτούμενους φακέλους. Υποστηρίζεται η εισαγωγή εγγράφων από σαρωτή, συμπεριλαμβανομένης της ροής, με δυνατότητα αυτόματης αναγνώρισης ( OCR εκδοχή). Η υπηρεσία αναγνώρισης εκτελείται στο παρασκήνιο στον διακομιστή αρχειοθέτησης.

Λογιστική εγγράφωνΓια κάθε έγγραφο στο αρχείο, διατηρείται μια κάρτα εγγραφής, το σύνολο των στοιχείων της οποίας συμμορφώνεται με το GOST R 6.30-2003 και τις απαιτήσεις του Κρατικού Προϋπολογισμού Εκπαιδευτικού Ιδρύματος. Η σύνθεση και η θέση των στοιχείων της κάρτας είναι αυστηρά διαμορφωμένες και δεν μπορούν να αλλάξουν.

Αλληλεπίδραση χρήστη. Στο αρχείο, οι χρήστες μπορούν να ανταλλάσσουν μηνύματα επισυνάπτοντας συνδέσμους σε έγγραφα συστήματος. Είναι δυνατή η αποστολή εγγράφων μέσω email. Για τον εξορθολογισμό της εργασίας με έγγραφα, είναι δυνατή η έκδοση εντολών και η παρακολούθηση της εκτέλεσής τους.

Εργαστείτε με έγγραφα. Το αρχείο χρησιμοποιεί κατάλληλες εφαρμογές για την προβολή και την επεξεργασία εγγράφων. Μια σειρά από κοινές μορφές εγγράφων, όπως κείμενα, εικόνες,Έγγραφα RTF, HTML -έγγραφα και έγγραφατο γραφείο της Microsoft , μπορεί να προβληθεί απευθείας χωρίς μετάβαση σε άλλη εφαρμογή.

Εγγραφή αλληλογραφίας. Μπορείτε να διατηρείτε αρχεία και να καταχωρείτε την εισερχόμενη και εξερχόμενη αλληλογραφία στο αρχείο. Σε αυτήν την περίπτωση, δημιουργούνται αυτόματα αριθμοί μέσω εγγραφής.

Κοινή πρόσβαση. Το αρχείο παρέχει στους υπαλλήλους συλλογική πρόσβαση σε έγγραφα, τόσο για προβολή όσο και για επεξεργασία. Οι διενέξεις κατά την ταυτόχρονη επεξεργασία εγγράφων εξαλείφονται χάρη στον μηχανισμό κλειδώματος εγγράφων.

Πρόσβαση στο δίκτυο.Τα εξαρτήματα που περιλαμβάνονται σάς επιτρέπουν να οργανώσετε την πρόσβαση σε έγγραφα χρησιμοποιώντας τυπικάιστός - προγράμματα περιήγησης. Αυτό επιτρέπει, για παράδειγμα, τη σύνδεση πελατών ή υπαλλήλων που εργάζονται εκτός γραφείου στο σύστημα.

Αναζήτηση.Το αρχείο σάς επιτρέπει να αναζητάτε έγγραφα όχι μόνο με στοιχεία κάρτας εγγραφής, αλλά και με κείμενο, λαμβάνοντας υπόψη τη μορφολογία της ρωσικής γλώσσας, δηλ. βρείτε οποιαδήποτε μορφή λέξεων που καθορίζεται στην έκφραση αναζήτησης.

Δικαιώματα πρόσβασης.Σε κάθε αντικείμενο αρχειοθέτησης (έγγραφο ή φάκελος) μπορεί να εκχωρηθεί ένα σύνολο δικαιωμάτων πρόσβασης. Υποστηρίζονται ομάδες χρηστών και κληρονομικότητα δικαιωμάτων. Τα δικαιώματα ταξινομούνται με βάση εννέα κριτήρια: προβολή, άνοιγμα, επεξεργασία, έκδοση, μετακίνηση, υπογραφή, επεξεργασία, δημιουργία και διαγραφή. Όλες οι ενέργειες χρήστη που σχετίζονται με αλλαγές σε αντικείμενα αρχειοθέτησης ή πρόσβαση σε αυτά καταγράφονται και μπορούν να προβληθούν από τον διαχειριστή του συστήματος.

Ενοποίηση με εξωτερικές εφαρμογές. Το αρχείο περιλαμβάνει μηχανισμούς για την ενοποίηση του συστήματος με εξωτερικές εφαρμογές, που επιτρέπουν:

Συμπεριλάβετε πρόσθετες λειτουργίες στο υπάρχον αρχείο.

Ανάπτυξη αυτοματοποιημένων συστημάτων επεξεργασίας παρτίδων.

Δημιουργήστε εξαιρετικά εξειδικευμένες εφαρμογές για εργασία με έγγραφα.

Ανάπτυξη λύσεων Διαδικτύου για πρόσβαση σε βάσεις δεδομένων εγγράφων.

2.3. Οργανωτικό και διοικητικό σύστημα του πανεπιστημίου

Το σύστημα έχει σχεδιαστεί για να επιλύει τις ακόλουθες λειτουργίες:

1. Ορθολογική χρήση της τεχνολογίας των υπολογιστών.

2. Ενίσχυση των πνευματικών ικανοτήτων αντικειμένων παιδαγωγικής διαχείρισης και ερευνητικών δραστηριοτήτων.

3. Βελτίωση του ελέγχου της ποιότητας της εκπαιδευτικής διαδικασίας.

4. Δοσολογία φόρτωσης δασκάλων και μαθητών.

5. Βελτιστοποίηση του ωραρίου των μαθημάτων με την καλύτερη χρήση χώρων και εξοπλισμού, λαμβάνοντας υπόψη παιδαγωγικές και ιατρικές απαιτήσεις.

6. Δημιουργία γραφήματα δικτύουπεραστικά μαθήματα και κλάδους.

7. Συσσώρευση, συστηματοποίηση και έγκαιρη παρουσίαση των απαραίτητων πληροφοριών για τα αποτελέσματα των εκπαιδευτικών δραστηριοτήτων.

8. Κατανομή του κόστους λαμβάνοντας υπόψη τα κέρδη αποδοτικότητας εκπαιδευτική διαδικασία.

9. Λήψη βέλτιστων επιστημονικών αποφάσεων.

Εξαρτήματα συστήματος:

1. Γενικά μαθήματα πληροφορικής (υπολογιστική, προγραμματισμός, ανεξάρτητη εργασία).

2. Εξειδικευμένα μαθήματα/εργαστήριο υπολογιστών ( Δημοτικό σχολείο, πολυμέσα, μοντελοποίηση).

3. Διοικητικό συγκρότημα (αρχεία, οικονομικά, γραφείο υποστήριξης).

4. Συγκρότημα επιδείξεων (εκπαιδευτική τηλεόραση, ήχος και βίντεο, διαφάνειες).

5. Εκδοτικό συγκρότημα (πληκτρολόγηση, σάρωση, επεξεργασία, αναπαραγωγή).

6. Συγκρότημα βιβλιοθήκης.

7. Συγκρότημα επικοινωνίας.

Η δομή του αυτοματοποιημένου συστήματος «Ίδρυμα Ανώτατης Εκπαίδευσης» φαίνεται στο σχήμα:


Ως παράδειγμα, δίνουμε τις συναρτήσεις του βασικού υποσυστήματος Προπονητικό μέρος,που προορίζεται για την οργάνωση της εκπαιδευτικής διαδικασίας:

Οργάνωση εργασιών με αναλυτικά προγράμματα για όλες τις ειδικότητες.

Οργάνωση της εργασίας με θεματικό σχέδιο.

Σχεδιασμός όγκου ακαδημαϊκή εργασίατμήματα?

Κατανομή του ωρομισθίου μεταξύ των τμημάτων.

Οργάνωση των εργασιών της επιτροπής εισδοχής·

Παρακολούθηση εκτέλεσης εκπαιδευτικών εργασιών από τμήματα.

Κατά την εργασία με το πρόγραμμα σπουδών, επισημαίνονται οι ακόλουθες λειτουργικές λειτουργίες: Προβολή σχεδίου, Δημιουργία δήλωσης, Προβολή δήλωσης(ένα απόσπασμα μπορεί να δημιουργηθεί ανά σχολή, αντικείμενο, μάθημα).

Διαθέσιμες πληροφορίεςαποθηκευμένο σε βάσεις δεδομένων:

Περίληψη, Θεματικό σχέδιο, Τόμοι εκπαιδευτικού έργου, Κάρτες εργασιών.

Για κάθε βάση είναι δυνατή η υλοποίηση των παρακάτω πληροφορίες:

Προβολή εγγραφών, Επεξεργασία της βάσης δεδομένων στο σύνολό της, Προσθήκη εγγραφών, Διαγραφή εγγραφών, Τροποποίηση εγγραφών.

2.4. Ασκηση

Εξοικειωθείτε με τις δυνατότητες των συστημάτων ανάκτησης πληροφοριών.

1. Χρήση καταλόγων θεματικής αναζήτησης

Αναζήτηση καταλόγων αναζήτησης απαραίτητες πληροφορίεςμε τη χρήση πολυεπίπεδες λίστες, στο οποίο τα πιθανά θέματα αναζήτησης χωρίζονται σε διάφορες κατηγορίες. Έχοντας επιλέξει μια κατηγορία ενδιαφέροντος, ο χρήστης προχωρά στην επόμενη, περισσότερο λεπτομερές επίπεδο, που είναι μια λίστα με δευτερεύουσες επικεφαλίδες, και ούτω καθεξής. Το τελικό αποτέλεσμα της αναζήτησης είναι ένας ή μια λίστα πολλών διακομιστών που περιέχει τις απαιτούμενες πληροφορίες.

Χρήση των αγγλικών κατάλογος αναζήτησης Yahoo!

Εκκινήστε τον Internet Explorer εάν δεν εκτελείται ήδη. Στο πεδίο Διεύθυνση, πληκτρολογήστε http://www.yahoo.comκαι πατήστε το πλήκτρο Εισαγω. Στη σελίδα καταλόγου αναζήτησης που εμφανίζεται, επιλέξτε την κατηγορία συνδέσμου Recreation&Sport και μεταβείτε στο επόμενο επίπεδο. Ομοίως, επιλέγοντας διαδοχικά τις ενότητες συνδέσμων Magazines, Bodybuilding, Master Trainer, συνδεθείτε στον διακομιστή που περιέχει τις επιλεγμένες πληροφορίες και προβάλετέ τον.

Χρήση του καταλόγου αναζήτησης στη ρωσική γλώσσα " Χρυσος ΟΔΗΓΟΣΔιαδίκτυο"

Στο πεδίο Διεύθυνση, πληκτρολογήστε http://www.piter-press.ruκαι πατήστε το πλήκτρο Εισαγω. Επιλέγοντας διαδοχικά τις ενότητες συνδέσμων Περιοχές και πόλεις, Αγία Πετρούπολη, Ζωντανή κάμερα στο Moika, θα δείτε ζωντανά πλάνα μιας από τις γωνιές της πόλης μας στον επιλεγμένο διακομιστή.

Χρησιμοποιώντας τον κατάλογο αναζήτησης στη ρωσική γλώσσα "AU!"

Στο πεδίο Διεύθυνση, πληκτρολογήστε http://www.au.ruκαι πατήστε το πλήκτρο Εισαγω. Επιλέξτε διαδοχικά τις κατηγορίες συνδέσμων Οικογένεια-σπίτι-αναψυχή, Διακομιστές ψυχαγωγίας, Γάτα πόλης. Θα δείτε μια σελίδα με το καθορισμένο θέμα.

Χρήση του καταλόγου αναζήτησης στη ρωσική γλώσσα "Internet Constellation"

Στο πεδίο Διεύθυνση, πληκτρολογήστε http://www.stars.ruκαι πατήστε το πλήκτρο Εισαγω. Επιλέξτε, για παράδειγμα, την ενότητα συνδέσμου Αναψυχή και Ψυχαγωγία και, στη συνέχεια, βρείτε τις πληροφορίες ψυχαγωγίας που σας αρέσουν.

Χρήση μηχανών αναζήτησης

Οι μηχανές αναζήτησης (μηχανές αναζήτησης) πραγματοποιούν αυτόματη αναζήτησηπληροφορίες για λέξεις-κλειδιά ή μια ομάδα λέξεων-κλειδιών που, χρησιμοποιώντας ειδικά μέσα, σχηματίζουν ορισμένες σύνθετη ερώτηση. Το αποτέλεσμα μιας τέτοιας αναζήτησης είναι μια λίστα με όλες τις σελίδες που βρίσκονται στο Διαδίκτυο και περιέχουν τις καθορισμένες λέξεις-κλειδιά σε συνδυασμό που καθορίζεται από τις συνθήκες του ερωτήματος. Στη συνέχεια, μπορείτε να προβάλετε οποιαδήποτε από τις σελίδες που βρέθηκαν σε αυτήν τη λίστα. Αυτή η ενότητα συζητά τις δυνατότητες απλή αναζήτηση: με μία ή περισσότερες λέξεις-κλειδιά χωρίς τη χρήση ειδικών εργαλείων αναζήτησης.

Οι πιο γνωστές μηχανές αναζήτησης είναι:

AltaVista – http://www.altavista.digital.com

Είμαι ndex – http://www.yandex.ru

Rambler – http://www.rambler.ru

Αναζήτηση για μία λέξη που καθορίζεται με μικρά γράμματα

Το αποτέλεσμα αναζήτησης είναι όλες οι σελίδες που βρέθηκαν και περιέχουν την καθορισμένη λέξη, γραμμένη με οποιαδήποτε γράμματα).

Εισαγάγετε στο πεδίο Διεύθυνση http://www.altavista.digital.comκαι πατήστε το πλήκτρο Εισαγω.Αφού ανοίξετε την αρχική σελίδα αυτής της μηχανής αναζήτησης, εισαγάγετε τη λέξη-κλειδί αναζήτησής σας στο πεδίο ερωτήματος αναζήτησης, π.χ. Μόσχακαι κάντε κλικ στο κουμπί έναρξης αναζήτησης. Σημειώστε τον αριθμό των σελίδων που βρέθηκαν και προβάλετε αρκετές από αυτές.

Εισαγάγετε στο πεδίο ΔιεύθυνσηΠαράθυρα Διαδικτύου Διεύθυνση Explorerσυστήματα http://www.yandex.ruκαι πατήστε το πλήκτρο Εισαγω. Αφού ανοίξετε την αρχική σελίδα αυτής της μηχανής αναζήτησης, εισαγάγετε τη λέξη-κλειδί αναζήτησης στο πεδίο ερωτήματος αναζήτησης Μόσχακαι κάντε κλικ στο κουμπί έναρξης αναζήτησης. Σημειώστε τον αριθμό των σελίδων που βρέθηκαν και προβάλετε αρκετές από αυτές. Επαναλάβετε τις ίδιες λειτουργίες για το σύστημα http://www.rambler.ru

Αναζητήστε μια λέξη που καθορίζεται με κεφαλαίο γράμμα

Το αποτέλεσμα αναζήτησης είναι όλες οι σελίδες που περιέχουν την καθορισμένη λέξη, γραμμένες με κεφαλαίο γράμμα (για ορισμένες μηχανές αναζήτησης μπορεί να υπάρχουν άλλα αποτελέσματα).

Επαναλάβετε την αναζήτηση και στα τρία συστήματα, προσδιορίζοντας τη λέξη-κλειδί αναζήτησης Μόσχα Διεύθυνση. Συγκρίνετε τα αποτελέσματα αναζήτησης με την προηγούμενη παράγραφο.

Αναζήτηση πολλών λέξεων

Αποτέλεσμα αναζήτησης – όλες οι σελίδες που βρέθηκαν και περιέχουν τουλάχιστον μία από αυτές δοσμένες λέξεις(ορισμένες μηχανές αναζήτησης μπορεί να έχουν διαφορετικά αποτελέσματα).

Πώληση αυτοκινήτων. Όταν επιλέγετε μια μηχανή αναζήτησης, χρησιμοποιήστε την αναπτυσσόμενη λίστα για το πεδίο Διεύθυνση

Αναζήτηση με πολλές λέξεις που περικλείονται σε εισαγωγικά

Το αποτέλεσμα αναζήτησης είναι όλες οι σελίδες που περιέχουν την καθορισμένη φράση ως σύνολο.

Εκτελέστε μια αναζήτηση και στα τρία συστήματα καθορίζοντας έναν συνδυασμό λέξεων αναζήτησης - Πώληση αυτοκινήτων. Όταν επιλέγετε μια μηχανή αναζήτησης, χρησιμοποιήστε την αναπτυσσόμενη λίστα για το πεδίο Διεύθυνση. Αναλύστε τα αποτελέσματα αναζήτησής σας.

Χρήση μηχανών αναζήτησης: Προηγμένες δυνατότητες

Οι μηχανές αναζήτησης διαθέτουν εργαλεία που σας επιτρέπουν να δημιουργείτε σύνθετα ερωτήματα αναζήτησης. Πλήρες σετΑυτά τα εργαλεία μπορεί να διαφέρουν σημαντικά από σύστημα σε σύστημα. Ωστόσο, υπάρχουν αρκετές λειτουργίες που μπορούν να διακριθούν για τη δημιουργία ερωτημάτων που μπορούν να χρησιμοποιηθούν στις περισσότερες μηχανές αναζήτησης. Αυτές οι λειτουργίες εφαρμόζονται σε λέξεις-κλειδιά για να οριστούν πολύπλοκα κριτήρια επιλογής για αναζητήσεις.
Λειτουργία ΚΑΙή & σημαίνει ότι και οι δύο λέξεις-κλειδιά πρέπει να υπάρχουν στις αναζητημένες σελίδες, για παράδειγμα, η έκφραση επεξεργαστής ΚΑΙ σαρωτήςαπαιτεί την εύρεση σελίδων που περιέχουν και τις δύο λέξεις: επεξεργαστή και σαρωτή.

Λειτουργία Ήή | σημαίνει ότι τουλάχιστον μία από τις λέξεις-κλειδιά πρέπει να υπάρχει στις αναζητημένες σελίδες, για παράδειγμα, η έκφραση επεξεργαστή Ή σαρωτήαπαιτεί την εύρεση σελίδων που περιέχουν είτε τον επεξεργαστή κειμένου, είτε τον σαρωτή λέξεων ή και τις δύο αυτές λέξεις.

Λειτουργία ΔΕΝ, ή!, ή ~ σημαίνει ότι οι αναζητούμενες σελίδες δεν πρέπει να περιέχουν τη λέξη-κλειδί στην οποία εφαρμόζεται. Για παράδειγμα, η έκφραση ΟΧΙ σαρωτήςαπαιτεί την εύρεση σελίδων που δεν περιέχουν τη λέξη σαρωτή.

Η ομαδοποίηση, που υποδεικνύεται με αγκύλες, σημαίνει ότι η λειτουργία δεν εφαρμόζεται σε μία λέξη, αλλά σε ολόκληρη την έκφραση σε αγκύλες. Για παράδειγμα, η έκφραση (επεξεργαστής ΚΑΙ σαρωτής) Ή (μονάδα δίσκου ΚΑΙ υποδοχή)απαιτεί την εύρεση σελίδων που περιέχουν λέξεις μαζί ΕΠΕΞΕΡΓΑΣΤΗΣΚαι ερευνητής, ή λέξεις υπάρχουν μαζί οδηγώΚαι σύνδεσμοςή και οι τέσσερις αυτές λέξεις.

Η χρήση των εξεταζόμενων λειτουργιών απαιτεί συχνά προκαταρκτική εγκατάσταση της λειτουργίας Σύνθετης αναζήτησης (ή μετάβαση στη λειτουργία Σύνθετης αναζήτησης).

2.5. Ερωτήσεις ελέγχου

1. Σε ποιες αρχές είναι τυπικές δομές πληροφοριών?

2. Τι σημαίνει ανάκτηση πληροφορίας?

3. Ορίστε τη γλώσσα ανάκτησης πληροφοριών.

4. Ονομάστε τους τύπους μεταδεδομένων που χρησιμοποιούνται στο σύστημα Dublin Core.

5. Ποιες μορφές αλληλεπίδρασης παρέχει η διεπαφή διαλόγου;

6. Περιγράψτε τις ιδιότητες ενός αυτοματοποιημένου συστήματος βιβλιοθήκης.

7. Ποιες λειτουργίες επιτελεί μια ψηφιακή βιβλιοθήκη;

Εφαρμογή

Χρησιμοποιήθηκαν υλικά από την Ακαδημία Διοίκησης της Αγίας Πετρούπολης (συγγραφέας – Tishkin A.I.).

Δομικές και μεθοδολογικές βάσεις συστημάτων ανάκτησης πληροφοριών

Στις εργασίες ανάκτησης πληροφοριών, δύο στοιχεία διακρίνονται ποιοτικά: η εννοιολογική και η τεχνολογική.

ΠΡΟΣ ΤΗΝ εννοιολογικά στοιχείαΑυτά περιλαμβάνουν, πρώτα απ 'όλα, συστήματα για την παρουσίαση της ίδιας της πληροφορίας (γνώσης), καθώς και μέσα για την παρουσίαση πληροφοριών σχετικά με τις πληροφορίες που υποβάλλονται σε επεξεργασία, που χρησιμοποιούνται ως βάση τόσο για τον μηχανισμό ανάκτησης πληροφοριών όσο και για την οργάνωση των διαδικασιών αλληλεπίδρασης των χρηστών με το AIPS. Τα τεχνολογικά στοιχεία περιλαμβάνουν εργαλεία διεπαφής χρήστη, επεξεργασία πληροφοριών, ευρετηρίαση και αλγόριθμους αναζήτησης, ενοποίηση πληροφοριών από διάφορες πηγές, γλώσσες ερωτημάτων κ.λπ.

Από την άποψη της «ευφυΐας» των εργαλείων αναζήτησης και ανάλογα με τη φύση των πληροφοριών (και τις δυνατότητες του προγραμματιστή), ένα συγκεκριμένο περισσότερο ή λιγότερο περίπλοκο AIPS μπορεί να βασίζεται σε μία από τις ακόλουθες τεχνολογίες αναζήτησης: κυριολεκτική αναζήτηση - μια αναζήτηση για μια υποσυμβολοσειρά που πραγματοποιείται χωρίς να περιλαμβάνει γνώση σχετικά με τη λεξιλογική, τη γραμματική και τη σημασιολογική δομή του επεξεργασμένου υλικού. αναζήτηση, κατά την οποία χρησιμοποιούνται λεξιλογικές και γραμματικές πληροφορίες, δηλαδή χρησιμοποιούνται γλωσσικά λεξικά και προγράμματα μορφολογικής ανάλυσης κειμένων. σημασιολογική αναζήτηση, που πραγματοποιείται με βάση τη γνώση για τις σχέσεις μεταξύ των εννοιών της θεματικής περιοχής, που εκφράζονται με λέξεις της φυσικής γλώσσας.

Στην τελευταία περίπτωση, φορείς αυτού του είδους πληροφοριών, ειδικότερα, είναι οι θησαυροί, οι οποίοι χρησιμοποιούνται για την ανάκτηση πληροφοριών για περισσότερες από τρεις δεκαετίες. Επιπλέον, αν και λιγότερο περίπλοκες, αλλά ποικίλες δομές λεξιλογίου παίζουν τεράστιο ρόλο στην οργάνωση του διαλόγου μεταξύ του χρήστη και του συστήματος ανάκτησης πληροφοριών. Με τη χρήση τους, ο χρήστης μπορεί να αναπτύξει μια αναζήτηση τροποποιώντας το ερώτημα (έκφραση των πληροφοριακών του αναγκών) σύμφωνα με τις ιδιαιτερότητες της αναπαράστασης του αντικειμένου αναζήτησης μέσω ενός συγκεκριμένου συστήματος ανάκτησης πληροφοριών και βάσης δεδομένων.

Τα IPS διαφέρουν μεταξύ τους ως προς τη λογική λειτουργίας και Τεχνικές παράμετροι. Η λογική περιλαμβάνει την κατανομή μιας μονάδας αποθήκευσης, γλώσσα ερωτήματος, παρουσίαση εγγράφων πηγής και εξόδου, καθώς και πληροφορίες διεύθυνσης. Οι παράμετροι περιλαμβάνουν ευρετηρίαση και χρόνο αναζήτησης, μέγεθος ευρετηρίου, υποστήριξη για υπάρχουσες πλατφόρμες, συμβατότητα με άλλα συστήματα.

Η ανάκτηση πληροφοριών περιλαμβάνει τη χρήση ορισμένων στρατηγικών, μεθόδων, μηχανισμών και μέσων. Ας δούμε αυτές τις έννοιες.

Στρατηγική αναζήτησης – ένα γενικό σχέδιο (έννοια, προτίμηση, ρύθμιση) του συστήματος ή της συμπεριφοράς του χρήστη για την έκφραση και την ικανοποίηση των αναγκών πληροφοριών του χρήστη, που καθορίζεται τόσο από τη φύση του στόχου και τον τύπο αναζήτησης όσο και από τις «στρατηγικές» αποφάσεις του συστήματος - αρχιτεκτονική βάσης δεδομένων, αναζήτηση μεθόδους και μέσα σε ένα συγκεκριμένο AIPS. Η επιλογή της στρατηγικής γενικά είναι πρόβλημα βελτιστοποίησης. Στην πράξη, καθορίζεται σε μεγάλο βαθμό από την τέχνη της επίτευξης συμβιβασμού μεταξύ των πρακτικών αναγκών και των δυνατοτήτων των διαθέσιμων μέσων.

Μέθοδος αναζήτησης – ένα σύνολο μοντέλων και αλγορίθμων για την υλοποίηση μεμονωμένων τεχνολογικά στάδια: δημιουργία εικόνας ερωτήματος αναζήτησης (SQI), επιλογή εγγράφου (σύγκριση εικόνων και εγγράφων ερωτήματος αναζήτησης), επέκταση και επαναδιατύπωση του ερωτήματος, εντοπισμός και αξιολόγηση των αποτελεσμάτων.

Μηχανές αναζήτησης – ένα σύνολο μοντέλων και αλγορίθμων που εφαρμόζονται στο σύστημα για τη διαδικασία δημιουργίας της έκδοσης εγγράφων ως απάντηση σε ένα ερώτημα αναζήτησης.

Εργαλεία αναζήτησης , αφενός, είναι ένα αλληλοεξαρτώμενο σύμπλεγμα γλωσσών ανάκτησης πληροφοριών (IRL) και γλωσσών ορισμού/διαχείρισης δεδομένων, που παρέχει δομικούς και σημασιολογικούς μετασχηματισμούς αντικειμένων επεξεργασίας (έγγραφα, λεξικά, σύνολα αποτελεσμάτων αναζήτησης) και από την άλλη, αντικείμενα διεπαφής χρήστη που παρέχουν ακολουθία διαχείρισης επιλογής λειτουργικών αντικειμένων ενός συγκεκριμένου AIPS.

Από την άποψη της αλληλεπίδρασης του χρήστη με το σύστημα, τα εργαλεία αναζήτησης ενσωματώνονται τεχνολογίες αναζήτησης – ενοποιημένες (βελτιστοποιημένες στο πλαίσιο ενός συγκεκριμένου AIPS) ακολουθίες χρήσης μεμονωμένων μέσων του συστήματος για τη βιώσιμη απόκτηση των τελικών και, ενδεχομένως, των ενδιάμεσων αποτελεσμάτων.

Με βάση τις τεχνολογίες αναζήτησης που χρησιμοποιούνται, οι μηχανές αναζήτησης μπορούν να χωριστούν σε 4 κατηγορίες:

1. Θεματικοί κατάλογοι.

2. Εξειδικευμένοι κατάλογοι (online κατάλογοι).

3. Μηχανές αναζήτησης(αναζήτηση πλήρους κειμένου).

4. Εργαλεία Metasearch.

Στο Διαδίκτυο, τα συστήματα ανάκτησης πληροφοριών φιλοξενούνται σε διακομιστές. Το IPS συλλέγει, ευρετηριάζει και καταχωρεί πληροφορίες σχετικά με έγγραφα που είναι διαθέσιμα στην ομάδα των διακομιστών Ιστού που εξυπηρετούνται από το σύστημα. Στα έγγραφα, όλες οι σημαντικές λέξεις ή μόνο οι λέξεις από τις επικεφαλίδες είναι ευρετηριασμένες. Το IPS μπορεί να φιλοξενηθεί σε πολλούς διακομιστές. Λοιπόν, μια δημοφιλής μηχανή αναζήτησης AltaVista χρησιμοποιεί έξι υπολογιστές για το σκοπό αυτό.

Θεματικοί κατάλογοι προβλέπουν την επεξεργασία των εγγράφων και την ανάθεσή τους σε μία από τις διάφορες κατηγορίες, ο κατάλογος των οποίων είναι προκαθορισμένος. Αυτό είναι ουσιαστικά ευρετηρίαση που βασίζεται σε ταξινόμηση. Η ευρετηρίαση μπορεί να γίνει αυτόματα ή χειροκίνητα με τη βοήθεια ειδικών που περιηγούνται σε δημοφιλείς ιστότοπους και στοιχεία Σύντομη περιγραφήσυνοπτικά έγγραφα (λέξεις-κλειδιά, περίληψη, περίληψη).

Για παράδειγμα, στο σύστημα ανάκτησης πληροφοριών Yahoo, ο κατάλογος είναι χτισμένος με βάση την ιεραρχική ταξινόμηση όψεων. Ένας ιεραρχικά οργανωμένος θεματικός κατάλογος ιστού δημιουργείται ημιαυτόματα. Οι σύνδεσμοι προς διάφορους πόρους συλλέγονται με δύο τρόπους: αποστέλλονται από χρήστες και ανακτώνται από προγράμματα ρομπότ που διαβάζουν νέους συνδέσμους από γνωστές πηγές. Τα θέματα του καταλόγου χωρίζονται σε μεγάλες τάξεις, για παράδειγμα, Υπολογιστές, Κυβέρνηση, τα οποία αναλύονται περαιτέρω σύμφωνα με μια ιεραρχική αρχή.

Εξειδικευμένοι κατάλογοι ή βιβλία αναφοράςδημιουργούνται από συγκεκριμένες βιομηχανίες και θέματα, από ειδήσεις, ανά πόλη, ανά διεύθυνση ΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗκαι ούτω καθεξής.

Μηχανές αναζήτησης (το πιο προηγμένο εργαλείο αναζήτησης) εφαρμόζουν τεχνολογία αναζήτησης πλήρους κειμένου. Τα κείμενα που βρίσκονται στους διακομιστές δημοσκόπησης ευρετηριάζονται. Το ευρετήριο μπορεί να περιέχει πληροφορίες για πολλά εκατομμύρια έγγραφα. Για παράδειγμα, το ευρετήριο του δημοφιλούς συστήματος ανάκτησης πληροφοριών AltaVista περιέχει περισσότερες από 56 εκατομμύρια διευθύνσεις URL (δεδομένα από το 1999)

Κατά τη χρήση κεφαλαίων μετααναζήτησητο αίτημα εκτελείται ταυτόχρονα από πολλές μηχανές αναζήτησης, το αποτέλεσμα αναζήτησης συνδυάζεται σε μια κοινή λίστα ταξινομημένη κατά συνάφεια. Κάθε σύστημα επεξεργάζεται μόνο ένα μέρος των κόμβων δικτύου, αυτό σας επιτρέπει να επεκτείνετε σημαντικά τη βάση αναζήτησης. Αυτή η τάξη μπορεί επίσης να περιλαμβάνει " προσωπικά προγράμματααναζήτηση", επιτρέποντάς σας να δημιουργήσετε τα δικά σας εργαλεία μετα-αναζήτησης (για παράδειγμα, αυτόματα ερωτήματα σε κόμβους που επισκέπτεστε συχνά).

Η διαδικασία αναζήτησης πληροφοριών και διαχείρισής τους στη βάση δεδομένων υλοποιείται με τη χρήση τεχνικών «πλοήγησης». Πλοήγηση – σκόπιμη, καθορισμένη από τη στρατηγική, ακολουθία χρήσης μεθόδων, εργαλείων και τεχνολογιών ενός συγκεκριμένου AIPS για την απόκτηση και την αξιολόγηση του αποτελέσματος.

Βοηθήματα πλοήγησης παρόν διεπαφή, επιτρέποντάς σας να οργανώσετε μια αρκετά αποτελεσματική διαδικασία αλληλεπίδρασης των χρηστών με τη βάση δεδομένων. Τα εργαλεία διεπαφής βοηθούν τον χρήστη να πλοηγηθεί στο σύστημα κατά την υλοποίηση της διαδικασίας αναζήτησης.

Οι βάσεις δεδομένων πληροφοριών μπορούν να περιέχουν διάφορους (σχεδόν οποιονδήποτε) τύπο πληροφοριών, συμπεριλαμβανομένου οποιουδήποτε συνδυασμού. Η αναζήτηση πληροφοριών πραγματοποιείται τόσο με όρους που υπάρχουν στο EIR πλήρους κειμένου όσο και με ειδικά στοιχεία που περιλαμβάνονται στο IPJ. Για τη δημιουργία ερωτημάτων χρησιμοποιούνται ειδικές γλώσσες ανάκτησης πληροφοριών. Ο ορισμός αυτής της έννοιας παρουσιάζεται στο θέμα 13.

Οι IRS μέσα στο δείγμα που βρέθηκε συνήθως προσπαθούν να τακτοποιήσουν τα έγγραφα με τη σειρά τους « συνάφεια”, δηλαδή εγγύτητα στο ερώτημα που έχει καταχωρήσει ο χρήστης. Υπάρχουν πολλά κριτήρια για μια τέτοια εγγύτητα και η ταυτοποίηση εγγράφων που είναι κοντά «σε νόημα» με το αίτημα δεν λύνει το πρόβλημα της απόκτησης πληροφοριών ελλείψει σχετικού εγγράφου. Αυτή η κατάσταση είναι αρκετά ασήμαντη, μεταξύ άλλων επειδή ο χρήστης συχνά αναζητά ένα έγγραφο που ο ίδιος πρόκειται να γράψει. Θα πρέπει να σημειωθεί ότι ως αποτέλεσμα της αναζήτησης, ο χρήστης μπορεί να λάβει τόσο σχετικούς, σχετικούς όσο και άσχετους και μη συναφείς υποσυστοιχίες δεδομένων.

Οι IPA είναι στην πραγματικότητα πληροφοριακά συστήματα υποστήριξηςκαι αντιπροσωπεύουν βάσεις δεδομένων και τράπεζες δεδομένων. Οπως και αντικείμενοαφορούν ένα άτομο, έναν οργανισμό, έναν κλάδο, μια περιοχή κ.λπ. Αντικείμενο πληροφοριακής υποστήριξηςείναι ειδικός στην πληροφόρηση, οποιοσδήποτε καταναλωτής πληροφοριών.

« Βάση δεδομένων” – μια ονομασμένη συλλογή αλληλένδετων δεδομένων που διαχειρίζονται συστήματα διαχείρισης βάσεων δεδομένων (DBMS).

« Βάση δεδομένων» – ένα λογικό, θεματικό ή άλλο σύνολο βάσεων δεδομένων.

« DBMS» τοποθετείται ως ένα σύνολο εργαλείων γλώσσας και λογισμικού που διασφαλίζουν την εφαρμογή διαδικασιών που σχετίζονται με την οργάνωση εισαγωγής, διόρθωσης, αποθήκευσης, διαγραφής και ανάκτησης δεδομένων, καθώς και πρόσβαση σε αυτά. Τα DBMS αποτελούν ένα σύστημα ανάκτησης πληροφοριών. Στην πραγματικότητα, τα περισσότερα τρέχοντα συστήματα ανάκτησης πληροφοριών σάς επιτρέπουν να αναζητάτε πληροφορίες με τη μορφή εγγράφων. Ένα τέτοιο IPS μπορεί να κληθεί ανάκτηση εγγράφωνή συστήματα ανάκτησης εγγράφων(DPS).

Ένα σύστημα ανάκτησης πληροφοριών είναι ένα εφαρμοσμένο περιβάλλον υπολογιστή για επεξεργασία, αποθήκευση, ταξινόμηση, φιλτράρισμα και αναζήτηση μεγάλων σειρών δομημένων πληροφοριών.

Κάθε πληροφοριακό σύστημα έχει σχεδιαστεί για να λύνει μια συγκεκριμένη κατηγορία προβλημάτων, τα οποία χαρακτηρίζονται από το δικό τους σύνολο αντικειμένων και τα χαρακτηριστικά τους. Υπάρχουν δύο τύποι IPS:

1. Τεκμηριωτική. Στα συστήματα ανάκτησης τεκμηριωτικών πληροφοριών, όλα τα αποθηκευμένα έγγραφα ευρετηριάζονται με ειδικό τρόπο, δηλαδή, σε κάθε έγγραφο εκχωρείται ένας μεμονωμένος κωδικός που συνθέτει μια εικόνα αναζήτησης. Η αναζήτηση δεν βασίζεται στα ίδια τα έγγραφα, αλλά στις εικόνες αναζήτησής τους. Έτσι αναζητούνται τα βιβλία σε μεγάλες βιβλιοθήκες. Αρχικά, αναζητούν την κάρτα στον κατάλογο και, στη συνέχεια, χρησιμοποιώντας τον αριθμό που αναγράφεται σε αυτήν, βρίσκεται το ίδιο το βιβλίο.

2. Πραγματικό. Τα πραγματικά πληροφοριακά συστήματα δεν αποθηκεύουν έγγραφα, αλλά γεγονότα που σχετίζονται με οποιοδήποτε θέμα. Η αναζήτηση πραγματοποιείται με τη χρήση δειγματοληπτικού γεγονότος.

Κάθε πληροφοριακό σύστημα αποτελείται από δύο μέρη: μια βάση δεδομένων (DB) και ένα σύστημα διαχείρισης βάσεων δεδομένων (DBMS).

Μια βάση δεδομένων είναι μια ονομασμένη συλλογή δομημένων δεδομένων που σχετίζονται με μια συγκεκριμένη θεματική περιοχή.

Ένα σύστημα διαχείρισης βάσεων δεδομένων είναι ένα σύμπλεγμα λογισμικού και γλωσσικά μέσααπαραίτητη για τη δημιουργία βάσεων δεδομένων και τη διατήρησή τους σε τωρινή κατάστασηκαι οργάνωση αναζητήσεων σε αυτά απαραίτητες πληροφορίες.

Επί επί του παρόντοςΥπάρχουν πολλά διαφορετικά DBMS. Τα πιο γνωστά είναι τα Dbase, Clipper, FoxPro, Paradox, Microsoft Access.

Τα PS με ένα ευρύ φάσμα λειτουργιών και δυνατοτήτων περιλαμβάνονται συνήθως στο DBMS και ονομάζονται συστήματα ανάκτησης πληροφοριών. Δημιουργούνται επίσης και χρησιμοποιούνται για να βοηθήσουν τους χρήστες να βρίσκουν αποτελεσματικά τα δεδομένα που χρειάζονται, συμπεριλαμβανομένου του Διαδικτύου.

Ορολογικά, "σύστημα ανάκτησης πληροφοριών" (Αγγλικά: "σύστημα ανάκτησης πληροφοριών", IRS) - αντιπροσωπεύει ένα σύστημα που έχει σχεδιαστεί για την αναζήτηση και αποθήκευση πληροφοριών. ένα πακέτο λογισμικού που υλοποιεί τις διαδικασίες δημιουργίας, ενημέρωσης, αποθήκευσης και αναζήτησης σε βάσεις δεδομένων πληροφοριών και τράπεζες δεδομένων.

Ένα σύστημα ανάκτησης πληροφοριών ερμηνεύεται επίσης ως ένα σύστημα που παρέχει αναζήτηση και επιλογή των απαραίτητων δεδομένων με βάση μια γλώσσα ανάκτησης πληροφοριών και τους αντίστοιχους κανόνες αναζήτησης και μια βάση δεδομένων ερμηνεύεται ως ένα σύνολο εργαλείων και μεθόδων για την περιγραφή, την αποθήκευση και τον χειρισμό δεδομένων που διευκολύνουν η συλλογή, συσσώρευση και επεξεργασία μεγάλων συστοιχιών πληροφοριών. Η οργάνωση διαφορετικών βάσεων δεδομένων διαφέρει ως προς τον τύπο των αντικειμένων δεδομένων και τις μεταξύ τους σχέσεις.



Η λειτουργία των σύγχρονων πληροφοριακών συστημάτων βασίζεται σε δύο παραδοχές:

1) τα έγγραφα που απαιτούνται από τον χρήστη ενώνονται με την παρουσία ενός συγκεκριμένου χαρακτηριστικού ή συνδυασμού χαρακτηριστικών.

2) ο χρήστης μπορεί να καθορίσει αυτό το χαρακτηριστικό.

Τα IPS χωρίζονται σε: παραδοσιακά (χειροκίνητα, μηχανικά, ηλεκτρομηχανικά) και αυτοματοποιημένα (ηλεκτρονικά).

Τα αυτοματοποιημένα συστήματα πληροφοριών (AIPS) χρησιμοποιούν εργαλεία και τεχνολογίες λογισμικού και υλικού υπολογιστών και προορίζονται να βρίσκουν και να παρέχουν στους χρήστες πληροφορίες με βάση καθορισμένα κριτήρια. Οι ακόλουθοι δύο παράγοντες είναι καθοριστικοί για την κατανόηση των μεθόδων αυτοματοποίησης αναζήτησης:

1) δεν συγκρίνονται τα ίδια τα αντικείμενα, αλλά οι περιγραφές - οι λεγόμενες "εικόνες αναζήτησης".

2) η ίδια η διαδικασία είναι πολύπλοκη (σύνθετη και όχι ενός σταδίου) και συνήθως υλοποιείται από μια ακολουθία πράξεων.

Η ανάκτηση πληροφοριών περιλαμβάνει τη χρήση ορισμένων στρατηγικών, μεθόδων, μηχανισμών και μέσων. Η συμπεριφορά του χρήστη που διαχειρίζεται τη διαδικασία αναζήτησης καθορίζεται όχι μόνο από την ανάγκη πληροφοριών, αλλά και από την εργαλειακή ποικιλομορφία του συστήματος - τις τεχνολογίες και τα εργαλεία που παρέχει το σύστημα.



Η εφαρμοσμένη μέθοδος για την κατασκευή ενός POS πρέπει να παρέχει αποτελεσματικούς τρόπους για την κατασκευή ενός ερωτήματος για την επίτευξη στόχων διαφόρων τύπων.

Οι μηχανισμοί αναζήτησης είναι ένα σύνολο μοντέλων και αλγορίθμων που εφαρμόζονται στο σύστημα για τη διαδικασία δημιουργίας εξόδου εγγράφου ως απάντηση σε ένα ερώτημα αναζήτησης.

Τα εργαλεία αναζήτησης, αφενός, είναι ένα αλληλεξαρτώμενο σύμπλεγμα γλωσσών ανάκτησης πληροφοριών (IRL) και γλωσσών ορισμού/διαχείρισης δεδομένων, που παρέχουν δομικούς και σημασιολογικούς μετασχηματισμούς των αντικειμένων επεξεργασίας (έγγραφα, λεξικά, σύνολα αποτελεσμάτων αναζήτησης) και από την άλλη πλευρά, αντικείμενα διεπαφής χρήστη που παρέχουν έλεγχο της σειράς επιλογής των επιχειρησιακών αντικειμένων ενός συγκεκριμένου AIPS.

Οι τεχνολογίες αναζήτησης είναι ενοποιημένες (βελτιστοποιημένες στο πλαίσιο ενός συγκεκριμένου AIPS) αλληλουχίες για την αποτελεσματική χρήση μεμονωμένων εργαλείων αναζήτησης στη διαδικασία αλληλεπίδρασης του χρήστη με το σύστημα για τη σταθερή λήψη τελικών και ενδιάμεσων αποτελεσμάτων.

Η πλοήγηση ως η υλοποίηση μιας διαδικασίας αναζήτησης ερωτημάτων σε μια επιλεγμένη βάση δεδομένων είναι μια στοχευμένη, καθορισμένη από στρατηγική ακολουθία χρήσης μεθόδων, εργαλείων και τεχνολογιών ενός συγκεκριμένου AIPS για την απόκτηση και την αξιολόγηση του αποτελέσματος.

Τα εργαλεία πλοήγησης επιτρέπουν στον χρήστη να ελέγχει τη διαδικασία αναζήτησης. Παρουσιάζονται στον χρήστη με τη μορφή διεπαφής που σας επιτρέπει να οργανώσετε μια περισσότερο ή λιγότερο αποτελεσματική διαδικασία αλληλεπίδρασης με τη βάση δεδομένων. Ταυτόχρονα, η «φιλικότητα» της διεπαφής χαρακτηρίζεται όχι μόνο από την εργονομία και τη σαφήνεια, αλλά και από την ποικιλία της επιλογής των λειτουργικών αντικειμένων.

Η διαδικασία αναζήτησης πληροφοριών αντιπροσωπεύει μια σειρά βημάτων που, μέσω του συστήματος, οδηγούν σε ένα συγκεκριμένο αποτέλεσμα και επιτρέπουν σε κάποιον να αξιολογήσει την πληρότητά του. Δεδομένου ότι ο χρήστης συνήθως δεν έχει ολοκληρωμένη γνώση σχετικά με το περιεχόμενο πληροφοριών του πόρου στον οποίο αναζητά, μπορεί να αξιολογήσει την επάρκεια της έκφρασης ερωτήματος, καθώς και την πληρότητα του αποτελέσματος που προκύπτει, με βάση μόνο εξωτερικές αξιολογήσεις ή ενδιάμεσες αποτελέσματα και γενικεύσεις, συγκρίνοντάς τα, για παράδειγμα, με τα προηγούμενα.

Η διαδικασία αναζήτησης μπορεί να αναπαρασταθεί ως τα ακόλουθα κύρια στοιχεία:

1) διατύπωση αιτήματος σε φυσική γλώσσα, επιλογή μηχανών αναζήτησης και υπηρεσιών, επισημοποίηση του αιτήματος στην κατάλληλη FL.

2) διεξαγωγή αναζήτησης σε μία ή περισσότερες μηχανές αναζήτησης.

3) ανασκόπηση των αποτελεσμάτων που αποκτήθηκαν (σύνδεσμοι).

4) προκαταρκτική επεξεργασία των ληφθέντων αποτελεσμάτων: προβολή του περιεχομένου των συνδέσμων, εξαγωγή και αποθήκευση σχετικών και σχετικών δεδομένων.

5) εάν είναι απαραίτητο, τροποποιήστε το αίτημα και πραγματοποιήστε επαναλαμβανόμενη (βελτιστοποιημένη) αναζήτηση με επακόλουθη επεξεργασία των αποτελεσμάτων που προέκυψαν.

Για να μειωθεί ο όγκος του επιλεγμένου υλικού, τα αποτελέσματα αναζήτησης φιλτράρονται κατά τύπο πηγών (ιστοτόπους, πύλες), θέματα και άλλους λόγους.

Με βάση τις τεχνολογίες αναζήτησης που χρησιμοποιούνται, η IP μπορεί να χωριστεί σε 4 κατηγορίες:

1. Θεματικοί κατάλογοι.

2. Εξειδικευμένοι κατάλογοι (online κατάλογοι).

3. Μηχανές αναζήτησης (αναζήτηση πλήρους κειμένου).

4. Εργαλεία Metasearch.

Στο Διαδίκτυο, το σύστημα ανάκτησης πληροφοριών φιλοξενείται σε έναν ή περισσότερους διακομιστές. Το IPS συλλέγει, ευρετηριάζει και καταχωρεί πληροφορίες σχετικά με έγγραφα που είναι διαθέσιμα στην ομάδα των διακομιστών Ιστού που εξυπηρετούνται από το σύστημα. Στα έγγραφα, όλες οι σημαντικές λέξεις ή μόνο οι λέξεις από τις επικεφαλίδες είναι ευρετηριασμένες.

Οι θεματικοί κατάλογοι περιλαμβάνουν την επεξεργασία εγγράφων και την ανάθεσή τους σε μία από τις διάφορες κατηγορίες, η λίστα των οποίων είναι προκαθορισμένη. Αυτό είναι ουσιαστικά ευρετηρίαση που βασίζεται σε ταξινόμηση. Η ευρετηρίαση μπορεί να πραγματοποιηθεί αυτόματα ή χειροκίνητα με τη βοήθεια ειδικών που περιηγούνται σε δημοφιλείς ιστότοπους και συντάσσουν μια σύντομη περιγραφή των συνοπτικών εγγράφων (λέξεις-κλειδιά, περίληψη, περίληψη).

Οι εξειδικευμένοι κατάλογοι ή κατάλογοι δημιουργούνται από συγκεκριμένους κλάδους και θέματα, ανά νέα, ανά πόλη, διεύθυνση email κ.λπ.

Οι μηχανές αναζήτησης (το πιο προηγμένο εργαλείο αναζήτησης στο Διαδίκτυο) εφαρμόζουν τεχνολογία αναζήτησης πλήρους κειμένου. Τα κείμενα που βρίσκονται στους διακομιστές δημοσκόπησης ευρετηριάζονται. Το ευρετήριο μπορεί να περιέχει πληροφορίες για πολλά εκατομμύρια έγγραφα. Για παράδειγμα, το δημοφιλές IRS "AltaVista" έχει περισσότερες από 56 εκατομμύρια διευθύνσεις URL στο ευρετήριό του.

Όταν χρησιμοποιείτε εργαλεία μετα-αναζήτησης, ένα ερώτημα πραγματοποιείται ταυτόχρονα από πολλές μηχανές αναζήτησης. Το αποτέλεσμα αναζήτησης συνδυάζεται σε μια κοινή λίστα ταξινομημένη κατά συνάφεια. Κάθε σύστημα επεξεργάζεται μόνο ένα μέρος των κόμβων δικτύου, γεγονός που σας επιτρέπει να επεκτείνετε τη βάση αναζήτησης. Αυτή η κλάση περιλαμβάνει «προγράμματα προσωπικής αναζήτησης» που σας επιτρέπουν να δημιουργήσετε τα δικά σας εργαλεία μετα-αναζήτησης (για παράδειγμα, να υποβάλετε αυτόματα ερωτήματα σε κόμβους που επισκέπτεστε συχνά).

Οι βάσεις δεδομένων πληροφοριών μπορούν να περιέχουν σχεδόν κάθε τύπο πληροφοριών, συμπεριλαμβανομένου οποιουδήποτε συνδυασμού. Η αναζήτηση πληροφοριών πραγματοποιείται τόσο με όρους που υπάρχουν στο EIR πλήρους κειμένου όσο και με ειδικά στοιχεία που περιλαμβάνονται στο IPJ. Για τη δημιουργία ερωτημάτων χρησιμοποιούνται ειδικές γλώσσες ανάκτησης πληροφοριών.

Οι IRS εντός του δείγματος που βρέθηκε συνήθως προσπαθούν να τακτοποιήσουν τα έγγραφα με βάση τη «συνάφειά τους», δηλαδή την εγγύτητα στο ερώτημα που έχει καταχωρίσει ο χρήστης. Υπάρχουν πολλά κριτήρια για μια τέτοια εγγύτητα και η ταυτοποίηση εγγράφων που είναι κοντά «σε νόημα» με το αίτημα δεν λύνει το πρόβλημα της απόκτησης πληροφοριών ελλείψει σχετικού εγγράφου. Αυτή η κατάσταση είναι αρκετά ασήμαντη, μεταξύ άλλων επειδή ο χρήστης συχνά αναζητά ένα έγγραφο που ο ίδιος πρόκειται να γράψει. Θα πρέπει να σημειωθεί ότι ως αποτέλεσμα της αναζήτησης, ο χρήστης μπορεί να λάβει τόσο σχετικούς, σχετικούς όσο και άσχετους και μη συναφείς υποσυστοιχίες δεδομένων.

Το IRS είναι στην πραγματικότητα συστήματα υποστήριξης πληροφοριών και αντιπροσωπεύουν βάσεις δεδομένων και τράπεζες δεδομένων. Το αντικείμενο σε αυτά είναι ένα άτομο, οργανισμός, βιομηχανία, περιοχή κ.λπ. Το αντικείμενο της πληροφοριακής υποστήριξης είναι ένας ειδικός πληροφοριών, οποιοσδήποτε καταναλωτής πληροφοριών.

Οργάνωση αναζήτησης

Προτείνεται η διαδικασία αναζήτησης των απαραίτητων πληροφοριών να χωριστεί σε εννέα κύρια στάδια:

Ορισμός της περιοχής γνώσης.

Επιλογή του τύπου και των πηγών δεδομένων.

Συλλογή υλικού που είναι απαραίτητο για τη συμπλήρωση του μοντέλου πληροφοριών.

Επιλογή των πιο χρήσιμων πληροφοριών.

Επιλογή μεθόδου επεξεργασίας πληροφοριών (ταξινόμηση, ομαδοποίηση, ανάλυση παλινδρόμησης, κ.λπ.).

Επιλογή αλγορίθμου αναζήτησης μοτίβων.

Αναζήτηση για μοτίβα, επίσημους κανόνες και δομικές συνδέσεις στις πληροφορίες που συλλέγονται.

Δημιουργική ερμηνεία των αποτελεσμάτων που προέκυψαν.

Ενσωμάτωση εξαγόμενης «γνώσης».

Για τη διεξαγωγή μιας αναζήτησης, η διεπαφή για την εργασία με την αντίστοιχη βάση δεδομένων φορτώνεται αρχικά στον υπολογιστή του χρήστη. Αυτή μπορεί να είναι μια τοπική ή απομακρυσμένη βάση δεδομένων. Αρχικά, θα πρέπει να αποφασίσετε για τον τύπο αναζήτησης (απλή, προηγμένη κ.λπ.). Στη συνέχεια, με ένα σύνολο πεδίων που προτείνονται για αναζήτηση. Η IRS μπορεί να προσφέρει ένα ή περισσότερα πεδία για είσοδο. Στην τελευταία περίπτωση, αυτά είναι συνήθως τα ακόλουθα πεδία: συγγραφέας, τίτλος (όνομα), χρονική περίοδος, τύπος εγγράφου, λέξεις-κλειδιά, επικεφαλίδες κ.λπ. Κατά τη διαμόρφωση ενός αιτήματος, σχεδόν όλα τα συστήματα επιτρέπουν τη χρήση λογικών στοιχείων "AND". "Ή ΟΧΙ".

Τεχνολογίες ανάκτησης πληροφοριών

Τα εργαλεία αναζήτησης και οι τεχνολογίες που χρησιμοποιούνται για την κάλυψη των αναγκών πληροφοριών καθορίζονται από τον τύπο και την κατάσταση του κύριου προβλήματος δραστηριότητας του χρήστη: την αναλογία της γνώσης και της άγνοιάς του για το αντικείμενο που μελετάται. Επιπλέον, η διαδικασία αλληλεπίδρασης του χρήστη με το σύστημα καθορίζεται από το επίπεδο γνώσης του χρήστη για το περιεχόμενο του πόρου (πληρότητα παρουσίασης, αξιοπιστία της πηγής κ.λπ.) και τη λειτουργικότητα του συστήματος ως εργαλείου. Γενικά, αυτοί οι παράγοντες συνήθως καταλήγουν στην έννοια του «επαγγελματισμού» - ενημερωτικός (εκπαιδευμένος/μη εκπαιδευμένος χρήστης) και υποκειμενικός (επαγγελματίας/μη επαγγελματίας).

Η διαδικασία αναζήτησης πληροφοριών είναι συνήθως εμπειρικού χαρακτήρα. Αντιπροσωπεύει μια ακολουθία βημάτων που οδηγούν μέσω του συστήματος σε ένα συγκεκριμένο αποτέλεσμα, επιτρέποντας σε κάποιον να αξιολογήσει την πληρότητά του. Ταυτόχρονα, η συμπεριφορά των χρηστών, ως οργανωτική αρχή της διαχείρισης της διαδικασίας αναζήτησης, υποκινείται όχι μόνο από την ανάγκη πληροφοριών, αλλά και από την ποικιλία των στρατηγικών, τεχνολογιών και εργαλείων που παρέχει το σύστημα.

Συνήθως, ο χρήστης δεν έχει ολοκληρωμένη γνώση σχετικά με το περιεχόμενο πληροφοριών του πόρου στον οποίο αναζητά, επομένως μπορεί να αξιολογήσει την επάρκεια της έκφρασης του ερωτήματος, καθώς και την πληρότητα του αποτελέσματος που προέκυψε, βρίσκοντας πρόσθετες πληροφορίες ή με οργάνωση της διαδικασίας έτσι ώστε μέρος των αποτελεσμάτων αναζήτησης να μπορεί να χρησιμοποιηθεί για την επιβεβαίωση ή την απόρριψη της επάρκειας του άλλου μέρους.

Τα λειτουργικά αντικείμενα που εμπλέκονται άμεσα στην αλληλεπίδραση των χρηστών με το σύστημα αναζήτησης είναι η εικόνα αναζήτησης του εγγράφου (SID) και το SID, η αντιστοιχία των οποίων καθορίζεται μηχανή αναζήτησης AIPS σε επίσημο επίπεδο. Η καταλληλότητα της εικόνας στο πραγματικό περιεχόμενο του εγγράφου καθορίζεται από την ποιότητα της διαδικασίας συνέλιξης πληροφοριών και το επίπεδο γνώσης του υποκειμένου για τα μέσα προβληματισμού - το εννοιολογικό σχήμα της θεματικής περιοχής και τις δυνατότητες της γλώσσας προγραμματισμού.

Μια εικόνα αναζήτησης ενός εγγράφου είναι μια περιγραφή ενός εγγράφου, που εκφράζεται σε FL και χαρακτηρίζει το κύριο σημασιολογικό περιεχόμενο ή οποιαδήποτε άλλα χαρακτηριστικά αυτού του εγγράφου είναι απαραίτητα για την αναζήτησή του κατόπιν αιτήματος.

Τα περισσότερα PS αρχικά προσφέρουν στους χρήστες είτε BO είτε συνδέσμους για πλήρη ή μερικά έγγραφα, τις περιγραφές τους κ.λπ., αποθηκευμένα σε διάφορα AIPS. Το σύγχρονο λογισμικό σάς επιτρέπει να αποφασίσετε και να υποδείξετε τι και με ποια μορφή ενδιαφέρει τον χρήστη η πηγή πληροφοριών.

Μέθοδοι για την επεξεργασία των αποτελεσμάτων αναζήτησης

Με βάση τη φύση των μετασχηματισμών (στο πλαίσιο της περαιτέρω χρήσης των αποτελεσμάτων επεξεργασίας), οι μέθοδοι για την επεξεργασία των αποτελεσμάτων αναζήτησης μπορούν να χωριστούν σε δύο ομάδες:

1. Μετασχηματισμοί δομής και μορφής.

2. Δομικοί-σημασιολογικοί μετασχηματισμοί (πληροφοριακοί-αναλυτικοί, λογικο-σημασιολογικοί).

Υλοποίηση αναζήτησης

Τι αναζητείται συνήθως στο Διαδίκτυο: προσωπικές πληροφορίες για άτομα και οργανισμούς. διάφορα δεδομένα διεύθυνσης. συγκεκριμένο υλικό (άρθρα, βιβλία, φωτογραφίες, στοιχεία αναφοράς, λογισμικόκ.λπ.) συμπεριλαμβανομένου του τόπου αποθήκευσης τους· πού και πόσο κοστίζουν ορισμένα υλικά, υπηρεσίες, προϊόντα κ.λπ. ιστοσελίδες πληροφοριών και πύλες, κ.λπ.

Είναι γενικά αποδεκτό να οργανώσετε μια αναζήτηση με βάση τα αρχικά τμήματα μιας λέξης (αναζήτηση με περικοπή στα δεξιά), για παράδειγμα, αντί για τη λέξη "βιβλιοθήκη" μπορείτε να εισαγάγετε το τμήμα της "βιβλιοθήκη*". Σε αυτήν την περίπτωση, θα βρεθούν έγγραφα που περιέχουν όχι μόνο τη λέξη «βιβλιοθήκη», αλλά και «βιβλιοθήκη», «βιβλιοθηκάριος», «επιστήμη της βιβλιοθήκης» κ.λπ. Σε κάθε περίπτωση, ο χρήστης πρέπει να φανταστεί τι ακριβώς θέλει να βρει, αφού σε ό,τι του προσφέρεται επιλογή θα βρεθεί πολύ μεγάλη ποσότηταεγγράφων από ό,τι όταν ανατίθεται αυτής της λέξηςεντελώς (χωρίς περικοπή). Σε μια τέτοια περίπτωση, είναι δυνατό να διεξαχθεί μια διευκρινιστική αναζήτηση στη λαμβανόμενη σειρά πληροφοριών και, ως αποτέλεσμα, να ληφθούν πιο σχετικά και σχετικά δεδομένα.

Καταχώρηση αποτελεσμάτων

Από την άποψη του συστήματος ανάκτησης πληροφοριών, το αποτέλεσμα αναζήτησης σε αυτό είναι ένα σύνολο (υποσύνολο) από έγγραφα που βρέθηκαν ή συνδέσμους προς αυτά. Συνήθως παρουσιάζεται στον χρήστη με τη μορφή λίστας. Δηλαδή, η απλούστερη φόρμα εξόδου σε σε αυτήν την περίπτωσηθα υπάρχει μια λίστα με συνδέσμους με τη μορφή ολικών ή μερικών BO που θα βρεθούν από το IR. Μια τέτοια λίστα μπορεί να εκτυπωθεί αμέσως ή να αποσταλεί σε οποιαδήποτε διεύθυνση ηλεκτρονικού ταχυδρομείου, εάν παρέχεται τέτοια ευκαιρία από το IPS και ο χρήστης είναι συνδεδεμένος στο Διαδίκτυο.

Το EIR γραφικών και πλήρους κειμένου μπορεί να προσφερθεί στον χρήστη μόνο για προβολή, για αντιγραφή σε διάφορες μορφές και κλίμακες, εν όλω ή εν μέρει. Τα γραφικά IR συνήθως υπάρχουν σε γενικά αποδεκτές μορφές όπως: JPG, GIFF, TIFF, BMP κ.λπ., και για υλικό κειμένου συνήθως χρησιμοποιούν κείμενο Μορφές TXT, DOC, κ.λπ., HTML και PDF είναι στην πραγματικότητα μια μορφή γραφικών στην οποία μπορούν να αποθηκευτούν τόσο κείμενο όσο και δεδομένα γραφικών.

Τα έγγραφα που αποκτήθηκαν ως αποτέλεσμα της αναζήτησης αποθηκεύονται.

Κριτήρια Αξιολόγησης Αναζήτησης

Το κριτήριο για το αποτέλεσμα αναζήτησης είναι ότι ο χρήστης λαμβάνει μια λίστα εγγράφων, ένα έγγραφο ή μέρη αυτού που ανταποκρίνονται καλύτερα στις ανάγκες του ερώτημα αναζήτησης. Στο IRS, συνηθίζεται να σχηματίζεται ένας κατάλογος εγγράφων που λαμβάνονται ως αποτέλεσμα αναζήτησης ανάλογα με τη συνάφειά τους. Υπάρχουν κριτήρια σημασιολογικής και τυπικής αντιστοιχίας μεταξύ της εντολής αναζήτησης και του εκδοθέντος εγγράφου.

Η πληρότητα και η ακρίβεια αναζήτησης είναι αλληλένδετοι δείκτες. Η αύξηση του ενός από αυτά οδηγεί σε μείωση του άλλου. Στη σύγχρονη IRS, με μια ισορροπημένη αναζήτηση, η αξία τους είναι περίπου 70%. Θα πρέπει να λάβετε υπόψη την κατάσταση στην οποία η λίστα των συνδέσμων που παρέχει η μηχανή αναζήτησης περιέχει πολλές, και μερικές φορές δεκάδες διαφορετικές διευθύνσεις με το ίδιο κείμενο. Τέτοιοι σύνδεσμοι χαρακτηρίζονται ως διπλοί. Από αυτά, μόνο ένα παραστατικό λαμβάνεται υπόψη κατά τον υπολογισμό των συντελεστών.

Αξιολόγηση και επεξεργασία των αποτελεσμάτων αναζήτησης

Λαμβάνοντας υπόψη ότι το ιδανικό αποτέλεσμα αναζήτησης πρέπει να ικανοποιεί τις απαιτήσεις της μοναδικότητας, της πληρότητας και της συνέπειας, διαπιστώνουμε ότι διαφορετικοί τύποι αναζήτησης καθορίζουν διαφορετικές απαιτήσεις για λειτουργικότητασυστήματα για την αξιολόγηση των αποτελεσμάτων. Ωστόσο, για την περίπτωση μιας αναζήτησης θέματος, η απόδειξη πληρότητας είναι ασήμαντη: ένα μη κενό αποτέλεσμα αναζήτησης επιβεβαιώνει την ύπαρξη (ή την απουσία) ενός αντικειμένου που έχει τις επιθυμητές ιδιότητες. Ταυτόχρονα, το αποτέλεσμα μιας θεματικής αναζήτησης είναι πολλαπλό και απαιτεί επακόλουθη συστηματοποίηση - ένα άλλο διαδικαστικό βήμα για την παραγγελία του προκύπτοντος συνόλου αντικειμένων σύμφωνα με τις τιμές μιας βάσης που δεν ορίζεται ρητά. Με τη σειρά της, η προβληματική αναζήτηση προϋποθέτει συστηματοποίηση δύο επιπέδων.

Η ανάπτυξη της διαδικασίας αναζήτησης πραγματοποιείται τροποποιώντας την έκφραση POS, επαναδιατυπώνοντας το ερώτημα και πραγματοποιώντας επαναλαμβανόμενη αναζήτηση στον ίδιο πίνακα δεδομένων ή σε έναν υποσυστοιχία που ελήφθη ως αποτέλεσμα της αρχικής αναζήτησης.

Τα εργαλεία διεπαφής για την επεξεργασία του αποτελέσματος και την ανάπτυξη της αναζήτησης χρησιμοποιούν δύο τύπους λειτουργικών αντικειμένων - μεμονωμένα έγγραφαή συλλογές εγγράφων.

Μηχανές αναζήτησης στο Διαδίκτυο

Για τη λήψη πληροφοριών στο Διαδίκτυο, δημιουργούνται ειδικές μηχανές αναζήτησης. Κατά κανόνα, είναι δημόσια προσβάσιμα και εξυπηρετούν τους χρήστες οπουδήποτε στον κόσμο όπου είναι διαθέσιμο το Διαδίκτυο. Οι μηχανές αναζήτησης χρησιμοποιούνται απευθείας για την αναζήτηση, ο αριθμός των οποίων ανέρχεται σε αρκετές εκατοντάδες στον κόσμο. Επικεντρώνονται σε ορισμένοι τύποιερωτήματα ή ο συνδυασμός τους (βιβλιογραφικά, διευθύνσεις, πραγματολογικά, θεματικά κ.λπ.). Επιπλέον, υπάρχουν μηχανές αναζήτησης πλήρους κειμένου, μικτές και άλλες.

Για να πραγματοποιήσετε μια αναζήτηση στο Διαδίκτυο (WWW), υπάρχουν πολλοί ιστότοποι και μηχανές αναζήτησης, επομένως είναι απαραίτητο όχι μόνο να πλοηγηθείτε σε τέτοια συστήματα, αλλά και να μπορέσετε να πραγματοποιήσετε μια αποτελεσματική αναζήτηση σε αυτά, δηλαδή να χρησιμοποιήσετε το κατάλληλες τεχνολογίες.

"Τεχνολογία αναζήτησης" σημαίνει ένα σύνολο κανόνων και διαδικασιών, ως αποτέλεσμα των οποίων ο χρήστης λαμβάνει IR Κατά την αναζήτηση στο Διαδίκτυο, συνιστάται να δίνει προσοχή σε δύο στοιχεία: την πληρότητα (τίποτα δεν χάνεται) και την ακρίβεια (τίποτα περιττό. βρέθηκε) Συνήθως, η συμμόρφωση των υλικών που βρέθηκαν με αυτά τα κριτήρια ονομάζεται σχετικότητα, δηλαδή αντιστοιχία της απάντησης στην ερώτηση (ερώτημα).

Οι μηχανές αναζήτησης χαρακτηρίζονται επίσης από τη διάρκεια της αναζήτησης, τη διεπαφή που παρέχεται στον χρήστη και τον τύπο των αποτελεσμάτων που εμφανίζονται. Όταν επιλέγετε μηχανές αναζήτησης, δώστε προσοχή σε παραμέτρους όπως η κάλυψη και το βάθος. Η κάλυψη αναφέρεται στον όγκο της βάσης δεδομένων της μηχανής αναζήτησης, που μετράται με τρεις δείκτες: συνολικός όγκοςευρετηριασμένες πληροφορίες, τον αριθμό των μοναδικών διακομιστών και τον αριθμό των μοναδικών εγγράφων. Με τον όρο βάθος εννοούμε αν υπάρχει όριο στον αριθμό των σελίδων ή στο βάθος της ένθεσης των καταλόγων σε έναν διακομιστή.

Κάθε μηχανή αναζήτησης έχει τους δικούς της αλγόριθμους για την ταξινόμηση των αποτελεσμάτων αναζήτησης. Όσο πιο κοντά στην κορυφή της λίστας που λαμβάνεται ως αποτέλεσμα αναζήτησης βρίσκεται το επιθυμητό έγγραφο, τόσο μεγαλύτερη είναι η συνάφεια και τόσο καλύτερα λειτουργεί η μηχανή αναζήτησης.

Οι μηχανές αναζήτησης χρησιμοποιούν γενικές αρχές λειτουργίας που επικεντρώνονται στην εκτέλεση δύο βασικών λειτουργιών. Η πρώτη λειτουργία υλοποιείται από ένα πρόγραμμα ρομπότ που σαρώνει αυτόματα διάφορους διακομιστές στο Διαδίκτυο. Όταν βρίσκει νέα ή αλλαγμένα έγγραφα, τα ευρετηριάζει και τα μεταφέρει στον κεντρικό υπολογιστή της μηχανής αναζήτησης. Το "bot" είναι ένα αυτοματοποιημένο πρόγραμμα περιήγησης που φορτώνει μια ιστοσελίδα, την εξετάζει και, εάν χρειάζεται, πλοηγείται σε έναν από τους υπερσυνδέσμους της. Όταν συναντήσει μια σελίδα που δεν περιέχει συνδέσεις, το ρομπότ επιστρέφει ένα ή δύο βήματα πίσω και πηγαίνει στη διεύθυνση που υποδεικνύεται σε μία από τις συνδέσεις που ανακαλύφθηκαν προηγουμένως. Ένα εκτοξευμένο ρομπότ διανύει τεράστιες αποστάσεις στο Διαδίκτυο (κυβερνοχώρος), εστιάζοντας στην ανάπτυξη του δικτύου Ιστού και αλλάζοντας τις διαδρομές του σύμφωνα με αυτό. Τα ρομπότ ευρετηρίασης επεξεργάζονται μόνο αρχεία HTML, αγνοώντας εικόνες και άλλα αρχεία πολυμέσων. Μπορούν: να εντοπίσουν συνδέσμους σε σελίδες που δεν υπάρχουν πλέον. δημιουργήστε μια σύνδεση με τους πιο δημοφιλείς ιστότοπους μετρώντας τον αριθμό των συνδέσμων προς αυτούς σε άλλες ιστοσελίδες. καταχωρήστε ιστοσελίδες για να αξιολογήσετε την ανάπτυξη του συστήματος, κ.λπ. Τις περισσότερες φορές, τα ρομπότ σαρώνουν τους διακομιστές μόνα τους, βρίσκοντας νέους εξωτερικοί σύνδεσμοισε έγγραφα που έχουν ήδη εξεταστεί. Η δεύτερη λειτουργία είναι η επεξεργασία των ταυτοποιημένων εγγράφων. Σε αυτή την περίπτωση, λαμβάνεται υπόψη ολόκληρο το περιεχόμενο των σελίδων (όχι μόνο το πλήρες κείμενο, αλλά και η παρουσία εικονογραφήσεων, αρχείων ήχου και βίντεο, εφαρμογών Java). Όλες οι λέξεις σε ένα έγγραφο είναι ευρετηριασμένες, γεγονός που καθιστά δυνατή τη χρήση μηχανών αναζήτησης για λεπτομερείς αναζητήσεις στα πιο στενά θέματα. Σχηματίστηκε γίγαντας αρχεία ευρετηρίου, αποθηκεύοντας πληροφορίες σχετικά με το ποια λέξη χρησιμοποιείται, πόσες φορές, σε ποιο έγγραφο και σε ποιο διακομιστή, σχηματίζουν μια βάση δεδομένων, στην οποία οι χρήστες έχουν πραγματικά πρόσβαση εισάγοντας μπαρα αναζήτησης POS (συνδυασμοί λέξεων-κλειδιών). Τα αποτελέσματα παραδίδονται χρησιμοποιώντας ένα ειδικό υποσύστημα που εκτελεί έξυπνη κατάταξη των αποτελεσμάτων. Στους υπολογισμούς της βασίζεται στη θέση του όρου, τη συχνότητα επανάληψης του στο κείμενο, το ποσοστό αυτός ο όροςμε το υπόλοιπο κείμενο αυτής της σελίδας και άλλες παραμέτρους που χαρακτηρίζουν τις δυνατότητες μιας συγκεκριμένης μηχανής αναζήτησης.

Τα "ρομπότ" έχουν μια σειρά από ποικιλίες, μία από τις οποίες είναι η "αράχνη". Συνεχώς «ανιχνεύεται στον ιστό», μετακινούμενος από τη μια ιστοσελίδα στην άλλη προκειμένου να συλλέξει στατιστικά δεδομένα για τον ίδιο τον «ιστό» (Ιστός) και (ή) να σχηματίσει μια βάση δεδομένων με ευρετήρια περιεχομένου ιστού.

Οι αυτοματοποιημένοι πράκτορες "spiders" σαρώνουν τακτικά ιστοσελίδες και ενημερώνουν τη βάση δεδομένων διευθύνσεων (υπερσύνδεσμοι), τα εργαλεία ευρετηρίασης πληροφοριών που βρίσκονται στις καθορισμένες διευθύνσεις. Τα ευρετήρια που προκύπτουν χρησιμοποιούνται για τη γρήγορη και αποτελεσματική αναζήτηση ενός συνόλου όρων που καθορίζονται από τον χρήστη.

Διαφορετικά συστήματα επιτυγχάνουν αυτόν τον στόχο με διαφορετικούς τρόπους. Μερικοί στέλνουν "πράκτορες" σε κάθε ιστοσελίδα που συναντούν, καταχωρώντας στο ευρετήριο όλες τις λέξεις που συναντούν. Άλλοι πρώτα αναλύουν τη βάση δεδομένων των διευθύνσεων, προσδιορίζοντας τις πιο δημοφιλείς (συνήθως μετρώντας τον αριθμό των διαθέσιμων συνδέσμων προς αυτές). Αυτές οι ιστοσελίδες είναι που ευρετηριάζονται σε διάφορους βαθμούς (μόνο τίτλοι ιστοσελίδων και σύνδεσμοι, συμπεριλαμβανομένου του αυτόματου σχολιασμού των εγγράφων ή όλου του κειμένου).

Οι "έξυπνοι πράκτορες" χρησιμοποιούνται όλο και περισσότερο - μικρά προγράμματα, έχοντας την ικανότητα να αυτομαθαίνουν και να ενεργούν ανεξάρτητα για λογαριασμό του ιδιοκτήτη τους. Έχοντας σύνδεση με τον υπολογιστή του χρήστη, λειτουργούν ως προσωπικούς βοηθούς, εκτελώντας μια σειρά εργασιών χρησιμοποιώντας γνώση των αναγκών και των ενδιαφερόντων του χρήστη. Οι ευφυείς πράκτορες ρομπότ πραγματοποιούν ανεξάρτητες αναζητήσεις στο δίκτυο χρησιμοποιώντας τους δικούς τους μοναδικούς αλγόριθμους. Ορισμένοι από αυτούς όχι μόνο εξετάζουν τις λέξεις-κλειδιά, αλλά πραγματοποιούν επίσης σημασιολογική ανάλυση πληροφοριών στο Διαδίκτυο, προσδιορίζοντας τον βαθμό της σημασιολογικής αντιστοιχίας τους με την εκάστοτε εργασία.

Αποτελεσματική πρόσβαση σε πληροφορίες στο Διαδίκτυο παρέχεται από ξένες μηχανές αναζήτησης (μηχανές) όπως Alta Vista, Lycos, Yahoo, Google, OpenText, Wais, WebCrawler, κ.λπ. Διευθύνσεις Διαδικτύου: www.altavista.com, www.yahoo.com, www.gogle.com, www.opentext.com,

Οι εγχώριες μηχανές αναζήτησης περιλαμβάνουν: Aport ("Aport" JSC Agama), Rambler (Stack Ltd.), Yandex ("Yandex" CompTek Int), "Russian Search Engine", "New Russian Search" κ.λπ. Οι διευθύνσεις τους στο Διαδίκτυο: www.aport.ru, www.rambler.ru, www.yandex.ru, search.interrussia.com, www.openweb.ru, αντίστοιχα) κ.λπ.

2. Τύποι λειτουργιών χρήστη κατά την αλληλεπίδραση με ένα σύστημα ανάκτησης πληροφοριών.

Η γλώσσα του χρήστη είναι οι ενέργειες που εκτελεί ο χρήστης σε σχέση με το σύστημα χρησιμοποιώντας τις δυνατότητες του πληκτρολογίου, του ποντικιού κ.λπ. Η απλούστερη γλώσσα χρήστη έχει τη μορφή εγγράφων εισόδου και εξόδου. Έχοντας εμφανίσει τη φόρμα εισαγωγής (έγγραφο), ο χρήστης τη συμπληρώνει με τα απαραίτητα δεδομένα και τα εισάγει στον υπολογιστή. Το σύστημα υποστήριξης αποφάσεων εκτελεί την απαραίτητη ανάλυση και παράγει τα αποτελέσματα με τη μορφή ενός εγγράφου εξόδου της καθιερωμένης μορφής. Η δημοτικότητα της οπτικής διεπαφής αυξάνεται σημαντικά. Χρησιμοποιώντας το ποντίκι, ο χρήστης επιλέγει αντικείμενα και εντολές που του παρουσιάζονται με τη μορφή εικόνων στην οθόνη, υλοποιώντας έτσι τις ενέργειές του. Αναμένεται η εμφάνιση συστημάτων υποστήριξης αποφάσεων που χρησιμοποιούν την εισαγωγή ομιλίας πληροφοριών.

Η γλώσσα μηνυμάτων είναι αυτό που βλέπει ο χρήστης στην οθόνη ενδείξεων (σύμβολα, γραφικά, χρώμα), δεδομένα που λαμβάνονται από τον εκτυπωτή, σήματα εξόδου ήχου κ.λπ.

Ένας σημαντικός δείκτης της αποτελεσματικότητας της διεπαφής που χρησιμοποιείται είναι η μορφή διαλόγου μεταξύ του χρήστη και του συστήματος. Οι ακόλουθες μορφές διαλόγου είναι κοινές: λειτουργία αίτησης-απόκρισης, λειτουργία εντολής, λειτουργία μενού, λειτουργία συμπλήρωσης κενών σε εκφράσεις που προτείνονται από τον υπολογιστή. Κάθε φόρμα, ανάλογα με το είδος της εργασίας, τα χαρακτηριστικά του χρήστη και τις αποφάσεις που λαμβάνονται, έχει τα δικά της πλεονεκτήματα και μειονεκτήματα.

Οι γνώσεις χρήστη είναι αυτό που πρέπει να γνωρίζει ο χρήστης όταν εργάζεται με το σύστημα. Αυτά περιλαμβάνουν όχι μόνο το σχέδιο δράσης στο κεφάλι του χρήστη, αλλά και σχολικά βιβλία, οδηγίες και δεδομένα αναφοράς που δημιουργούνται από τον υπολογιστή.

3. Βασικά στοιχεία ανάκτησης πληροφοριών σε συστήματα ανάκτησης πληροφοριών.

Η αναζήτηση πληροφοριών είναι η διαδικασία αναγνώρισης σε ένα συγκεκριμένο σύνολο εγγράφων (κειμένων) όλων εκείνων στα οποία είναι αφιερωμένα το καθορισμένο θέμα(θέμα), ικανοποιεί μια προκαθορισμένη συνθήκη αναζήτησης (ερώτημα) ή περιέχει απαραίτητα (που αντιστοιχούν στις ανάγκες πληροφοριών) γεγονότα, πληροφορίες, δεδομένα.

Η διαδικασία αναζήτησης περιλαμβάνει μια ακολουθία λειτουργιών που στοχεύουν στη συλλογή, επεξεργασία και παροχή πληροφοριών.

Γενικά, η αναζήτηση πληροφοριών αποτελείται από τέσσερα στάδια:

προσδιορισμός (διευκρίνιση) αναγκών πληροφοριών και διατύπωση αιτημάτων πληροφοριών.

προσδιορισμός του συνόλου των πιθανών κατόχων συστοιχιών πληροφοριών (πηγών).

εξαγωγή πληροφοριών από αναγνωρισμένες συστοιχίες πληροφοριών·

εξοικείωση με τις πληροφορίες που λαμβάνονται και αξιολόγηση των αποτελεσμάτων αναζήτησης.

[επεξεργασία]

Τύποι αναζήτησης

Αναζήτηση πλήρους κειμένου - αναζήτηση σε ολόκληρο το περιεχόμενο ενός εγγράφου. Ένα παράδειγμα αναζήτησης πλήρους κειμένου είναι οποιαδήποτε μηχανή αναζήτησης στο Διαδίκτυο, για παράδειγμα www.yandex.ru, www.google.com. Συνήθως, η αναζήτηση πλήρους κειμένου χρησιμοποιεί προκατασκευασμένα ευρετήρια για να επιταχύνει τις αναζητήσεις. Η πιο κοινή τεχνολογία για ευρετήρια αναζήτησης πλήρους κειμένου είναι τα ανεστραμμένα ευρετήρια.

Η αναζήτηση με μεταδεδομένα είναι μια αναζήτηση με συγκεκριμένα χαρακτηριστικά εγγράφου που υποστηρίζονται από το σύστημα - όνομα εγγράφου, ημερομηνία δημιουργίας, μέγεθος, συγγραφέας κ.λπ. Ένα παράδειγμα αναζήτησης με λεπτομέρειες είναι το παράθυρο διαλόγου αναζήτησης σε ένα σύστημα αρχείων (για παράδειγμα, MS Windows).

Αναζήτηση εικόνων - αναζήτηση κατά περιεχόμενο εικόνας. Η μηχανή αναζήτησης αναγνωρίζει το περιεχόμενο της φωτογραφίας (που ανέβηκε από τον χρήστη ή το URL της εικόνας που προστέθηκε). Στα αποτελέσματα αναζήτησης ο χρήστης λαμβάνει παρόμοιες εικόνες. Έτσι λειτουργούν οι μηχανές αναζήτησης: Polar Rose, Picollator κ.λπ.

[επεξεργασία]

Μέθοδοι αναζήτησης

[επεξεργασία]

Αναζήτηση διεύθυνσης

Η διαδικασία αναζήτησης εγγράφων με βάση τα καθαρά τυπικά χαρακτηριστικά που καθορίζονται στο αίτημα.

Για την υλοποίηση απαιτούνται οι ακόλουθες προϋποθέσεις:

Το έγγραφο έχει ακριβή διεύθυνση

Ασφάλεια αυστηρή διαταγήθέση των εγγράφων σε μια συσκευή αποθήκευσης ή αποθήκευση συστήματος.

Οι διευθύνσεις εγγράφων μπορεί να είναι διευθύνσεις διακομιστών ιστού και ιστοσελίδων, στοιχεία μιας βιβλιογραφικής εγγραφής και διευθύνσεις για την αποθήκευση εγγράφων σε ένα αποθετήριο.

[επεξεργασία]

Σημασιολογική αναζήτηση

Η διαδικασία αναζήτησης εγγράφων βάσει του περιεχομένου τους.

Σύνταξη περιγραφής αναζήτησης που καθορίζει μια πρόσθετη συνθήκη αναζήτησης.

Η θεμελιώδης διαφορά μεταξύ διεύθυνσης και σημασιολογικής αναζήτησης είναι ότι με την αναζήτηση διευθύνσεων το έγγραφο θεωρείται ως αντικείμενο από την άποψη της μορφής και με τη σημασιολογική αναζήτηση - από την άποψη του περιεχομένου.

Η σημασιολογική αναζήτηση βρίσκει πολλά έγγραφα χωρίς να προσδιορίζει διευθύνσεις.

Σε αυτό θεμελιώδης διαφοράκαταλόγους και αρχεία καρτών.

Βιβλιοθήκη - μια συλλογή βιβλιογραφικών εγγραφών χωρίς την ένδειξη διευθύνσεων.

Έρευνα ντοκιμαντέρ

Η διαδικασία αναζήτησης ενός αποθετηρίου συστήματος ανάκτησης πληροφοριών για πρωτεύοντα έγγραφα ή μια βάση δεδομένων δευτερευόντων εγγράφων που ταιριάζουν με το αίτημα ενός χρήστη.

Δύο τύποι αναζήτησης εγγράφων:

Βιβλιοθήκη, με στόχο την εύρεση πρωτογενών εγγράφων.

Βιβλιογραφικό, με στόχο την εύρεση πληροφοριών για έγγραφα που παρουσιάζονται με τη μορφή βιβλιογραφικών εγγραφών.

Πραγματική αναζήτηση

Η διαδικασία εύρεσης γεγονότων που ταιριάζουν με ένα αίτημα πληροφοριών.

Τα πραγματικά δεδομένα περιλαμβάνουν πληροφορίες που εξάγονται από έγγραφα, πρωτογενή και δευτερεύοντα, και λαμβάνονται απευθείας από τις πηγές εμφάνισής τους.

Υπάρχουν δύο τύποι:

Documentary-factual, αποτελείται από την αναζήτηση εγγράφων για θραύσματα κειμένου που περιέχουν γεγονότα.

Factual (περιγραφή γεγονότων), που περιλαμβάνει τη δημιουργία νέων πραγματικών περιγραφών στη διαδικασία αναζήτησης με λογική επεξεργασία των ευρισθέντων πραγματικών πληροφοριών.

4. Στρατηγικές αναζήτησης πληροφοριών στο Διαδίκτυο.

Η στρατηγική αναζήτησης είναι ένα γενικό σχέδιο (έννοια, προτίμηση, ρύθμιση) συμπεριφοράς συστήματος ή χρήστη για την έκφραση και την ικανοποίηση των αναγκών πληροφοριών του χρήστη, που καθορίζεται τόσο από τη φύση του στόχου και τον τύπο αναζήτησης όσο και από τις «στρατηγικές» αποφάσεις του συστήματος - αρχιτεκτονική βάσης δεδομένων , μεθόδους και μέσα αναζήτησης σε συγκεκριμένο AIPS . Η επιλογή στρατηγικής στη γενική περίπτωση είναι ένα πρόβλημα βελτιστοποίησης. Στην πράξη, καθορίζεται σε μεγάλο βαθμό από την τέχνη της επίτευξης συμβιβασμού μεταξύ των πρακτικών αναγκών και των δυνατοτήτων των διαθέσιμων μέσων.

Η μέθοδος αναζήτησης είναι ένα σύνολο μοντέλων και αλγορίθμων για την υλοποίηση μεμονωμένων τεχνολογικών σταδίων: κατασκευή εικόνας ερωτήματος αναζήτησης (SQI), επιλογή εγγράφου (σύγκριση εικόνων και εγγράφων ερωτήματος αναζήτησης), επέκταση και αναδιατύπωση ερωτήματος, εντοπισμός και αξιολόγηση των αποτελεσμάτων.

Η εικόνα αναζήτησης ενός αιτήματος είναι ένα κείμενο γραμμένο σε μια ξένη γλώσσα που εκφράζει το σημασιολογικό περιεχόμενο ενός αιτήματος πληροφοριών και περιέχει οδηγίες απαραίτητες για την αποτελεσματικότερη εφαρμογή της αναζήτησης πληροφοριών.

Μέθοδοι αναζήτησης, π.χ. Ο εντοπισμός ενός υποσυνόλου εγγράφων που ενδεχομένως περιέχουν μια περιγραφή της λύσης στο πρόβλημα επιλογής εγγράφου (DS) είναι μια αντανάκλαση της διαδικασίας εύρεσης λύσης και εξαρτάται από τη φύση του προβλήματος και τη θεματική περιοχή.

Θεωρώντας την αναζήτηση ως επαναληπτική διαδικασία, οι μέθοδοι για τη μείωση του χώρου αναζήτησης (το υποσύνολο που αναζητείται) αποτελούν ουσιαστικά τη μεθοδολογική βάση της στρατηγικής αναζήτησης και μπορούν να χωριστούν στις ακόλουθες κατηγορίες - μέθοδοι αναζήτησης σε:

1) ένας χώρος (συνήθως θεματικός).

2) ιεραρχικά διατεταγμένος χώρος.

3) εναλλακτικοί χώροι.

4) δυναμικός (αλλάζει κατά τη διαδικασία αναζήτησης) χώρος.

Ορισμένες εξειδικευμένες πληροφορίες θα πρέπει να αναζητηθούν σε εξειδικευμένους καταλόγους, εξετάζοντας τις θεματικές ενότητες που χρειάζεστε. Έχοντας δει έναν ιστότοπο υψηλής ποιότητας που ταιριάζει στο θέμα αναζήτησής σας, μην βιαστείτε να τον αφήσετε χωρίς να δείτε τις σελίδες συνδέσμων. Συνήθως, για σοβαρούς ιστότοπους, οι σύνδεσμοι επιλέγονται όσο το δυνατόν περισσότεροι και μάλλον κάτι θα βρείτε εκεί.

Η βάση δεδομένων αυτής της μηχανής αναζήτησης χωρίζεται σε θεματικές ενότητες, μία από τις οποίες (Υγεία, Μηχανή Αναζήτησης Yahoo) σε απάντηση ενός αιτήματος παρουσιάζει ένα "μενού" ειδήσεων για επιλογή με τη μορφή μιας πιο λεπτομερούς επικεφαλίδας της ενότητας Υγεία, συμπεριλαμβανομένων των Νοσημάτων και Προϋποθέσεις (ασθένειες και καταστάσεις). Επειδή η Yahoo. διατηρεί την ιεραρχική δομή των ενοτήτων κατά τη διάρκεια της αναζήτησης, μπορείτε πάντα να επιστρέψετε στο προηγούμενο υψηλότερο επίπεδο εάν, για κάποιο λόγο, η καλούμενη τρέχουσα ενότητα δεν ανταποκρίνεται στις προσδοκίες. Επιλέγοντας Ασθένειες και Παθήσεις, λαμβάνετε ένα "μενού" ειδήσεων από το οποίο μπορείτε να καλέσετε την ενότητα Διαβήτης εάν πατήσετε το γράμμα D στο αλφάβητο της σελίδας. Yahoo. Ένα σημείο εκκίνησης για τη συλλογή πληροφοριών στο Διαδίκτυο για αρχάριους.

Συμβατικά, τα εργαλεία αναζήτησης χωρίζονται σε εργαλεία αναζήτησης του τύπου αναφοράς (καταλόγους

ΣΥΣΤΗΜΑΤΑ ΑΝΑΚΤΗΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ

1. Συστήματα ανάκτησης πληροφοριών (IRS) και οι τύποι τους

2. Στοιχεία συστημάτων ανάκτησης πληροφοριών

3. Αναζήτηση πληροφοριών στο Διαδίκτυο

Σύστημα ανάκτησης πληροφοριώνΤο (IPS) είναι μια παραγγελθείσα συλλογή εγγράφων (συστοιχίες εγγράφων) και τεχνολογιών πληροφοριών που έχουν σχεδιαστεί για την αποθήκευση και ανάκτηση πληροφοριών - κειμένων (έγγραφα) ή δεδομένων (γεγονότων). Τα συστήματα ανάκτησης πληροφοριών είναι οποιαδήποτε με συγκεκριμένο τρόπο οργανωμένη αποθήκευσηπληροφορίες. Επιπλέον, τα συστήματα ανάκτησης πληροφοριών μπορούν επίσης να είναι μη αυτοματοποιημένα. Το κύριο πράγμα είναι η λειτουργία στόχος: αποθήκευση και ανάκτηση πληροφοριών.

Ανάλογα με το αντικείμενο αποθήκευσης και τον τύπο του αιτήματος, διακρίνονται δύο τύποι ανάκτησης πληροφοριών: τεκμηριωμένη και τεκμηριωμένη - και, κατά συνέπεια, δύο τύποι συστημάτων ανάκτησης πληροφοριών - τεκμηριωμένη και τεκμηριωμένη. Τα τελευταία ονομάζονται επίσης συστήματα ανάκτησης πληροφοριών και πληροφοριών αναφοράς.

Ντοκυμαντέρονομάζονται συστήματα ανάκτησης πληροφοριών που υλοποιούν αναζήτηση από θεματικές ερωτήσειςσε μια σειρά εγγράφων ή κειμένων και στη συνέχεια να παρέχει στον χρήστη ένα υποσύνολο αυτών των εγγράφων ή τα αντίγραφά τους. Η έννοια ενός εγγράφου μπορεί να διαφέρει από σύστημα σε σύστημα. Στη γενική περίπτωση, πρόκειται για ένα συγκεκριμένο αντικείμενο πληροφοριών που καταγράφεται (συνήθως μέσω κάποιου συστήματος πινακίδων) σε κάποιο υλικό μέσο (χαρτί, φωτογραφία και φιλμ, μαγνητική μνήμη κ.λπ.) και προορίζεται για μετάδοση στο χώρο και στο χρόνο στο σύστημα κοινωνικών επικοινωνιών. .

ΠραγματικόςΤα συστήματα ανάκτησης πληροφοριών υλοποιούν την αποθήκευση, αναζήτηση και έκδοση άμεσα πραγματικών δεδομένων (επιστημονικά, τεχνικά, οικονομικά χαρακτηριστικά και ιδιότητες αντικειμένων, διεργασιών, φαινομένων, διευθύνσεων, ονομάτων, ποσοτικών δεδομένων κ.λπ.).

Η κύρια, ουσιαστική διαφορά μεταξύ της τεκμηριωτικής και της πραγματικής αναζήτησης είναι η προσέγγιση της σημασιολογίας των εγγράφων. Τα συστήματα ντοκιμαντέρ περιγράφουν την έννοια των εγγράφων στο σύνολό τους από την άποψη του θεματικού, θεματικού περιεχομένου τους. Σε αυτήν την περίπτωση, είναι σημαντικό να προσδιορίσετε και να ονομάσετε (παραθέσετε) τα κύρια θέματα και τα αντικείμενα στα οποία είναι αφιερωμένο το έγγραφο. Στα πραγματολογικά συστήματα περιγράφονται αντικείμενα, καταγράφονται τα χαρακτηριστικά τους και οι έννοιες αυτών των χαρακτηριστικών. Εξ ου και οι διαφορές στις γλώσσες περιγραφής και στις μεθόδους αποθήκευσης περιγραφών στο σύστημα. Αντίστοιχα, κάθε τύπος αναζήτησης έχει τα δικά του εργαλεία αναζήτησης.

Πραγματικά συστήματαπεριλαμβάνουν τη συσσώρευση και την αναζήτηση σε μια σειρά εγγράφων με αυστηρά ρυθμιζόμενη δομή. Μια τέτοια δομή είναι είτε το αποτέλεσμα προκαταρκτικής πνευματικής επεξεργασίας εγγράφων κατά την εισαγωγή πληροφοριών στο σύστημα, είτε η διαθεσιμότητα τέτοιων εγγράφων σε ολοκληρωμένη μορφή σε συγκεκριμένους τομείς της ανθρώπινης δραστηριότητας, για παράδειγμα, λογιστικά έντυπα, έντυπα, βιβλία αναφοράς, χρονοδιαγράμματα κ.λπ. . Υπάρχουν πραγματικά πληροφοριακά συστήματα που παρέχουν συσσώρευση πληροφοριών και αναζητούν μόνο έναν τύπο αντικειμένου και μόνο έναν τύπο ερωτήματος. Υπάρχουν επίσης πιο ανεπτυγμένα γεγονοτικά συστήματα που παρέχουν αποθήκευση και ανάκτηση δεδομένων διαφορετικών σε περιεχόμενο και δομή, αλλά αυτή η ποικιλομορφία είναι πάντα πεπερασμένη.



Υπάρχει επίσης ένας τρίτος τύπος συστήματος, που ονομάζεται πληροφοριακό-λογικό. Αυτά είναι συστήματα που ανταποκρίνονται σε αιτήματα που βάση πληροφοριώνδεν υπάρχει ρητή απάντηση. Μια εξωγλωσσική βάση γνώσεων και πληροφορίες που παράγονται αλγοριθμικά από ό,τι είναι ήδη διαθέσιμο (έγγραφο ή τεκμηριωμένο) βοηθά να λάβουμε μια απάντηση. Αυτές οι νέες πληροφορίες παρέχονται είτε ως απάντηση σε ένα ερώτημα, είτε χρησιμοποιούνται επιπλέον για αναζήτηση.

Ένα σύστημα ανάκτησης πληροφοριών τύπου εγγράφου είναι μια παραγγελθείσα συλλογή εγγράφων, καθώς και ένα σύνολο εργαλείων και μεθόδων που έχουν σχεδιαστεί για την αποθήκευση, την αναζήτηση και την έκδοση εγγράφων πληροφοριών κατόπιν αιτήματος. Το Documentary IPS εκδίδει έγγραφα που αντιστοιχούν στο αίτημα για το θέμα ή το θέμα. Ένα έγγραφο του οποίου το κεντρικό θέμα ή θέμα αντιστοιχεί γενικά στο σημασιολογικό περιεχόμενο του αιτήματος πληροφοριών ονομάζεται σχετικό , ΕΝΑ ιδιότητα σημασιολογικής εγγύτητας μεταξύ δύο ή περισσότερων κειμένων (στην περίπτωση αυτή, μεταξύ ενός εγγράφου και ενός αιτήματος πληροφοριών) - συνάφεια . Η συνάφεια είναι μια θεμελιώδης έννοια στη θεωρία ανάκτησης πληροφοριών. Μιλούν για δύο τύπους συνάφειας: σημασιολογική και τυπική. Η αντιστοιχία ενός εγγράφου στο περιεχόμενο μιας αίτησης πληροφοριών ονομάζεται σημασιολογική συνάφεια και η αντιστοιχία της εικόνας αναζήτησης αυτού του εγγράφου σε μια τυπική συνταγή αναζήτησης που εκφράζει ένα δεδομένο αίτημα πληροφοριών ονομάζεται επίσημη συνάφεια. Η τυπική συνάφεια ονομάζεται επίσης συνάφεια εγγράφου και η σημασιολογική συνάφεια είναι συνάφεια πληροφοριών (που σημαίνει «τις πληροφορίες που περιέχονται στο έγγραφο»).

Σελίδα 1


Το σύστημα ανάκτησης πληροφοριών έχει σχεδιαστεί για την αποθήκευση και τη διόρθωση δεδομένων πληροφοριών που χρησιμοποιούνται επανειλημμένα από διάφορα υποσυστήματα τεχνολογικής προετοιμασίας παραγωγής, καθώς και για γρήγορη αναζήτηση και παροχή πληροφοριών σύμφωνα με τις οδηγίες αναζήτησης.  

Σύστημα ανάκτησης πληροφοριών (IRS) - σχεδιασμένο για αποθήκευση, αναζήτηση και παροχή πληροφοριών απαραίτητων για ειδικούς. Το IRS είναι μια διάταξη ανάκτησης πληροφοριών (IRP), η οποία, ανάλογα με τη φύση της παρουσίασης των αποθηκευμένων πληροφοριών, μπορεί να είναι τεκμηριωμένη ή τεκμηριωμένη. Ο τύπος εγγράφου IPM περιλαμβάνει πληροφορίες σχετικά με έγγραφα, π.χ.  

Το σύστημα ανάκτησης πληροφοριών παρέχει τη δυνατότητα αναζήτησης των απαραίτητων δεδομένων σε βάσεις δεδομένων χρησιμοποιώντας σχεδόν όλα τα μεταβλητά πεδία των αποθηκευμένων δεικτών.  

Ένα σύστημα ανάκτησης πληροφοριών, επικεντρωμένο στην αναζήτηση πληροφοριών ενός συγκεκριμένου προφίλ, μπορεί επίσης να κατασκευαστεί με βάση την αρχή των θεματικών συλλογών. Σε αυτήν την περίπτωση, ομάδες ατόμων ή οργανισμοί μπορούν να χρησιμοποιήσουν τις ίδιες πληροφορίες, με αποτέλεσμα να μειωθεί το κόστος της υπηρεσίας. Κάθε χρήστης επιτρέπεται να αναπτύξει και να εφαρμόσει τη δική του μέθοδο αναζήτησης πληροφοριών ή να χρησιμοποιήσει μία από τις πολλές τυπικές διαδικασίες που παρέχονται στο σύστημα.  

Το σύστημα ανάκτησης πληροφοριών, που αναπτύχθηκε από την Central Geophysical Expedition, γραμμένο σε κωδικούς μηχανής του υπολογιστή M-222, προορίζεται για την αυτοματοποιημένη αποθήκευση, επεξεργασία και παράδοση πληροφοριών για την τοπική ερμηνεία γεωλογικών, γεωφυσικών και δεδομένων πεδίου με σκοπό τον σχεδιασμό και ανάλυση της ανάπτυξης πεδίου.  

Ένα σύστημα ανάκτησης πληροφοριών είναι ένα σύνολο μεθόδων και μέσων για την προετοιμασία, την αποθήκευση, την αναζήτηση και την έκδοση πληροφοριών που είναι απαραίτητες για την τεχνολογική προετοιμασία της παραγωγής. Το IPS θα πρέπει να αποθηκεύει: GOST, πρότυπα, πρότυπα, πίνακες, ταξινομητές, τυπικά προγράμματα, πληροφορίες σχετικά με εξοπλισμό, αξεσουάρ, τυπικές και ενοποιημένες τεχνολογικές διαδικασίες.  

Τα συστήματα ανάκτησης πληροφοριών προορίζονται κυρίως για να βοηθήσουν στην ανάλυση και περιγραφή των στοιχείων που περιέχονται σε μια συσκευή που αποθηκεύει πληροφορίες, καθώς και στην αναζήτηση μεταξύ ενός συνόλου στοιχείων και στην επιλογή τους ως απόκριση σε αίτημα χρήστη. Γενικά, μια μηχανή αναζήτησης εκτελεί τέσσερις κύριους τύπους δραστηριοτήτων: ανάλυση πληροφοριών, οργάνωση πληροφοριών και ανάκτησή τους, διατύπωση αιτήματος και ανάκτηση (ή διανομή) πληροφοριών.  

Τα συστήματα ανάκτησης πληροφοριών σε αυτοματοποιημένα συστήματα ελέγχου πρέπει να διασφαλίζουν την επεξεργασία εξαιρετικά μεγάλων ποσοτήτων πληροφοριών, συμπεριλαμβανομένων εκατοντάδων και χιλιάδων εγγράφων. Επομένως, η δημιουργία τέτοιων συστημάτων απαιτεί συχνά πολύ μεγάλο εργατικό κόστος. Έτσι, η ανάπτυξη μόνο λιστών χρησιμοποιημένων εννοιών (περιγραφών), η ισοδυναμία, η υποταγή και οι μεταξύ τους συνδέσεις, που συγκεντρώνονται σε ειδικά λεξικά-θησαυρούς δεκάδων χιλιάδων λέξεων, απαιτεί 3-5 χρόνια δουλειάς από μεγάλες ομάδες ειδικών.  

Τα συστήματα ανάκτησης πληροφοριών, ιδίως αυτά που βασίζονται σε υπολογιστή, χρησιμεύουν για επιλεκτική διάδοση πληροφοριών (έως 25.000 θέματα), έκδοση βιβλιογραφικών συλλογών και τεκμηριωμένων παραπομπών (έως 150 αναζητήσεις για εφάπαξ αιτήματα ανά ημέρα), αναπαραγωγή συστοιχιών πληροφοριών σε μαγνητικά κασέτα, δημιουργία αντιγράφων εγγράφων, δημοσίευση πληροφοριών. Οι μηχανές αναζήτησης (για παράδειγμα, Poisk-5) βρίσκουν αυτόματα ένα πλαίσιο σε μικροφίλμ, το μεγεθύνουν για ανάγνωση σε μια ημιδιαφανή οθόνη και λαμβάνουν ένα ηλεκτρογραφικό αντίγραφο από αυτό. Το σύμπλεγμα αναζήτησης Search OK - l, επιπλέον, λαμβάνει μικροφίλμ και αποθηκεύει πληροφορίες μικροφίλμ.  

Τα συστήματα ανάκτησης πληροφοριών ταξινομούνται σύμφωνα με τα ακόλουθα κύρια χαρακτηριστικά: τον τύπο των αποτελεσμάτων και των αναζητήσεων που παράγονται, τον τύπο της γλώσσας ανάκτησης πληροφοριών που χρησιμοποιείται.  

Το σύστημα ανάκτησης πληροφοριών Argon είναι ένα σύστημα τύπου τεκμηρίωσης που έχει σχεδιαστεί για να παρέχει σε επιχειρήσεις και ιδρύματα αναδρομικές και σηματοδοτικές πληροφορίες για θέματα τεχνολογίας παραγωγής. Κατά τη διαδικασία αναζήτησης, το σύστημα εκτελεί τις ακόλουθες λειτουργίες: καταγραφή της εικόνας αναζήτησης του εγγράφου. καταγραφή της προδιαγραφής αιτήματος αναζήτησης· δημιουργία αντιστοιχίας μεταξύ της εικόνας αναζήτησης και της συνταγής του ερωτήματος αναζήτησης· λήψη απόφασης για την έκδοση ή μη έκδοση εγγράφου με βάση το κριτήριο της σημασιολογικής συμμόρφωσης· έκδοση εγγράφων που ανταποκρίνονται στο αίτημα.  

Τα συστήματα ανάκτησης πληροφοριών έχουν σχεδιαστεί για τη συλλογή, επεξεργασία, εισαγωγή, αποθήκευση, αναζήτηση και εμφάνιση πληροφοριών.  

Πρέπει να παρέχονται συστήματα ανάκτησης πληροφοριών αξιόπιστη προστασίααπό τυχαία απώλεια ή παραμόρφωση πληροφοριών. Ταυτόχρονα, ο οργανισμός τους πρέπει να προβλέπει τη δυνατότητα ενημέρωσης πληροφοριών, αφαίρεσης ξεπερασμένων πληροφοριών που έχουν χάσει το νόημά τους και λειτουργική αντικατάστασητα νέα τους δεδομένα.  

Τα συστήματα ανάκτησης πληροφοριών έχουν σχεδιαστεί για την αναζήτηση πλήρων κειμένων εγγράφων, δευτερευόντων εγγράφων (για παράδειγμα, περιλήψεων), τίτλων ή διευθύνσεων εγγράφων που μπορούν να αποθηκευτούν τόσο στον υπολογιστή όσο και εκτός αυτού. Και στις δύο περιπτώσεις, ο υπολογιστής αποθηκεύει επίσημες περιγραφές εγγράφων, οι οποίες ονομάζονται εικόνες αναζήτησης και περιέχουν μια σύντομη περιγραφή του περιεχομένου τους. Οι καταναλωτές πληροφοριών, που θέλουν να βρουν έγγραφα για ένα συγκεκριμένο θέμα, στέλνουν ένα αίτημα στο σύστημα, το οποίο είναι μια οδηγία αναζήτησης. Με βάση τα αποτελέσματα αναζήτησης, επιστρέφεται είτε το πλήρες κείμενο των επιλεγμένων εγγράφων είτε οι σύνδεσμοι προς εκείνα τα έγγραφα που αντιστοιχούν στο αίτημα με διάφορους βαθμούς αξιοπιστίας, πλεονασμού ή ανεπάρκειας.  



Συνιστούμε να διαβάσετε

Μπλουζα