Πληροφορίες και δεδομένα. Ποσοτικές και ποιοτικές αξιολογήσεις πληροφοριών

Παιδικά προϊόντα 11.04.2019


Επισκόπηση προγράμματος Η έκδοση υπολογιστή του Microsoft Excel Viewer θα επιτρέψει...
Chercher

  1. Επάρκεια πληροφοριών. Εμφανίζει τα τυπικά και δομικά χαρακτηριστικά της πληροφορίας και δεν επηρεάζει το σημασιολογικό της περιεχόμενο. Αυτή η μορφή συμβάλλει στην αντίληψη του εξωτερικού δομικά χαρακτηριστικά, δηλ. συντακτική πλευρά της πληροφορίας.
  2. Σημασιολογική (εννοητική) επάρκεια. Αυτή η φόρμα καθορίζει τον βαθμό αντιστοιχίας μεταξύ της εικόνας του αντικειμένου και του ίδιου του αντικειμένου. Η σημασιολογική πτυχή περιλαμβάνει τη λήψη υπόψη του σημασιολογικού περιεχομένου των πληροφοριών.
  3. Πραγματική (καταναλωτική) επάρκεια. Αντικατοπτρίζει τη σχέση μεταξύ της πληροφορίας και του καταναλωτή της, την αντιστοιχία των πληροφοριών με τον στόχο διαχείρισης, ο οποίος υλοποιείται στη βάση του. Αυτή η μορφή επάρκειας σχετίζεται άμεσα με πρακτική χρήσηπληροφορίες, με τη συμμόρφωσή τους αντικειμενική λειτουργίαδραστηριότητα του συστήματος.

Η ποιότητα των πληροφοριών καθορίζεται από δείκτες όπως:

  1. αντιπροσωπευτικότητα,
  2. περιεχόμενο,
  3. επάρκεια,
  4. προσιτότητα,
  5. συνάφεια,
  6. επικαιρότητα,
  7. ακρίβεια,
  8. αξιοπιστία,
  9. βιωσιμότητα.


Αντιπροσωπευτικότητα πληροφοριών
συνδέεται με την ορθότητα της επιλογής και του σχηματισμού του ώστε να αντικατοπτρίζει επαρκώς τις ιδιότητες του αντικειμένου.
Τα πιο σημαντικά πράγματα εδώ είναι:

  1. την ορθότητα της έννοιας βάσει της οποίας διατυπώνεται η αρχική έννοια·
  2. εγκυρότητα της επιλογής βασικών χαρακτηριστικών και συνδέσεων του εμφανιζόμενου φαινομένου.

Η παραβίαση της αντιπροσωπευτικότητας των πληροφοριών συχνά οδηγεί σε σημαντικά σφάλματα.
Το περιεχόμενο των πληροφοριών αντικατοπτρίζει τη σημασιολογική ικανότητα, ίση με την αναλογία του ποσού σημασιολογικές πληροφορίεςστο μήνυμα προς τον όγκο των δεδομένων που υποβάλλονται σε επεξεργασία.

Με αύξηση περιεχόμενο των πληροφοριώνη σημασιολογία μεγαλώνει διακίνησηςπληροφοριακό σύστημα, καθώς για να ληφθούν οι ίδιες πληροφορίες απαιτείται μετατροπή μικρότερου όγκου δεδομένων.

Μαζί με τον συντελεστή περιεκτικότητας Γ, αντανακλώντας σημασιολογική πτυχή, μπορείτε επίσης να χρησιμοποιήσετε τον συντελεστή περιεχομένου πληροφοριών, που χαρακτηρίζεται από την αναλογία
Επάρκεια (πληρότητα) πληροφοριώνσημαίνει ότι περιέχει ελάχιστη αλλά επαρκή για αποδοχή η σωστή απόφασησύνθεση (σύνολο δεικτών). Η έννοια της πληρότητας της πληροφορίας συνδέεται με το σημασιολογικό της περιεχόμενο (σημασιολογία) και την πραγματιστική. Ως ελλιπής, δηλ. Οι ανεπαρκείς πληροφορίες για τη λήψη της σωστής απόφασης και οι περιττές πληροφορίες μειώνουν την αποτελεσματικότητα των αποφάσεων που λαμβάνονται από τον χρήστη.


Διαθεσιμότητα πληροφοριών
Η αντίληψη των χρηστών διασφαλίζεται με την εφαρμογή κατάλληλων διαδικασιών για την απόκτηση και τον μετασχηματισμό του. Για παράδειγμα, σε ένα πληροφοριακό σύστημα, οι πληροφορίες μετατρέπονται σε μια προσβάσιμη και φιλική προς τον χρήστη μορφή. Αυτό επιτυγχάνεται, ειδικότερα, με το συντονισμό της σημασιολογικής του μορφής με τον θησαυρό του χρήστη.

Συνάφεια πληροφοριώνκαθορίζεται από τον βαθμό διατήρησης της αξίας των πληροφοριών για τη διαχείριση κατά τη στιγμή της χρήσης τους και εξαρτάται από τη δυναμική των αλλαγών στα χαρακτηριστικά τους και από το χρονικό διάστημα που έχει περάσει από την εμφάνιση αυτών των πληροφοριών.

Επικαιρότητα ενημέρωσηςσημαίνει την άφιξή του το αργότερο σε ένα προκαθορισμένο χρονικό σημείο, σύμφωνο με το χρόνο επίλυσης της εργασίας.

Ακρίβεια πληροφοριώνκαθορίζεται από τον βαθμό εγγύτητας των πληροφοριών που λαμβάνονται πραγματική κατάστασηαντικείμενο, διαδικασία, φαινόμενο κ.λπ. Για πληροφορίες που εμφανίζονται ψηφιακός κώδικας, είναι γνωστές τέσσερις έννοιες ταξινόμησης της ακρίβειας:

  1. τυπική ακρίβεια, που μετράται με τη μοναδιαία τιμή του λιγότερο σημαντικού ψηφίου ενός αριθμού·
  2. πραγματική ακρίβεια, που καθορίζεται από την τιμή της μονάδας του τελευταίου ψηφίου του αριθμού, η ακρίβεια του οποίου είναι εγγυημένη.
  3. τη μέγιστη ακρίβεια που μπορεί να επιτευχθεί υπό τις συγκεκριμένες συνθήκες λειτουργίας του συστήματος·
  4. προσδιορίζεται η απαιτούμενη ακρίβεια λειτουργικό σκοπόδείκτης.

Αξιοπιστία πληροφοριώνκαθορίζεται από την ιδιότητά του να αντανακλάται αληθινά υπάρχουσες εγκαταστάσειςμε την απαιτούμενη ακρίβεια. Η αξιοπιστία των πληροφοριών μετριέται με την πιθανότητα εμπιστοσύνης της απαιτούμενης ακρίβειας, δηλ. η πιθανότητα η τιμή μιας παραμέτρου που εμφανίζεται από πληροφορίες να διαφέρει από την πραγματική τιμή αυτής της παραμέτρου εντός της απαιτούμενης ακρίβειας.
Η σταθερότητα των πληροφοριών αντικατοπτρίζει την ικανότητά του να ανταποκρίνεται σε αλλαγές στα δεδομένα πηγής χωρίς να διακυβεύεται η απαιτούμενη ακρίβεια. Η σταθερότητα της πληροφορίας, καθώς και η αντιπροσωπευτικότητα, καθορίζονται από την επιλεγμένη μεθοδολογία για την επιλογή και τη διαμόρφωσή της.

Συμπερασματικά, θα πρέπει να σημειωθεί ότι παράμετροι ποιότητας πληροφοριών όπως π.χ η αντιπροσωπευτικότητα, η σημασία, η επάρκεια, η προσβασιμότητα, η βιωσιμότητα καθορίζονται εξ ολοκλήρου στο μεθοδολογικό επίπεδο της ανάπτυξης πληροφοριακών συστημάτων.

Οι παράμετροι της συνάφειας, της επικαιρότητας, της ακρίβειας και της αξιοπιστίας καθορίζονται επίσης σε μεγαλύτερο βαθμό σε μεθοδολογικό επίπεδο, ωστόσο Η αξία τους επηρεάζεται σημαντικά από τη φύση της λειτουργίας του συστήματος, κυρίως από την αξιοπιστία του.

Συγχρόνως οι παράμετροι συνάφειας και ακρίβειας σχετίζονται αυστηρά με τις παραμέτρους της επικαιρότητας και της αξιοπιστίας, αντίστοιχα.

Για να δουλέψετε αποτελεσματικά με πληροφορίες (να τις χρησιμοποιήσετε) στο μέλλον, πρέπει αρχικό στάδιοκατανοήστε αρκετά απλά πράγματα: εάν οι πληροφορίες που παρουσιάζονται είναι χρήσιμες για εσάς ή όχι, εάν μπορείτε να τις εμπιστευτείτε, εάν απαιτούνται πρόσθετες πληροφορίες κ.λπ. Έτσι, η διαδικασία δεν είναι τίποτα άλλο από μια αξιολόγηση των πληροφοριών που λάβατε.

Κριτήρια για την αξιολόγηση των πληροφοριών - (σημασία, ακρίβεια, σημασία)

Για κάθε επεισόδιο (μπλοκ κειμένου, μήνυμα κ.λπ.) είναι απαραίτητο να ληφθεί απόφαση σχετικά με την ανάγκη, την αποθήκευση και την περαιτέρω χρήση. Για να το θέσω ωμά, η συλλογή όλων των γύρω πληροφοριών είναι πολύ δύσκολη: αυτό απαιτεί τεράστιους πόρους.

Η ίδια η διαδικασία σφαγής πρέπει να έχει σαφή κριτήρια. Για να ληφθεί απόφαση σχετικά με την ανάγκη ενημέρωσης, πραγματοποιείται μια αρχική αξιολόγηση. Τα αρχικά κριτήρια αξιολόγησης θα πρέπει να είναι ελαφρώς πιο χονδροειδή για να αποφευχθεί η απώλεια σημαντικές πληροφορίες, αλλά όχι σημαντικά, διαφορετικά η ροή θα γίνει ανεξέλεγκτη. Ελάχιστο σετκριτήρια για την αρχική αξιολόγηση - αυτό είναι ένα σημάδι - η συνάφεια αυτών των πληροφοριών με τη δική μας. Με άλλα λόγια, εάν οι πληροφορίες σχετίζονται με οποιονδήποτε τρόπο με το θέμα μας ή μπορούν ενδεχομένως να βοηθήσουν στην εργασία στο έργο μας, τότε μας ενδιαφέρουν. Αυτό σημαίνει ότι το κρατάμε και το χρησιμοποιούμε για περαιτέρω εργασία.

Το αποτέλεσμα μιας τέτοιας αξιολόγησης πληροφοριών θα πρέπει να είναι ένα συμπέρασμα σχετικά με τη συνάφειά τους με το πρόβλημά μας.

Προηγουμένως, συζητήσαμε τις ιδιότητες της πληροφορίας, οι οποίες στην ουσία αποτελούν τα κριτήρια για την αξιολόγησή της:
αντικειμενικότητα - υποκειμενικότητα
αξιοπιστία - αναξιοπιστία
Πληρότητα - ημιτελή
Συνάφεια - ασχετοσύνη
Αξία – αχρηστία
Διαύγεια – αφάνεια

Αυτή είναι μια ακαδημαϊκή προσέγγιση. Στην πράξη, συνήθως προχωρούν ως εξής. Αρχικά, οι πληροφορίες που λαμβάνονται αξιολογούνται ως προς τη συνάφεια. Εάν οι πληροφορίες είναι σχετικές, το ερώτημα είναι η αξιοπιστία τους. Στη συνέχεια - στη συνάφειά του. Και μετά από αυτό, εάν είναι απαραίτητο, πραγματοποιείται αξιολόγηση σύμφωνα με άλλα κριτήρια. Συχνά, χρησιμοποιείται ένα απλοποιημένο σύνολο κριτηρίων για την επιτάχυνση της διαδικασίας αξιολόγησης. Επιπλέον, ανάλογα με την εργασία, η σημασία μιας ή άλλης ιδιότητας των πληροφοριών αλλάζει, μέχρι πλήρης άρνησηαπό κάποιο ακίνητο. Εφαρμόζεται επίσης ο συνδυασμός πολλών ιδιοτήτων σε μία συνθετική παράμετρο. Για παράδειγμα, αντικειμενικότητα και αξιοπιστία ή πληρότητα και αξία. Ή ένα ακίνητο χρησιμοποιείται για αξιολόγηση. Αυτό μπορεί να γίνει κατά την αρχική συλλογή πληροφοριών για ένα προηγουμένως άγνωστο πρόβλημα. Τα πάντα συλλέγονται - το κύριο πράγμα είναι ότι οι πληροφορίες βοηθούν κατά κάποιο τρόπο στην κατανόηση του προβλήματος.

Κριτήρια για την απλοποιημένη αξιολόγηση πληροφοριών
ΣΧΕΤΙΚΟΤΗΤΑ της πληροφορίας - η ύπαρξη σύνδεσης με το πρόβλημα (αντιστοιχία με τα ενδιαφέροντά μας) και η ικανότητα των πληροφοριών να συμβάλλουν στη διαδικασία κατανόησης του προβλήματος. Με άλλα λόγια, είναι απαραίτητο να γίνει σύγκριση αυτές οι πληροφορίεςμε τις ανάγκες σας σε πληροφορίες και απαντήστε στην ερώτηση: μπορεί να σας βοηθήσει με κάτι τώρα ή στο εγγύς μέλλον; Εάν ναι, μεταβείτε στο επόμενο βήμα, εάν όχι, προσθέστε το στον κάδο απορριμμάτων (εκτός εάν το χρειάζεστε σε άλλο θέμα).

ΑΞΙΟΠΙΣΤΙΑ των πληροφοριών - σε ποιο βαθμό η περιγραφή που παρουσιάζεται ανταποκρίνεται στην πραγματικότητα. Μπορεί να είναι αξιόπιστη η πληροφορία ή απαιτείται πρόσθετη έρευνα ή δεν μπορεί να είναι αξιόπιστη καταρχήν;

ΣΗΜΑΣΙΑ ΤΩΝ ΠΛΗΡΟΦΟΡΙΩΝ:
- κατανόηση των ίδιων των πληροφοριών,
- πλήρης κάλυψη του θέματος που ενδιαφέρει,
- η έγκαιρη ενημέρωση και η επάρκειά της για λήψη αποφάσεων.

Η λήψη απόφασης σχετικά με τη συνάφεια των πληροφοριών με ένα συγκεκριμένο πρόβλημα πραγματοποιείται σύμφωνα με διάφορα κριτήρια. Το πρώτο σημάδι είναι η παρουσία σαφούς ένδειξης της περιοχής ενδιαφέροντος. Αυτή η ένδειξη αποκαλύπτεται μέσω της παρουσίας λέξεις-κλειδιά(τίτλοι, ονόματα, ημερομηνίες, συγκεκριμένοι όροι κ.λπ.). Το δεύτερο σημάδι είναι πιο σύνθετο είναι η παρουσία μιας έμμεσης, σημασιολογικής ένδειξης. Δεν είναι δυνατό να ονομάσουμε απευθείας τα σημάδια εδώ - σε κάθε περίπτωση είναι διαφορετικά.

Το δεύτερο κριτήριο είναι η αξιοπιστία. Ελέγχεται σύμφωνα με τις ακόλουθες παραμέτρους:
- διαθεσιμότητα επιβεβαίωσης από άλλες πηγές.
- σύνδεση με άλλες πληροφορίες.
- γνώση της πηγής και της
- αυθεντία ή μακρά θετική ιστορία εργασίας με την πηγή.
- ιδιότητες του καναλιού μετάδοσης πληροφοριών.

Όπως μπορείτε να δείτε, τη σημαντικότερη θέση εδώ κατέχει η γνώση της πηγής πληροφοριών. Επομένως, είναι σημαντικό να εργάζεστε για τη μελέτη των πηγών και τη διαρκή συλλογή πληροφοριών σχετικά με αυτές. Με ποιους συνδέονται, πόσο αντικειμενικά καλύπτουν προβλήματα, με ποιους συνεργάζονται, ποιανού συμφέροντα ασκούν πίεση κ.λπ. Για να εντοπίσετε παραπληροφόρηση πρέπει:
- ξεχωρίζουν σαφώς τα γεγονότα και τις απόψεις σχετικά με αυτά·
- κατανοήσει εάν η πηγή μπορεί να έχει πρόσβαση στις πληροφορίες που αποστέλλονται.
- να λάβει υπόψη τη σχέση της πηγής με τα περιγραφόμενα αντικείμενα ή γεγονότα.
- σκεφτείτε προσωπικά χαρακτηριστικάπηγή (συγγραφέας) - ενδιαφέρον, φαντασία, εξάρτηση, έπαρση.
- να θυμάστε ότι οι επιθυμητές πληροφορίες γίνονται πιο εύκολα αντιληπτές.

Είναι επίσης απαραίτητο να ληφθεί υπόψη ότι οι πληροφορίες είναι παραμορφωμένες και ακούσια. Αυτό συμβαίνει για τους εξής λόγους:
- μετάδοση μέρους του μηνύματος.
- να επαναλάβετε αυτά που ακούσατε με δικά σας λόγια και να εισάγετε τη στάση και τη γνώμη σας στο περιεχόμενο.
- τα μηνύματα που κυκλοφορούν μέσω οριζόντιων και ανεπίσημων καναλιών είναι λιγότερο επιρρεπή σε παραμόρφωση, και οι πληροφορίες που παρέχονται «ανοδικά» είναι πιο επιρρεπείς σε παραμόρφωση, καθώς το άτομο που μεταδίδει τα δεδομένα θέλει να ευχαριστήσει, να λάβει ανταμοιβές και να αποφύγει την τιμωρία.

Όταν χρησιμοποιείται σκόπιμα παραπληροφόρηση, χρησιμοποιούνται οι ακόλουθες τεχνικές:
- απόκρυψη γεγονότων.
- τετριμμένη επιλογή (παρουσίαση) γεγονότων.
- παραβίαση λογικών ή προσωρινών συνδέσεων.
- ζωοτροφή αξιόπιστες πληροφορίεςσε τέτοια μορφή ή πλαίσιο που να εκλαμβάνεται ως παραπληροφόρηση·
- περίληψησημαντικές πληροφορίες σε φόντο φωτεινών δεδομένων που αποσπούν την προσοχή.
- χρήση διφορούμενων λέξεων στην παρουσίαση που μπορούν να ερμηνευτούν με διαφορετικούς τρόπους.
- καταστολή βασικών λεπτομερειών.

Κατά τη διαδικασία εργασίας με πληροφορίες (σε οποιοδήποτε στάδιο), μπορεί να προκύψει μια κατάσταση όταν δεν υπάρχουν αρκετά δεδομένα για να κατανοήσουμε τι συμβαίνει. Σε αυτήν την περίπτωση, μπορείτε να χρησιμοποιήσετε την τεχνική ανάκτησης πληροφοριών.

Η ουσία του είναι ότι κάθε γεγονός προηγείται από κάτι, κάποια προετοιμασία, κάποια γεγονότα, και ένα ίχνος παραμένει παντού. Ορισμένες διαδικασίες συνοδεύουν το κύριο γεγονός, ενώ άλλες γίνονται συνέπεια αυτού του γεγονότος. Πρέπει να είστε σε θέση να επαναφέρετε τη σειρά των γεγονότων και να προσδιορίσετε μέρη όπου ενδέχεται να παραμείνουν πληροφορίες σχετικά με το συμβάν. Αλλά πρέπει να ξεκινήσετε με την επεξεργασία των υπαρχουσών πληροφοριών. Και από αυτή την άποψη, η διαδικασία πιστοποίησης της πηγής πληροφοριών είναι πολύ σημαντική.

Ο όρος «πληροφορία» προέρχεται από το λατινικό informatio, που σημαίνει εξήγηση, επίγνωση, παρουσίαση. Με την ευρεία έννοια, η πληροφορία είναι μια γενική επιστημονική έννοια που περιλαμβάνει την ανταλλαγή πληροφοριών μεταξύ άλλων ανθρώπων, την ανταλλαγή σημάτων μεταξύ ζωντανής και άψυχης φύσης, ανθρώπων και συσκευών.

Πληροφορίες– πληροφορίες για αντικείμενα και φαινόμενα του περιβάλλοντος, τις παραμέτρους, τις ιδιότητες και την κατάστασή τους, που μειώνουν τον βαθμό αβεβαιότητας και την ελλιπή γνώση για αυτά.

1.2. Ποσοτικά χαρακτηριστικά της πληροφορίας. 1) Συντακτικό μέτρο πληροφοριών.Αυτό το μέτρο της ποσότητας των πληροφοριών λειτουργεί με απρόσωπες πληροφορίες που δεν εκφράζουν μια σημασιολογική σχέση με το αντικείμενο. Σε συντακτικό επίπεδο λαμβάνονται υπόψη το είδος των μέσων και η μέθοδος παρουσίασης των πληροφοριών, η ταχύτητα μετάδοσης και επεξεργασίας και το μέγεθος των κωδικών παρουσίασης πληροφοριών. 2) Όγκος δεδομένων(V D) νοείται με την τεχνική έννοια της λέξης ως ο όγκος πληροφοριών ενός μηνύματος ή ως η ποσότητα μνήμης που απαιτείται για την αποθήκευση ενός μηνύματος χωρίς αλλαγές.

Ο όγκος πληροφοριών ενός μηνύματος μετράται σε κομμάτιακαι ισούται με την ποσότητα δυαδικά ψηφία("0" και "1") με το οποίο κωδικοποιείται το μήνυμα.

3) Σημασιολογικό μέτρο πληροφοριών.Να μετρήσει το σημασιολογικό περιεχόμενο της πληροφορίας, δηλ. Η ποσότητα του σε σημασιολογικό επίπεδο, το πιο αναγνωρισμένο είναι το μέτρο του θησαυρού, το οποίο συνδέει τις σημασιολογικές ιδιότητες της πληροφορίας με την ικανότητα του χρήστη να αποδεχτεί το εισερχόμενο μήνυμα. Για το σκοπό αυτό χρησιμοποιείται η έννοια θησαυρός χρήστη.

Θησαυρόςείναι μια συλλογή πληροφοριών που είναι διαθέσιμες σε έναν χρήστη ή ένα σύστημα.

4) Πραγματικό μέτρο πληροφοριών.Αυτό το μέτρο καθορίζει τη χρησιμότητα των πληροφοριών (αξίας) για τον χρήστη για την επίτευξη της επιδιωκόμενης αλυσίδας. Αυτό το μέτρο είναι επίσης μια σχετική τιμή, που καθορίζεται από τις ιδιαιτερότητες της χρήσης αυτών των πληροφοριών σε ένα συγκεκριμένο σύστημα.

1.3. Ποιοτικά χαρακτηριστικά της πληροφορίας.

Η δυνατότητα και η αποτελεσματικότητα της χρήσης πληροφοριών καθορίζεται από τις βασικές ανάγκες των καταναλωτών: δείκτες ποιότητας, όπως αντιπροσωπευτικότητα, σημασία, επάρκεια, προσβασιμότητα, συνάφεια, επικαιρότητα, ακρίβεια, αξιοπιστία, βιωσιμότητα.

1) ΑντιπροσωπευτικότηταΟι πληροφορίες συνδέονται με την ορθότητα της επιλογής και του σχηματισμού τους, προκειμένου να αντικατοπτρίζουν επαρκώς τις ιδιότητες του αντικειμένου. Τα πιο σημαντικά πράγματα εδώ είναι:

Η ορθότητα της έννοιας βάσει της οποίας διατυπώνεται η αρχική έννοια.

Η εγκυρότητα της επιλογής ουσιωδών χαρακτηριστικών και συνδέσεων του εμφανιζόμενου φαινομένου.

ΜΕΚαθώς το περιεχόμενο των πληροφοριών αυξάνεται, η σημασιολογική απόδοση του πληροφοριακού συστήματος αυξάνεται, αφού για να ληφθούν οι ίδιες πληροφορίες είναι απαραίτητο να μετατραπεί μικρότερος όγκος δεδομένων.

Επάρκεια (πληρότητα)πληροφορίες σημαίνει ότι περιέχει μια ελάχιστη αλλά επαρκή σύνθεση (σύνολο δεικτών) για τη λήψη της σωστής απόφασης. Η έννοια της πληρότητας της πληροφορίας συνδέεται με το σημασιολογικό της περιεχόμενο (σημασιολογία) και την πραγματιστική. Ως ελλιπής, δηλ. Οι ανεπαρκείς πληροφορίες για τη λήψη της σωστής απόφασης και οι περιττές πληροφορίες μειώνουν την αποτελεσματικότητα των αποφάσεων που λαμβάνονται από τον χρήστη.

ΔιαθεσιμότηταΗ πληροφόρηση στην αντίληψη του χρήστη διασφαλίζεται με την εφαρμογή κατάλληλων διαδικασιών για την απόκτηση και τον μετασχηματισμό της. Για παράδειγμα, σε ένα πληροφοριακό σύστημα, οι πληροφορίες μετατρέπονται σε μια προσιτή και φιλική προς τον χρήστη μορφή. Αυτό επιτυγχάνεται, ειδικότερα, με το συντονισμό της σημασιολογικής του μορφής με τον θησαυρό του χρήστη.

ΣυνάφειαΟι πληροφορίες καθορίζονται από το βαθμό διατήρησης της αξίας των πληροφοριών για τη διαχείριση κατά τη στιγμή της χρήσης τους και εξαρτάται από τη δυναμική των αλλαγών στα χαρακτηριστικά τους και από το χρονικό διάστημα που έχει περάσει από την εμφάνιση αυτών των πληροφοριών.

Επικαιρότηταπληροφορίες σημαίνει την άφιξή τους το αργότερο σε ένα προκαθορισμένο χρονικό σημείο, σύμφωνο με το χρόνο επίλυσης της εργασίας.

ΑκρίβειαΟι πληροφορίες καθορίζονται από τον βαθμό εγγύτητας των λαμβανόμενων πληροφοριών στην πραγματική κατάσταση του αντικειμένου, της διαδικασίας, του φαινομένου κ.λπ.

ΑξιοπιστίαΟι πληροφορίες καθορίζονται από την ιδιότητά τους να αντικατοπτρίζουν αντικείμενα της πραγματικής ζωής με την απαραίτητη ακρίβεια. Η αξιοπιστία των πληροφοριών μετριέται με την πιθανότητα εμπιστοσύνης της απαιτούμενης ακρίβειας, δηλ. την πιθανότητα η τιμή της παραμέτρου που εμφανίζεται από τις πληροφορίες να διαφέρει από την πραγματική τιμή αυτής της παραμέτρου εντός της απαιτούμενης ακρίβειας.

ΒιωσιμότηταΟι πληροφορίες αντικατοπτρίζουν την ικανότητά τους να ανταποκρίνονται σε αλλαγές στα δεδομένα πηγής χωρίς να παραβιάζουν την απαιτούμενη ακρίβεια. Η σταθερότητα της πληροφορίας, καθώς και η αντιπροσωπευτικότητα, καθορίζονται από την επιλεγμένη μεθοδολογία για την επιλογή και τη διαμόρφωσή της.

Η εκτίμηση του όγκου των πληροφοριών δεν είναι πολύ απλό πράγμα, δεδομένου ότι εξαρτάται από πολλούς παράγοντες, συχνά δύσκολο να επισημοποιηθεί. Ίδιες πληροφορίες για διαφορετικούς ανθρώπουςμπορεί να μεταφέρει εντελώς διαφορετικές ποσότητες πληροφοριών. Αυτό που ένα άτομο γνωρίζει εδώ και πολύ καιρό μπορεί να είναι εντελώς νέο για ένα άλλο. Η απλή συγκέντρωση σας επιτρέπει να λαμβάνετε περισσότερες πληροφορίες.

Υπάρχουν διάφορες πτυχές για την αξιολόγηση του όγκου των πληροφοριών.

Είναι δυνατή η αξιολόγηση της πληροφορίας με βάση το σημασιολογικό της περιεχόμενο (τιμή). Στην περίπτωση αυτή, φυσικά, είναι απαραίτητο να καθοριστεί το κριτήριο της αξίας. Για παράδειγμα, για να μετρήσετε το σημασιολογικό περιεχόμενο των πληροφοριών, μπορείτε να χρησιμοποιήσετε μέτρο θησαυρού, αντικατοπτρίζοντας την ικανότητα του παραλήπτη της πληροφορίας να αντιλαμβάνεται το εισερχόμενο μήνυμα. Στη συνέχεια, η ποσότητα των πληροφοριών που λαμβάνονται είναι μια ορισμένη συνάρτηση J=f(S * ,S p), όπου S * είναι το σημασιολογικό περιεχόμενο των πληροφοριών στο μήνυμα, S p είναι ο θησαυρός του χρήστη, που μετράται με την ποσότητα των πληροφοριών που αντιλαμβάνονται αυτόν.

Εάν χρησιμοποιούνται πληροφορίες για τη διαχείριση της επίλυσης ενός συγκεκριμένου προβλήματος, τότε η αξία των πληροφοριών μπορεί να εκτιμηθεί από τη διαφορά στο αποτέλεσμα, για παράδειγμα, οικονομικό, χωρίς να λαμβάνονται υπόψη και να λαμβάνονται υπόψη οι πληροφορίες στο ληφθέν μήνυμα.

Για πρώτη φορά, τα θέματα αξιολόγησης του όγκου των πληροφοριών μελετήθηκαν διεξοδικά από τους R. Hartley και K.E.

Ας πούμε ότι το σχολείο έχει οκτώ τάξεις (1, 2, ..., 8) και πρέπει να μάθουμε σε ποια τάξη σπουδάζει ο Σάσα Ιβάνοφ κάνοντας ερωτήσεις σχετικά με τον αριθμό της τάξης και λαμβάνοντας απαντήσεις όπως «ναι» ή «όχι». ” Είναι εύκολο να δείξουμε ότι ο ελάχιστος αριθμός ερωτήσεων είναι τρεις. Για παράδειγμα, μπορείτε πρώτα να ρωτήσετε: είναι ο αριθμός της τάξης μεγαλύτερος από το 4; Εάν η απάντηση είναι "όχι", πρέπει να ρωτήσετε: είναι ο αριθμός της τάξης μεγαλύτερος από 2; Αφού απαντήσετε, απλώς κάντε μια ακόμη ερώτηση και το πρόβλημα θα λυθεί. Μπορεί να προταθεί η εκτίμηση του όγκου των πληροφοριών σχετικά με τον αριθμό τάξης στην οποία σπουδάζει ο Sasha Ivanov, με βάση τον ελάχιστο αριθμό ερωτήσεις που τέθηκαν. ΣΕ σε αυτή την περίπτωσηπαίρνουμε την τιμή 3.

Μια παρόμοια ιδέα χρησιμοποιήθηκε από τον Αμερικανό μηχανικό R. Hartley, ο οποίος το 1928 πρότεινε την εκτίμηση του όγκου των πληροφοριών χρησιμοποιώντας τον τύπο

όπου J είναι η ποσότητα πληροφοριών σε ένα από τα N εξίσου πιθανά μηνύματα. Είναι εύκολο να δούμε ότι όταν αντικαθιστούμε N=8 (N είναι ο αριθμός των κλάσεων) στον τύπο του Hartley, παίρνουμε την τιμή 3. Στην πραγματικότητα, σε αυτήν την περίπτωση, η ποσότητα των πληροφοριών είναι ίση με τον αριθμό των bit που απαιτούνται για την κωδικοποίηση δυάδικος αριθμόςμέγιστος αριθμός κλάσης (δηλαδή τιμή N).

Όταν εργάζεστε με πληροφοριακά συστήματαΟι πληροφορίες που λαμβάνονται συχνά μετρώνται από την ποσότητα της μνήμης του υπολογιστή που απαιτείται για την αποθήκευσή τους. Σε αυτή την περίπτωση, χρησιμοποιείται ο τύπος του Hartley.

Μια πιο γενική και αυστηρή θεωρία ποσοτικοποίησηπληροφορίες δόθηκαν από τον Αμερικανό επιστήμονα Claude Elwood Shannon το 1948.

Πρότεινε να αξιολογηθεί ο όγκος των πληροφοριών αριθμητικό χαρακτηριστικό, αντικατοπτρίζοντας το επίπεδο αβεβαιότητας (ελλιπής γνώσης) που εξαφανίζεται μετά τη λήψη του μηνύματος. Ο Shannon πρότεινε να ονομαστεί το μέτρο της αβεβαιότητας που μειώνεται κατά τη μετάδοση πληροφοριών εντροπία(αυτός ο όρος εμφανίστηκε αρχικά στη θερμοδυναμική· στη στατιστική φυσική, η εντροπία θεωρείται ως μέτρο της πιθανότητας ενός συστήματος να βρίσκεται σε αυτό το κράτος). Προφανώς, ο όγκος των πληροφοριών εξαρτάται από την πιθανότητα λήψης ενός μηνύματος για ένα συγκεκριμένο γεγονός. Έτσι, αν γνωρίζαμε την ηλικία του Σάσα Ιβάνοφ, τότε είναι πολύ πιθανό να απαιτούνται λιγότερες ερωτήσεις για τον προσδιορισμό της τάξης.

Εάν, ως αποτέλεσμα της λήψης ενός μηνύματος, επιτευχθεί πλήρης σαφήνεια σχετικά με το αντικείμενο, τότε η εντροπία γίνεται ίση με το μηδέν.

Ας υποθέσουμε ότι αποστέλλεται ένα μήνυμα με πληροφορίες για ένα συγκεκριμένο σύστημα Χ. Αφήστε την αβεβαιότητα της γνώσης του παραλήπτη για το σύστημα Χ(πριν λάβετε το μήνυμα) καθορίζεται από την εντροπία H( Χ). Μετά τη λήψη του μηνύματος, η εντροπία έγινε H * ( Χ). Ο όγκος των πληροφοριών που ελήφθησαν σε αυτήν την περίπτωση J( Χ) = H( Χ) – N * ( Χ). Εάν, μετά τη λήψη του μηνύματος, επιτυγχάνεται πλήρης σαφήνεια σχετικά με το σύστημα Χ, μετά Ν*( Χ) = 0 και, κατά συνέπεια, J( Χ) = H( Χ).

Η μετάδοση διακριτών μηνυμάτων μπορεί πάντα να περιοριστεί στη μετάδοση των αντίστοιχων αριθμών. Ακόμα κι αν οι πληροφορίες αντανακλούν ποιοτικά διαφορετικά κράτη(φαινόμενα), τότε με την αρίθμησή τους, η μετάδοση των μηνυμάτων μπορεί να μειωθεί στη μετάδοση των αντίστοιχων αριθμών. Έτσι, κατά τη μετάδοση κειμένου, μπορείτε να αριθμήσετε τα γράμματα του αλφαβήτου και να μεταδώσετε αριθμούς. Οποιαδήποτε πληροφορία βρίσκεται στη μνήμη του υπολογιστή είναι επίσης ένα σύνολο δυαδικών αριθμών.

Κατά την εξαγωγή τύπων για την εκτίμηση του όγκου των πληροφοριών και του μέτρου της αβεβαιότητας, ο Shannon προχώρησε από τις ακόλουθες σκέψεις.

Αφήστε την πηγή των διακριτών μηνυμάτων να παράγει μια ακολουθία στοιχειωδών αριθμητικών μηνυμάτων (x 1, x 2, ..., x m), καθένα από τα οποία αντιστοιχεί σε μία από τις πιθανές καταστάσεις του συστήματος Χ. Τότε η συλλογή αυτών των στοιχειωδών μηνυμάτων μπορεί να ονομαστεί αλφάβητο και ο αριθμός m μπορεί να ονομαστεί όγκος του αλφαβήτου. Κατά τη μετάδοση κειμένου, το στοιχειώδες μήνυμα είναι ένα γράμμα του συνηθισμένου αλφαβήτου. κατά τη μετάδοση εντολών, το αλφάβητο θα είναι μια λίστα με πιθανές εντολές. κατά τη μετάδοση ενός μηνύματος σχετικά με την κατάσταση του συστήματος - μια λίστα πιθανών καταστάσεων συστήματος κ.λπ.

Ας υποθέσουμε ότι με τη λήψη του συμβόλου x i η κατάσταση της πηγής του μηνύματος (σύστημα X) τη στιγμή της μετάδοσης καθορίζεται μοναδικά. Όσο μικρότερη είναι η πιθανότητα P i της κατάστασης x i, τόσο περισσότερες πληροφορίες θα λάβουμε όταν λάβουμε το σύμβολο x i (S P i = 1, P i £ 1). Εάν η κατάσταση της πηγής ήταν ήδη γνωστή, τότε η λήψη του συμβόλου x i δεν δίνει κανένα πρόσθετες πληροφορίες(δηλαδή οι πληροφορίες που λαμβάνονται είναι μηδενικές). Με άλλα λόγια, η ποσότητα της πληροφορίας που μεταφέρεται από το σύμβολο x i πρέπει να είναι συνάρτηση μιας a priori (ήδη διαθέσιμης πριν από τη μετάδοση) πληροφοριών σχετικά με την πιθανότητα Pi ότι η πηγή ήταν στην κατάσταση xi τη στιγμή της μετάδοσής της.

Η αλλαγή στην εντροπία κατά τη λήψη του συμβόλου x i K. Shannon πρότεινε τον υπολογισμό χρησιμοποιώντας τον τύπο

J(х i) = - К 0 ×log а P i ,

όπου ο συντελεστής K 0 και η βάση του λογαρίθμου (α) καθορίζουν τη μονάδα μέτρησης της ποσότητας της πληροφορίας. Για να είναι θετική η εντροπία, τοποθετείται ένα πρόσημο «-» μπροστά από τον τύπο (ο λογάριθμος είναι αρνητικός για τους αριθμούς<1).

Γενικά, τα σύμβολα έχουν διαφορετικές πιθανότητες. Στη συνέχεια, η θεωρία πιθανοτήτων προτείνει τη χρήση της μέσης τιμής για εκτιμήσεις, η οποία ορίζεται ως το άθροισμα των γινομένων των τιμών των μεμονωμένων παραμέτρων και της πιθανότητας τους. Επομένως, ο τελικός τύπος του K. Shannon για την εντροπία μιας πηγής μηνύματος έχει τη μορφή

H(X) = - K 0 åP i log a P i .

Αν υποθέσουμε ότι όλες οι καταστάσεις του συστήματος Χ είναι εξίσου πιθανές (δηλαδή P i = 1/m), τότε η εντροπία m

H(X) = - K 0 å[(1/m)∙log a 1/m] = K 0 log a m.

Δεν είναι δύσκολο να δείξουμε ότι στον τύπο του Shannon η τιμή H(X) είναι πάντα £ log a m. Είναι ίσο με το log a m μόνο στην περίπτωση που όλες οι πιθανότητες P i είναι ίδιες (δηλαδή P i =1/m). Από τη σκοπιά της θεωρίας πιθανοτήτων, η τελευταία δήλωση εξηγείται από το γεγονός ότι η γνώση των πιθανοτήτων μας δίνει κάποιες επιπλέον εκ των προτέρων γνώσεις σχετικά με τις πληροφορίες που λαμβάνουμε με το σύμβολο. Η άγνοια των πιθανοτήτων μας αναγκάζει να υποθέσουμε ότι όλα τα σύμβολα είναι εξίσου πιθανά, δηλ. μέγιστη εντροπία (μέγιστη άγνοια) εμφανίζεται όταν P i =1/m.

Οι τύποι για την εκτίμηση της ποσότητας πληροφοριών και της εντροπίας εισήχθησαν αξιωματικά με τις ακόλουθες παραδοχές:

1) Η εντροπία H είναι συνεχής ως προς τα ορίσματά της.

2) για P i = 1, η τιμή του J(x i) = 0;

3) εάν όλα τα γεγονότα είναι εξίσου πιθανά, τότε η εντροπία είναι μέγιστη και καθορίζεται από τον τύπο H max = log n, όπου n είναι ο αριθμός των πιθανών αποτελεσμάτων (γεγονότων).

4) εάν η επιλογή χωριστεί σε δύο διαδοχικά στάδια, τότε η αρχική τιμή της εντροπίας H θα είναι ένα σταθμισμένο άθροισμα μεμονωμένων τιμών. Αυτό σημαίνει ότι κατά τη διαδοχική μετάδοση των συμβόλων x i και x k, η ποσότητα πληροφοριών που εισάγεται από αυτό το ζεύγος συμβόλων είναι ίση με το άθροισμα των ποσοτήτων πληροφοριών που εισάγονται από το x i και προστίθενται από το x k.

Ας πάρουμε ως ένα την ποσότητα των πληροφοριών που περιέχονται στο μήνυμα ότι έχει συμβεί ένα από δύο εξίσου πιθανά ανεξάρτητα γεγονότα. Τότε, προφανώς, P i = ½ (i=1, 2) και ένα μήνυμα αρκεί για να έχουμε πλήρεις πληροφορίες για την κατάσταση του αντικειμένου. Επιπλέον, όταν φτάσει το μήνυμα x i, η εντροπία θα γίνει ίση με το μηδέν, δηλ. ποσότητα ληφθέντων πληροφοριών J(x i) = H(X).

Θα υποθέσουμε ότι υπό τις συνθήκες που παρουσιάζονται παραπάνω, ένα εισερχόμενο μήνυμα φέρνει μια μονάδα πληροφοριών. Τότε J(x i) = H(X) = - K 0 ∙(½× log a ½ + ½× log a ½)= K 0 ∙log a 2 = 1. Η παραπάνω ισότητα ισχύει για a=2 και K 0 = 1 . Εάν το σύστημα έχει m εξίσου πιθανές καταστάσεις, τότε λαμβάνουμε J(X) = log 2 m = N max. Το τελευταίο συγκεκριμένο αποτέλεσμα δεν είναι τίποτα άλλο από τη φόρμουλα του R. Hartley.

Ο τύπος J=log 2 m σας επιτρέπει στην πραγματικότητα να υπολογίσετε τη μέγιστη δυνατή ποσότητα πληροφοριών που λαμβάνετε κατά τη μετάδοση ενός χαρακτήρα (ένα μήνυμα).

Εάν η εντροπία H max είναι γνωστή και λαμβάνονται N σύμβολα από την πηγή μηνύματος, τότε η μέγιστη δυνατή ποσότητα πληροφοριών που μεταδίδονται με τα μηνύματα είναι N×H max.

Κατά τη μετάδοση ψηφιακών πληροφοριών, μια δυαδική μονάδα χρησιμοποιείται ως μονάδα μέτρησης εντροπίας - κομμάτι.

Ας χρησιμοποιήσουμε έναν δυαδικό κώδικα για να μεταδώσουμε γράμματα ενός αλφαβήτου που περιέχει n = 32 χαρακτήρες και όταν λαμβάνουμε ένα μήνυμα αναγνωρίζουμε μοναδικά το γράμμα. Εάν οι πιθανότητες εμφάνισης συμβόλων είναι οι ίδιες, τότε η μέγιστη εντροπία κατά τη μετάδοση και λήψη ενός συμβόλου

H max = log 2 32 = 5 (bit).

Αυτή η μέση πληροφορία ανά χαρακτήρα λήφθηκε με την υπόθεση του «απολύτως χαοτικού κειμένου», όταν η σειρά των γραμμάτων κατά τη μετάδοση είναι ανεξάρτητη.

Ας πούμε ότι σε ένα αλφάβητο χαρακτήρων Α αποστέλλονται μηνύματα με τη μορφή λέξεων μήκους L (συνήθως τα δεδομένα αποστέλλονται χρησιμοποιώντας ενιαίους ψηφιακούς κωδικούς, δηλαδή κωδικούς ίδιου μήκους). Σε αυτή την περίπτωση, N = A L είναι δυνατές διαφορετικές λέξεις. Στη συνέχεια, κατά τη μετάδοση μιας λέξης, ο παραλήπτης θα έχει πληροφορίες στο ποσό των

J = log 2 N = L log 2 A (bit).

Εάν οι πιθανότητες εμφάνισης δυαδικών συμβόλων είναι διαφορετικές, τότε η μέση μεταβολή της εντροπίας κατά τη λήψη ενός συμβόλου είναι:

H av = -(P 1 log P 1 + P 2 log P 2 + … + P m log P m) = -å P i log a P i .

Σε αυτήν την περίπτωση, η εντροπία ανά χαρακτήρα είναι H cf £ H max . Η διαφορά (H max – H avg) ονομάζεται πλεονάζουσα πληροφορία και η τιμή R = 1–H avg /H max - αναλογία πλεονασμού. Στην πραγματικότητα, ο πλεονασμός δείχνει πόσο επιμηκύνεται ένα μήνυμα από χαρακτήρες ενός δεδομένου αλφαβήτου σε σύγκριση με το ελάχιστο δυνατό μήκος. Για παράδειγμα, για κανονική ρωσική ομιλία H av = 1,5 bit. Επομένως, μια πηγή μηνύματος που βασίζεται στο ρωσικό αλφάβητο έχει έναν παράγοντα πλεονασμού

R ≈1–1,5/5 = 0,7.

Σημειώστε ότι στη γενική περίπτωση, για να διασφαλιστεί η αξιόπιστη μετάδοση δεδομένων μέσω καναλιών επικοινωνίας, είναι απαραίτητος ο πλεονασμός, καθώς τα μηνύματα ενδέχεται να παραμορφωθούν κατά τη μετάδοση. Η παρουσία πλεονασμού καθιστά δυνατή την κατανόηση της σημασίας του μηνύματος ακόμη και με την παρουσία παραμορφώσεων.

Στη ζωή, πολύ συχνά οι επόμενες πληροφορίες εξαρτώνται από την προηγούμενη, δηλ. υπάρχει μια ορισμένη πιθανότητα το σύμβολο x k να εμφανίζεται μετά το σύμβολο x i . Στη συνέχεια, όταν λάβετε το επόμενο γράμμα κάποιου κειμένου, μπορείτε να προβλέψετε τα επόμενα.

Ας εξετάσουμε τον ορισμό της εντροπίας στην περίπτωση όπου τα σύμβολα όχι μόνο έχουν διαφορετικές πιθανότητες P(x i), αλλά και εξαρτώνται το ένα από το άλλο. Ας συμβολίσουμε με P(x k /x i) την υπό όρους πιθανότητα εμφάνισης του συμβόλου x k αν το προηγούμενο ήταν x i. Στη συνέχεια, η ποσότητα των πληροφοριών που λαμβάνονται με το σύμβολο x i θα οριστεί ως η υπό όρους εντροπία

J(x k /x i) = -S.

Γενικά, τα σύμβολα έχουν διαφορετικές πιθανότητες. Τότε, η μέση ποσότητα πληροφοριών ή εντροπίας πηγής με αλληλοεξαρτώμενα και άνισα πιθανά σύμβολα είναι ίση με

H(X) = -S P(x i) ×S.

Τέλος, για εξίσου πιθανά αλλά αλληλοεξαρτώμενα σύμβολα παίρνουμε

H(X) = - 1 / m S ×S.

Η εντροπία της πηγής και η ποσότητα των πληροφοριών που λαμβάνονται με ένα σύμβολο φτάνει στο μέγιστο εάν τα σύμβολα είναι ανεξάρτητα και εξίσου πιθανά.

Κατά τη μετάδοση δεδομένων, το κανάλι επικοινωνίας υπόκειται σε παρεμβολές. Υπό την επιρροή τους, το σύμβολο x i μπορεί να αλλάξει σε ψευδές σύμβολο x j. Ας υποδηλώσουμε την πιθανότητα μιας τέτοιας αντικατάστασης με P(x i / x j), και την εντροπία των ψευδών συμβόλων με H(X/X*).

Στη συνέχεια, η ποσότητα των πληροφοριών που λαμβάνονται, λαμβάνοντας υπόψη τα σφάλματα μετάδοσης, καθορίζεται από τον τύπο

J(X/X*) =H(X) – H(X/X*).

Η τιμή του H(X/X*) καθορίζεται κατ' αναλογία με μια πηγή μηνύματος που παράγει αλληλοεξαρτώμενα και άνισα πιθανά σύμβολα.

Σε περίπτωση ισχυρής παρεμβολής, η πιθανότητα σφάλματος, που καθορίζεται από τις πιθανότητες μετάβασης P(x i / x j), μπορεί να φτάσει σε τιμές P osh = 0,5, που ισοδυναμεί με διακοπή καναλιού.

Παραπάνω συζητήσαμε τύπους για τον υπολογισμό του όγκου των πληροφοριών για την περίπτωση που τα μηνύματα μεταδίδονται σε διακριτή μορφή. Υπάρχουν ειδικοί τύποι για πηγές συνεχών μηνυμάτων, οι οποίοι χαρακτηρίζονται από το γεγονός ότι σε κάθε στιγμή t το μήνυμα x(t) μπορεί να λάβει άπειρο αριθμό τιμών με απειροελάχιστη πιθανότητα καθεμίας από αυτές.

Πρέπει να ειπωθεί ότι η ποσοτική αξιολόγηση των πληροφοριών δεν είναι ακόμα ένα πλήρως λυμένο πρόβλημα, αν και οι υπάρχουσες μέθοδοι χρησιμοποιούνται ευρέως για την αξιολόγηση της χωρητικότητας των δικτύων μετάδοσης δεδομένων, των δικτύων υπολογιστών, για την αξιολόγηση της θορύβου των δικτύων επικοινωνίας, για τον υπολογισμό των χαρακτηριστικών των βάσεων δεδομένων και μέθοδοι κωδικοποίησης κ.λπ.

2017 FD.ru

Διαχείριση δεδομένων ως περιουσιακό στοιχείο της επιχείρησης: ποιότητα δεδομένων και επιχειρηματικά αποτελέσματα

Τα δεδομένα θεωρούνται από καιρό ένα σημαντικό περιουσιακό στοιχείο μιας επιχείρησης. Επιπλέον, αυτό είναι ένα πολύ γρήγορα αναπτυσσόμενο περιουσιακό στοιχείο. Μόνο ο όγκος των δομημένων δεδομένων αυξάνεται κατά 40% ετησίως. Αν λάβουμε υπόψη όλα τα δεδομένα, συμπεριλαμβανομένων των μη δομημένων δεδομένων (δεδομένα από κοινωνικά δίκτυα, πηγές Διαδικτύου, καθώς και δεδομένα που δημιουργούνται αυτόματα), τότε η ετήσια ανάπτυξή τους υπολογίζεται περίπου στο 80%.

Αλλά αυτό το περιουσιακό στοιχείο χρησιμοποιείται πάντα αποτελεσματικά; Τι τίμημα πληρώνουν οι επιχειρήσεις για σφάλματα δεδομένων; Πώς να αξιολογήσετε σωστά την ποιότητα των δεδομένων και να δημιουργήσετε ένα αποτελεσματικό σύστημα διαχείρισης ποιότητας δεδομένων; Υπάρχουν επιτυχημένα παραδείγματα εφαρμογής ενός τέτοιου συστήματος στη ρωσική πρακτική;

Μερικά στατιστικά στοιχεία

Το 2015, η Experian διεξήγαγε μια μεγάλης κλίμακας μελέτη που κάλυπτε 1.239 επιχειρήσεις στις Ηνωμένες Πολιτείες, τη Γαλλία, την Αυστραλία, τη Γερμανία, την Ισπανία και την Ολλανδία. Το 83% παραδέχεται ότι χάνει έσοδα λόγω κακής ποιότητας δεδομένων και ελλιπούς πληρότητας και εάν η ποιότητα των δεδομένων ήταν στο υψηλότερο επίπεδο, η επιχείρηση θα μπορούσε να αυξήσει τα έσοδα κατά μέσο όρο κατά 15%.

Το χαμηλό επίπεδο ωριμότητας των διαδικασιών διαχείρισης δεδομένων αποδεικνύεται επίσης από το γεγονός ότι μόνο το 35% των εταιρειών διαχειρίζονται δεδομένα κεντρικά και περισσότερες από τις μισές (57%) εντοπίζουν σφάλματα δεδομένων εκ των υστέρων, αφού τα αναφέρουν οι εργαζόμενοι ή οι πελάτες. Και ενώ οι περισσότεροι οργανισμοί χρησιμοποιούν κάποιο είδος τεχνολογικής λύσης για την παρακολούθηση, την προετοιμασία και τον καθαρισμό, σχεδόν το ένα τρίτο των εταιρειών (29%) εξακολουθούν να ελέγχουν και να καθαρίζουν τα δεδομένα τους «με μη αυτόματο τρόπο». Το 77% των CIO θεωρούν σωστά τα δεδομένα ως ένα στρατηγικό πλεονέκτημα που υποχρησιμοποιείται εντός του οργανισμού.

Οι αναλυτές της Gartner διαπίστωσαν ότι η κακή ποιότητα δεδομένων είναι ο κύριος λόγος για τον οποίο το 40% των επιχειρηματικών πρωτοβουλιών αποτυγχάνει. Η ποιότητα των δεδομένων επηρεάζει επίσης τη λειτουργική αποτελεσματικότητα, την ικανότητα διαχείρισης κινδύνων και ευέλικτης απόκρισης σε εξωτερικούς παράγοντες μειώνοντας την παραγωγικότητα κατά 20%.

Επιπλέον, καθώς προχωράμε προς τις αυτοματοποιημένες διαδικασίες, η ποιότητα των δεδομένων είναι ο παράγοντας που περιορίζει την ποιότητα ολόκληρης της διαδικασίας. Τα σφάλματα δεδομένων έχει αποδειχθεί ότι μειώνουν την αποδοτικότητα της πληροφορικής κατά 10%.

Πώς να ερμηνεύσετε και να μετρήσετε την ποιότητα των δεδομένων;

Ποιότητα δεδομένων είναι η ικανότητα των δεδομένων να ικανοποιούν τις απαιτήσεις που τίθενται σε αυτά. Επιπλέον, σύμφωνα με τις βασικές αρχές της ποιότητας δεδομένων (που ορίζονται από τα πρότυπα της σειράς ISO/TS 8000, GOST R 56214–2014/ISO/TS 8000-1:2011), η έννοια της ποιότητας δεδομένων επηρεάζει μόνο εκείνα τα δεδομένα που συμμετέχουν στη λήψη οποιασδήποτε διοικητικής απόφασης. Τα ποιοτικά δεδομένα αποτρέπουν την επανεμφάνιση ελαττωμάτων και μειώνουν το υπερβολικό κόστος.

Οι παραδοσιακοί ορισμοί της ποιότητας δεδομένων επικεντρώνονται σε ποιες ιδιότητες των δεδομένων, όπως:

  • Πληρότητα
  • Ακρίβεια
  • Επικαιρότητα παράδοσης
  • Προέλευση

Το πρότυπο ISO/IEC25012:2008 έχει επεκτείνει σημαντικά τη λίστα των χαρακτηριστικών ποιότητας δεδομένων για να περιλαμβάνει χαρακτηριστικά που εξαρτώνται από το σύστημα του υπολογιστή (αποτελεσματικότητα, διαθεσιμότητα, φορητότητα, δυνατότητα ανάκτησης, εμπιστευτικότητα κ.λπ.). Δέκα από τα δεκαπέντε χαρακτηριστικά ποιότητας δεδομένων εξαρτώνται από το σύστημα, υπογραμμίζοντας τη σημασία της επιλογής του σωστού εργαλείου διαχείρισης ποιότητας δεδομένων.

Οι μετρήσεις χρησιμοποιούνται για την αντικειμενική αξιολόγηση της ποιότητας των δεδομένων. Αυτοί μπορούν να είναι είτε απευθείας μετρούμενοι βασικοί δείκτες σύμφωνα με ορισμένους κανόνες, είτε πιο σύνθετες συνδυασμένες μετρήσεις που υπολογίζονται με βάση τις σταθμισμένες μέσες τιμές των βασικών δεικτών.

Παραδείγματα τέτοιων μετρήσεων περιλαμβάνουν δείκτες διαθεσιμότητας δεδομένων, δείκτες ορθότητας δεδομένων, δείκτες κόστους διασφάλισης ποιότητας και δείκτες κόστους διόρθωσης σφαλμάτων.

Για την εφαρμογή μετρήσεων, πρέπει να υπάρχουν κανόνες επαλήθευσης που να επισημοποιούν τη διαδικασία μέτρησης και υπολογισμού δεικτών. Ωστόσο, οι μετρήσεις και οι κανόνες από μόνα τους δεν αρκούν για να επιτύχουν ένα απτό αποτέλεσμα που επηρεάζει την οικονομική απόδοση ενός οργανισμού, απαιτείται μια συστηματική προσέγγιση στη διαχείριση της ποιότητας των δεδομένων.

Συστηματική διαχείριση ποιότητας δεδομένων

Η διαχείριση ποιότητας δεδομένων βασίζεται σε τρία στοιχεία: οργανωτική δομή, διαδικασίες και εργαλεία διαχείρισης ποιότητας δεδομένων.

Η οργανωτική δομή διασφαλίζει την κατανομή των ρόλων και των υπευθύνων για τις διαδικασίες εργασίας με δεδομένα. Οι μεγάλες εταιρείες μιλούν ολοένα και περισσότερο για τον προσδιορισμό του ρόλου του CDO (Chief Data Officer) και την οργάνωση μιας υπηρεσίας CDO που τελεί υπό τον ίδιο. Ο διευθυντής πληροφοριών διαχειρίζεται τη δομή των κατανεμημένων δεδομένων στην επιχείρηση, η υπηρεσία CDO διασφαλίζει τη λειτουργική κυκλοφορία των δεδομένων, παρακολουθεί τυχόν ενέργειες με δεδομένα και επίσης ελέγχει τη χρήση των στοιχείων ενεργητικού της εταιρείας.

Οι διαδικασίες διαχείρισης ποιότητας δεδομένων (σύμφωνα με το GOST R 56215-2014 και το ISO/TS 8000-150:2011) χωρίζονται σε τρεις ομάδες:

  • διαδικασίες για την εκτέλεση εργασιών σε δεδομένα,
  • συνεχείς διαδικασίες ποιοτικού ελέγχου δεδομένων
  • διαδικασίες για τη βελτίωση της ποιότητας των δεδομένων.

Οι διαδικασίες εκτέλεσης λειτουργιών σε δεδομένα περιλαμβάνουν τη διαχείριση της δομής δεδομένων εντός του οργανισμού, συμπεριλαμβανομένης της λήψης υπόψη της χρήσης δεδομένων σε κατανεμημένα συστήματα, την ανάπτυξη και κατασκευή ενός σχήματος δεδομένων, την εκτέλεση λειτουργιών σε δεδομένα (δημιουργία, αναζήτηση, διαγραφή, ενημέρωση).

Οι διαδικασίες συνεχούς ποιοτικού ελέγχου στοχεύουν στον εντοπισμό σφαλμάτων δεδομένων και περιλαμβάνουν σχεδιασμό ποιότητας, καθορισμό μετρήσεων ποιότητας και κανόνες επαλήθευσης και ρύθμιση διαδικασιών αξιολόγησης δεδομένων σύμφωνα με καθορισμένα κριτήρια.

Οι διαδικασίες βελτίωσης της ποιότητας των δεδομένων πρέπει να διασφαλίζουν ότι τα σφάλματα δεδομένων διορθώνονται και εξαλείφονται οι αιτίες τους.

Και τέλος, το τρίτο στοιχείο είναι τα εργαλεία διαχείρισης ποιότητας δεδομένων. Η αγορά προσφέρει ένα ευρύ φάσμα συστημάτων εργαλείων για εργασία με δεδομένα. Αυτά περιλαμβάνουν προϊόντα κατηγορίας Data Quality, κύρια συστήματα διαχείρισης δεδομένων, εξειδικευμένες λύσεις για εργασία με αναλυτικά στοιχεία πελατών, πολυάριθμες πλατφόρμες ενοποίησης με πλούσιο οπλοστάσιο εργαλείων ETL και βιομηχανικές λύσεις.

Ο έλεγχος ποιότητας δεδομένων εκτελείται παραδοσιακά μετά την εξαγωγή των δεδομένων από την πηγή προτού τοποθετηθούν στην αποθήκη δεδομένων σε αυτό που είναι γνωστό ως διαδικασία ETL. Αυτή η διαδικασία, κατά κανόνα, περιλαμβάνει τόσο τη διενέργεια ενός αριθμού ελέγχων δεδομένων συστήματος (παρακολούθηση ακεραιότητας, συνέπεια, ορθότητα συμπλήρωσης χαρακτηριστικών) όσο και τη διενέργεια πρόσθετων επιχειρηματικών ελέγχων (παρακολούθηση σύγκλισης υπολοίπων και κύκλου εργασιών, συμμόρφωση προσωπικών λογαριασμών με ισολογισμούς, και τα λοιπά.). Η διαδικασία ETL μπορεί επίσης να εκτελέσει λειτουργίες εμπλουτισμού και ταξινόμησης δεδομένων, γεγονός που αυξάνει την αξία των δεδομένων για μεταγενέστερη ανάλυση. Τα αποτελέσματα των διαδικασιών ETL καταγράφονται, τα προβλήματα δεδομένων αναλύονται και διορθώνονται. Η χρήση εξειδικευμένων λύσεων Ποιότητας Δεδομένων απλοποιεί τη ρύθμιση των διαδικασιών ελέγχου και διευκολύνει την παρακολούθηση των αποτελεσμάτων της διαδικασίας. Συνήθως, τέτοιες λύσεις παρέχουν ειδικά γραφικά εργαλεία που αντικατοπτρίζουν τα ποιοτικά χαρακτηριστικά των δεδομένων, όπως η πληρότητα, η συνέπεια, η συνοχή, η ακρίβεια, η ακεραιότητα και η απουσία αντιγράφων. Τέτοιες λύσεις παρέχονται τόσο από ξένες όσο και από εγχώριες εταιρείες πληροφορικής. Σε αντίθεση με τους δυτικούς προμηθευτές, οι Ρώσοι πωλητές προσφέρουν όλο και περισσότερο πιο προσιτές λύσεις για τη διαχείριση ποιότητας δεδομένων. Έτσι, η Intersoft Lab έχει αναπτύξει μια ειδική ενότητα για την αξιολόγηση της ποιότητας των δεδομένων ως μέρος της πλατφόρμας αποθήκης δεδομένων «». Η ενότητα παρέχει τη συλλογή πληροφοριών σχετικά με τους δείκτες ποιότητας των δεδομένων που συγκεντρώνονται στην αποθήκη δεδομένων, καθώς και πληροφορίες σχετικά με τα γεγονότα της εξάλειψης ελαττωμάτων στα δεδομένα. Στους χρήστες προσφέρονται εργαλεία για την ανάλυση δεικτών ποιότητας δεδομένων σε διάφορες αναλυτικές ενότητες, συμπεριλαμβανομένης της ανάλυσης της δυναμικής των αλλαγών στην ποιότητα των δεδομένων, καθώς και της ανάλυσης του κόστους εργασίας για την εξάλειψη ελαττωμάτων στα δεδομένα ταξινομημένα κατά τύπους σφαλμάτων, κλάδους, εκτελεστές, περιόδους και άλλα αναλυτικές ενότητες.

Ένα παράδειγμα από την εγχώρια πρακτική διαχείρισης ποιότητας δεδομένων

Σήμερα, η πλειονότητα των έργων που αντιμετωπίζουν ζητήματα ποιοτικού ελέγχου δεδομένων σχετίζονται με την επιστήμη των δεδομένων ή την εφαρμογή αναλυτικών εφαρμογών, συμπεριλαμβανομένων εφαρμογών για τη διαχείριση κινδύνου, τις σχέσεις με τους πελάτες και την αναφορά. Το πιο ενδεικτικό παράδειγμα με αυτή την έννοια είναι ο χρηματοοικονομικός κλάδος, ο οποίος έχει εξαιρετικά υψηλές απαιτήσεις για την ποιότητα των αναλυτικών στοιχείων πελατών και απαιτήσεις για την ποιότητα των αναφορών που παρέχονται στη ρυθμιστική αρχή.

Επιπλέον, η Κεντρική Τράπεζα έχει ορίσει νομικά απαιτήσεις για την ποιότητα των δεδομένων από τα πληροφοριακά συστήματα που χρησιμοποιούνται για τον υπολογισμό του ύψους του πιστωτικού κινδύνου με βάση τις εσωτερικές αξιολογήσεις.

Ο Αναπληρωτής Πρόεδρος του Διοικητικού Συμβουλίου της PJSC Bank St. Η διασφάλιση ποιότητας είναι πάντα χαμηλότερη από το κόστος διόρθωσης σφαλμάτων. Δραστηριότητες για τη διασφάλιση της ποιότητας των δεδομένων ξεκίνησαν ως μέρος ενός έργου για την κατασκευή μιας εταιρικής αποθήκης δεδομένων και κατέληξαν στη δημιουργία μιας υπηρεσίας ποιότητας δεδομένων, η οποία εξακολουθεί να είναι σπάνια στη ρωσική πρακτική. Σήμερα η υπηρεσία αυτή λειτουργεί με επιτυχία ως τμήμα του Τμήματος Πληροφορικής. Έχουν θεσπιστεί τακτικές διαδικασίες παρακολούθησης και διόρθωσης σφαλμάτων. Πλήρης και τακτικός έλεγχος δεδομένων παρέχεται σε όλα τα πληροφοριακά συστήματα που παρέχουν δεδομένα στην αποθήκη δεδομένων. Το πείραμα για την ανάπτυξη μιας υπηρεσίας ποιότητας δεδομένων ολοκληρώθηκε με επιτυχία, σε μεγάλο βαθμό χάρη στην οργανωτική και τεχνολογική βοήθεια του προμηθευτή της αποθήκης δεδομένων, Intersoft Lab, που παρείχε τεχνολογική υποστήριξη για τις διαδικασίες επαλήθευσης και εμπλουτισμού δεδομένων. Τι πήραμε τελικά; Ο αριθμός των σφαλμάτων δεδομένων έχει μειωθεί σημαντικά. Είναι σημαντικό ότι μόνο στο δανειακό χαρτοφυλάκιο ο αριθμός των τύπων σφαλμάτων μειώθηκε κατά 15 φορές. Τα σοβαρά σφάλματα που επηρεάζουν την οικονομική απόδοση αποκλείονται πλήρως. Η εμπιστοσύνη των χρηστών στις αποθήκες δεδομένων έχει αυξηθεί και μαζί με αυτήν η ποιότητα των αποφάσεων διαχείρισης. Εκείνοι. Έχει δημιουργηθεί ένα αποτελεσματικό σύστημα διαχείρισης ποιότητας δεδομένων που λειτουργεί προς το συμφέρον όλων των τμημάτων».

Έτσι, η εφαρμογή της επιχείρησης αυξάνει την αξία των εταιρικών δεδομένων ως περιουσιακό στοιχείο χρήσιμο για την υποστήριξη της επίτευξης των επιχειρηματικών στόχων.



Συνιστούμε να διαβάσετε

Κορυφή