Μετά τη σάρωση, μεταφέρετε το πρόγραμμα στο Word. Πρακτική βοήθεια: πώς να μεταφέρετε ένα σαρωμένο έγγραφο στο Word

Εργαλείο 09.07.2019
Επισκόπηση προγράμματος Η έκδοση υπολογιστή του Microsoft Excel Viewer θα επιτρέψει...

Chercher

Εργαλείο

Αυτή η δυνατότητα είναι διαθέσιμη μόνο σε συνδρομητές Hipdf Pro

Γλώσσα εγγράφου: (( ocrLanguage.join(", ") ))
Μορφή εξόδου: (( outputType ))
Ρυθμίσεις


Μετατρέπω

Μέγιστο μέγεθος αρχείου!

Το αρχείο που επιλέξατε υπερβαίνει το μέγιστο όριο μεγέθους αρχείου των 10 MB. Δεν προστέθηκε.

Αν θέλετε να αυξήσετε το όριο σας στα 20 MB, εγγραφείτε δωρεάν. Και, αν χρειάζεστε περισσότερα, μπορείτε να εγγραφείτε στο Hipdf Pro και να αποκτήσετε έως και 50 MB.

Είσοδος Εγγραφή

Μέγιστο μέγεθος αρχείου!

Το αρχείο που επιλέξατε υπερβαίνει το μέγιστο όριο μεγέθους αρχείου των 20 MB. Δεν προστέθηκε.

Αν θέλετε να αυξήσετε το όριο στα 50 MB, κάντε αναβάθμιση σε Hipdf Pro.

(( mutiExceddsTip ))

Το αρχείο που επιλέξατε υπερβαίνει τον μέγιστο επιτρεπόμενο αριθμό σελίδων. Δεν προστέθηκε.

Εάν θέλετε να αυξήσετε τα όριά σας σε 100 σελίδες, εγγραφείτε δωρεάν. Και, αν χρειάζεστε περισσότερα, μπορείτε να εγγραφείτε στο Hipdf Pro και να αποκτήσετε έως και 2000 σελίδες.

Είσοδος Εγγραφή

Υπέρβαση του μέγιστου αριθμού σελίδων!

Το αρχείο που επιλέξατε υπερβαίνει τον μέγιστο επιτρεπόμενο αριθμό σελίδων. Δεν προστέθηκε.

Εάν θέλετε να αυξήσετε το όριο στις 2000 σελίδες, κάντε αναβάθμιση στο πακέτο Hipdf Pro.

(( mutiExceddsTip ))

Εγγραφείτε στο Hipdf Pro Όχι, ευχαριστώ

Το έχουμε ήδη συζητήσει μαζί σας. Αλλά μπορείτε να αναγνωρίσετε κείμενο όχι μόνο χρησιμοποιώντας το πρόγραμμα. Αυτό μπορεί να γίνει χρησιμοποιώντας διαδικτυακές υπηρεσίες, χωρίς να έχετε κανένα πρόγραμμα στον υπολογιστή σας.

Και πράγματι, γιατί να εγκαταστήσετε προγράμματα εάν πρέπει να αναγνωρίσετε κείμενο μία φορά και στο μέλλον δεν πρόκειται να χρησιμοποιήσετε αυτό το πρόγραμμα; Ή πρέπει να το κάνετε αυτό μία φορά το μήνα; Σε αυτή την περίπτωση, δεν υπάρχει ανάγκη για επιπλέον πρόγραμμα στον υπολογιστή.

Ας δούμε μερικές υπηρεσίες με τις οποίες μπορείτε Αναγνώριση κειμένου από εικόνες δωρεάν, εύκολα και γρήγορα.

Δωρεάν Online OCR

Μια πολύ καλή υπηρεσία για την αναγνώριση κειμένου από εικόνες στο διαδίκτυο είναι η υπηρεσία Δωρεάν Online OCR. Δεν απαιτεί εγγραφή και αναγνωρίζει κείμενο από εικόνες σχεδόν οποιασδήποτε μορφής. λειτουργεί με 58 γλώσσες. Η αναγνώριση κειμένου του είναι εξαιρετική.

Αυτή η υπηρεσία είναι εύκολη στη χρήση. Όταν μεταβείτε σε αυτό, θα έχετε μόνο δύο επιλογές: να ανεβάσετε ένα αρχείο από τον υπολογιστή σας ή να επικολλήσετε τη διεύθυνση URL της εικόνας εάν βρίσκεται στο Διαδίκτυο.

Εάν η εικόνα σας βρίσκεται στον υπολογιστή σας, κάντε κλικ στο κουμπί Επιλέξτε αρχείο , μετά επιλέξτε το αρχείο σας και κάντε κλικ στο κουμπί Μεταφόρτωση. Θα δείτε το αρχείο γραφικών σας παρακάτω και ένα κουμπί πάνω από αυτό OCR. Κάντε κλικ σε αυτό το κουμπί και θα λάβετε το κείμενο που μπορείτε να βρείτε στο κάτω μέρος της σελίδας.

Διαδικτυακό OCR Net

Είναι επίσης μια αρκετά καλή υπηρεσία που σας επιτρέπει να αναγνωρίζετε κείμενα από εικόνες στο διαδίκτυο δωρεάν και χωρίς εγγραφή. Υποστηρίζει 48 γλώσσες, συμπεριλαμβανομένων των ρωσικών, κινέζικων, κορεατικών και ιαπωνικών. Για να ξεκινήσετε να εργάζεστε με αυτό, μεταβείτε στο Online OCR, πατήστε το κουμπί Επιλέξτε αρχείοκαι επιλέξτε το αρχείο στον υπολογιστή σας. Υπάρχουν περιορισμοί μεγέθους - το αρχείο δεν πρέπει να ζυγίζει περισσότερο από 5 MB.

Στα διπλανά πεδία, επιλέξτε τη γλώσσα και την επέκταση του εγγράφου κειμένου στην οποία θα βρίσκεται το κείμενο που λαμβάνεται από την εικόνα. Μετά από αυτό, εισάγετε το captcha παρακάτω και κάντε κλικ στο κουμπί Μετατρέπωδικαίωμα.

Στο κάτω μέρος θα υπάρχει κείμενο που μπορείτε να αντιγράψετε και πάνω από το κείμενο θα υπάρχει ένας σύνδεσμος για τη λήψη ενός αρχείου με αυτό το κείμενο.

ABBYY FineReader Online

Μια πολύ καλή υπηρεσία όσον αφορά την ευελιξία της. Επί ABBYY FineReader OnlineΜπορείτε όχι μόνο να αναγνωρίσετε κείμενο από εικόνες, αλλά και να μεταφράσετε έγγραφα, να μετατρέψετε πίνακες από εικόνες σε Excel και από σαρώσεις.

Αυτή η υπηρεσία έχει εγγραφή, αλλά μπορείτε επίσης να συνδεθείτε μέσω του κοινωνικού δικτύου Facebook, των υπηρεσιών Google+ ή του λογαριασμού Microsoft.

Το πλεονέκτημα αυτής της προσέγγισης είναι ότι τα έγγραφα που δημιουργήσατε θα αποθηκευτούν στον λογαριασμό σας για 14 ημέρες και ακόμη και αν τα διαγράψετε από τον υπολογιστή σας, μπορείτε να επιστρέψετε στην υπηρεσία και να τα κατεβάσετε ξανά.

Online OCR Ru

Μια υπηρεσία παρόμοια με την προηγούμενη, με πληροφορίες στα ρωσικά. Πώς λειτουργεί η υπηρεσία Online OCRτο ίδιο όπως όλοι οι άλλοι - κάντε κλικ στο κουμπί Επιλογή αρχείου, μεταφορτώστε μια φωτογραφία, επιλέξτε τη γλώσσα και τη μορφή εξόδου του εγγράφου κειμένου και κάντε κλικ στο κουμπί Αναγνώριση κειμένου.

Εκτός από την αναγνώριση κειμένου από εικόνες, η υπηρεσία παρέχει τη δυνατότητα μετατροπής εικόνων σε PDF, Excel, HTML και άλλες μορφές και η δομή και η διάταξη του εγγράφου θα αντιστοιχούν σε αυτήν της εικόνας.

Αυτή η υπηρεσία έχει επίσης εγγραφή και τα αρχεία που δημιουργείτε με τη βοήθειά της θα αποθηκευτούν στον προσωπικό σας λογαριασμό.

Αυτές οι υπηρεσίες αναγνώρισης κειμένου εικόνας είναι, κατά τη γνώμη μου, οι καλύτερες. Ελπίζω να είναι χρήσιμα και σε εσάς. Επίσης, ίσως δεν έχω καλύψει όλες τις καλές υπηρεσίες. Περιμένω τα σχόλιά σας σχετικά με το πόσο σας άρεσαν αυτές οι υπηρεσίες, ποιες υπηρεσίες χρησιμοποιείτε και ποιες από αυτές είναι, κατά τη γνώμη σας, οι πιο βολικές.

Μπορείτε να λάβετε πιο λεπτομερείς πληροφορίες στις ενότητες «Όλα τα μαθήματα» και «Βοηθητικά προγράμματα», στις οποίες μπορείτε να έχετε πρόσβαση μέσω του επάνω μενού του ιστότοπου. Σε αυτές τις ενότητες, τα άρθρα ομαδοποιούνται ανά θέμα σε μπλοκ που περιέχουν τις πιο λεπτομερείς (όσο είναι δυνατόν) πληροφορίες για διάφορα θέματα.

Μπορείτε επίσης να εγγραφείτε στο blog και να μάθετε για όλα τα νέα άρθρα.
Δεν θα πάρει πολύ. Απλώς κάντε κλικ στον παρακάτω σύνδεσμο:

Το λογισμικό OCR σάς επιτρέπει να μετατρέπετε φωτογραφημένα ή σαρωμένα έγγραφα απευθείας σε προτάσεις.

Το γεγονός είναι ότι το κείμενο στην εικόνα παρουσιάζεται με τη μορφή ράστερ, ένα σύνολο κουκκίδων. Το αναφερόμενο λογισμικό μετατρέπει ένα σύνολο κουκκίδων σε πλήρες κείμενο, διαθέσιμο για επεξεργασία και αποθήκευση.

Η αναγνώριση γραμμάτων έχει σχεδιαστεί για τη βελτιστοποίηση της διαδικασίας ψηφιοποίησης έντυπων ή χειρόγραφων βιβλίων και εγγράφων.

Αυτή η μέθοδος ψηφιοποίησης είναι τάξεις μεγέθους ταχύτερη από την ταχύτητα της χειροκίνητης πληκτρολόγησης από μια εικόνα. Χρησιμοποιείται ευρέως στην ψηφιοποίηση βιβλιοθηκών και αρχείων. Στη συνέχεια, θα εξετάσουμε τους πέντε καλύτερους εκπροσώπους της οικογένειας παρόμοιων προγραμμάτων.

ABBYY FineReader 10

Το FineReader είναι ο αδιαμφισβήτητος ηγέτης μεταξύ όλων των προγραμμάτων που αναγνωρίζουν κείμενο σε εικόνες. Συγκεκριμένα, δεν υπάρχει λογισμικό που να επεξεργάζεται το κυριλλικό αλφάβητο πιο καθαρά. Γενικά, το FineReader έχει 179 γλώσσες, το κείμενο στις οποίες αναγνωρίζεται με εξαιρετική επιτυχία.

Το μόνο πράγμα που μπορεί να απογοητεύσει τους χρήστες είναι ότι το πρόγραμμα πληρώνεται. Μόνο μια δοκιμαστική έκδοση 15 ημερών είναι διαθέσιμη δωρεάν. Κατά τη διάρκεια αυτής της περιόδου, επιτρέπεται η σάρωση 50 σελίδων.

Στη συνέχεια θα πρέπει να πληρώσετε για να χρησιμοποιήσετε το πρόγραμμα. Το FineReader «τρώει» εύκολα οποιαδήποτε εικόνα περισσότερο ή λιγότερο υψηλής ποιότητας. Η πηγή είναι εντελώς ασήμαντη. Είτε πρόκειται για φωτογραφία, είτε για σάρωση σελίδας είτε για οποιαδήποτε εικόνα με γράμματα.

Φόντα:

  • ακριβής αναγνώριση?
  • ένας τεράστιος αριθμός γλωσσών ανάγνωσης.
  • ανοχή στην ποιότητα της εικόνας πηγής.

Ελάττωμα:

  • δοκιμαστική έκδοση για 15 ημέρες.

OCR CuneiForm

Το δωρεάν πρόγραμμα για την ανάγνωση πληροφοριών κειμένου από εικόνες. Η ακρίβεια αναγνώρισης είναι μια τάξη μεγέθους μικρότερη από αυτή του προηγούμενου προγράμματος που εξετάζεται. Αλλά για ένα δωρεάν βοηθητικό πρόγραμμα, η λειτουργικότητα είναι ακόμα εξαιρετική.

Ενδιαφέρων! Το CuneiForm αναγνωρίζει μπλοκ κειμένου, γραφικών, ακόμη και διάφορους πίνακες. Επιπλέον, ακόμη και πίνακες χωρίς γραμμή μπορούν να διαβαστούν.

Για να εξασφαλιστεί η ακρίβεια, συνδέονται ειδικά λεξικά με τη διαδικασία αναγνώρισης, τα οποία συμπληρώνουν το λεξιλόγιο από σαρωμένα έγγραφα.

Φόντα:

  • δωρεάν διανομή?
  • χρησιμοποιώντας λεξικά για να ελέγξετε την ορθότητα του κειμένου.
  • σάρωση κειμένου από φωτοτυπίες κακής ποιότητας.

Ελαττώματα:

  • σχετικά χαμηλή ακρίβεια.
  • μικρός αριθμός γλωσσών που υποστηρίζονται.

WinScan2PDF

Αυτό δεν είναι καν ένα πλήρες πρόγραμμα, αλλά ένα βοηθητικό πρόγραμμα. Δεν απαιτείται εγκατάσταση και το εκτελέσιμο αρχείο ζυγίζει μόνο μερικά kilobyte. Η διαδικασία αναγνώρισης είναι εξαιρετικά γρήγορη, αν και τα έγγραφα που προκύπτουν αποθηκεύονται αποκλειστικά σε μορφή PDF.

Στην πραγματικότητα, όλη η διαδικασία πραγματοποιείται με το πάτημα τριών κουμπιών: επιλογή της πηγής, του προορισμού και, στην πραγματικότητα, εκκίνηση του προγράμματος.

Το βοηθητικό πρόγραμμα έχει σχεδιαστεί για γρήγορη μαζική επεξεργασία πολλών αρχείων. Για τη διευκόλυνση των χρηστών, παρέχεται ένα μεγάλο πακέτο γλώσσας διεπαφής.

Φόντα:

  • φορητότητα;
  • γρήγορη εργασία?
  • ευκολία χρήσης.

Ελαττώματα:

  • ελάχιστο μέγεθος?
  • η μόνη μορφή αρχείου εξόδου.

SimpleOCR

Ένα εξαιρετικό μικρό πρόγραμμα για την αναγνώριση κειμένων από εικόνες. Υποστηρίζει ακόμη και την ανάγνωση χειρογράφων. Το πρόβλημα είναι ότι τα ρωσικά δεν περιλαμβάνονται ούτε στο πακέτο γλώσσας διεπαφής ούτε στη λίστα των γλωσσών που υποστηρίζονται για αναγνώριση.

Ωστόσο, αν χρειαστεί να σαρώσετε αγγλικά, δανικά ή γαλλικά, τότε δεν θα βρείτε καλύτερη δωρεάν επιλογή.

Στο πεδίο εφαρμογής του, το πρόγραμμα παρέχει ακριβή αποκωδικοποίηση γραμματοσειρών, αφαίρεση θορύβου και εξαγωγή γραφικών εικόνων. Επιπλέον, η διεπαφή του προγράμματος διαθέτει ενσωματωμένο πρόγραμμα επεξεργασίας κειμένου, σχεδόν πανομοιότυπο με το WordPad, γεγονός που αυξάνει σημαντικά τη χρηστικότητα του προγράμματος.

Φόντα:

  • Ακριβής αναγνώριση κειμένου.
  • βολικό πρόγραμμα επεξεργασίας κειμένου.
  • αφαίρεση του θορύβου από μια εικόνα.

Ελαττώματα:

  • πλήρης απουσία ρωσικής γλώσσας.

Freemore OCR

Το πρόγραμμα σάς επιτρέπει να εξάγετε γρήγορα κείμενο και γραφικά από εικόνες. Το λογισμικό υποστηρίζει την εργασία με πολλούς σαρωτές χωρίς απώλεια απόδοσης. Το εξαγόμενο κείμενο μπορεί να αποθηκευτεί σε ένα έγγραφο κειμένου ή σε μορφή εγγράφου MS Office.

Επιπλέον, παρέχεται μια λειτουργία αναγνώρισης πολλών σελίδων.

Το Freemore OCR διανέμεται δωρεάν, ωστόσο, η διεπαφή είναι μόνο στα αγγλικά. Αλλά αυτή η περίσταση δεν επηρεάζει σε καμία περίπτωση την ευκολία χρήσης, επειδή τα χειριστήρια είναι οργανωμένα με διαισθητικό τρόπο.

Φόντα:

  • δωρεάν διανομή?
  • ικανότητα εργασίας με πολλαπλούς σαρωτές.
  • η ακρίβεια αναγνώρισης είναι αξιοπρεπής.

Ελαττώματα

  • Έλλειψη ρωσικής γλώσσας στη διεπαφή.
  • Η ανάγκη λήψης του πακέτου ρωσικής γλώσσας για αναγνώριση.

Δεν είναι πάντα δυνατή η εξαγωγή κειμένου από ένα αρχείο PDF χρησιμοποιώντας την κανονική μέθοδο αντιγραφής. Συχνά οι σελίδες τέτοιων εγγράφων είναι σαρωμένα περιεχόμενα των έντυπων εκδόσεων τους. Για τη μετατροπή τέτοιων αρχείων σε πλήρως επεξεργάσιμα δεδομένα κειμένου, χρησιμοποιούνται ειδικά προγράμματα με τη λειτουργία Optical Character Recognition (OCR).

Τέτοιες λύσεις είναι πολύ δύσκολο να εφαρμοστούν και, ως εκ τούτου, κοστίζουν πολλά χρήματα. Εάν χρειάζεστε τακτικά αναγνώριση κειμένου από PDF, καλό θα ήταν να αγοράσετε το κατάλληλο πρόγραμμα. Σε σπάνιες περιπτώσεις, θα ήταν πιο λογικό να χρησιμοποιήσετε μία από τις διαθέσιμες διαδικτυακές υπηρεσίες με παρόμοιες λειτουργίες.

Φυσικά, το εύρος των δυνατοτήτων των διαδικτυακών υπηρεσιών OCR, σε σύγκριση με τις ολοκληρωμένες λύσεις για επιτραπέζιους υπολογιστές, είναι πιο περιορισμένο. Αλλά μπορείτε να εργαστείτε με τέτοιους πόρους είτε εντελώς δωρεάν είτε με ονομαστική αμοιβή. Το κυριότερο είναι ότι οι αντίστοιχες διαδικτυακές εφαρμογές αντιμετωπίζουν εξίσου καλά την κύρια αποστολή τους, δηλαδή την αναγνώριση κειμένου.

Μέθοδος 1: ABBYY FineReader Online

Η εταιρεία ανάπτυξης υπηρεσιών είναι ένας από τους ηγέτες στον τομέα της οπτικής αναγνώρισης εγγράφων. για Windows και Mac είναι μια ισχυρή λύση για τη μετατροπή PDF σε κείμενο και περαιτέρω εργασία με αυτό.

Το αναλογικό web του προγράμματος, φυσικά, είναι κατώτερο σε λειτουργικότητα. Ωστόσο, η υπηρεσία μπορεί να αναγνωρίσει κείμενο από σαρώσεις και φωτογραφίες σε περισσότερες από 190 γλώσσες. Υποστηρίζει τη μετατροπή αρχείων PDF σε έγγραφα κ.λπ.


Η υπηρεσία διακρίνεται από πιθανώς τους πιο ακριβείς αλγόριθμους αναγνώρισης κειμένου για εικόνες και αρχεία PDF. Όμως, δυστυχώς, η δωρεάν χρήση του περιορίζεται σε πέντε επεξεργασμένες σελίδες το μήνα. Για να εργαστείτε με μεγαλύτερα έγγραφα, θα πρέπει να αγοράσετε μια ετήσια συνδρομή.

Ωστόσο, εάν η λειτουργία OCR απαιτείται πολύ σπάνια, το ABBYY FineReader Online είναι μια εξαιρετική επιλογή για την εξαγωγή κειμένου από μικρά αρχεία PDF.

Μέθοδος 2: Δωρεάν Online OCR

Μια απλή και βολική υπηρεσία για την ψηφιοποίηση κειμένου. Χωρίς την ανάγκη εγγραφής, ο πόρος σάς επιτρέπει να αναγνωρίζετε 15 πλήρεις σελίδες PDF ανά ώρα. Το Free Online OCR λειτουργεί πλήρως με έγγραφα σε 46 γλώσσες και χωρίς εξουσιοδότηση υποστηρίζει τρεις μορφές εξαγωγής κειμένου - DOCX, XLSX και TXT.

Κατά την εγγραφή, ο χρήστης έχει την ευκαιρία να επεξεργαστεί πολυσέλιδα έγγραφα, αλλά ο δωρεάν αριθμός αυτών των ίδιων σελίδων περιορίζεται στις 50 μονάδες.



Εάν χρειάζεται να εξαγάγετε κείμενο από ένα μικρό έγγραφο PDF, μπορείτε να καταφύγετε με ασφάλεια στη χρήση του εργαλείου που περιγράφεται παραπάνω. Για να εργαστείτε με μεγάλα αρχεία, θα πρέπει να αγοράσετε επιπλέον χαρακτήρες από το Free Online OCR ή να καταφύγετε σε άλλη λύση.

Μέθοδος 3: NewOCR

Μια εντελώς δωρεάν υπηρεσία OCR που σας επιτρέπει να εξάγετε κείμενο από σχεδόν όλα τα γραφικά και ηλεκτρονικά έγγραφα όπως DjVu και PDF. Ο πόρος δεν επιβάλλει περιορισμούς στο μέγεθος και τον αριθμό των αναγνωρισμένων αρχείων, δεν απαιτεί εγγραφή και προσφέρει ένα ευρύ φάσμα σχετικών λειτουργιών.

Το NewOCR υποστηρίζει 106 γλώσσες και μπορεί να επεξεργαστεί σωστά ακόμη και σαρώσεις εγγράφων χαμηλής ποιότητας. Είναι δυνατή η μη αυτόματη επιλογή μιας περιοχής για αναγνώριση κειμένου σε μια σελίδα αρχείου.


Το εργαλείο είναι βολικό και αναγνωρίζει όλους τους χαρακτήρες αρκετά καλά. Ωστόσο, η επεξεργασία κάθε σελίδας του εισαγόμενου εγγράφου PDF πρέπει να ξεκινήσει ανεξάρτητα και θα εξαχθεί σε ξεχωριστό αρχείο. Μπορείτε, φυσικά, να αντιγράψετε αμέσως τα αποτελέσματα αναγνώρισης στο πρόχειρο και να τα συνδυάσετε με άλλα.

Ωστόσο, δεδομένης της απόχρωσης που περιγράφεται παραπάνω, είναι πολύ δύσκολο να εξαγάγετε μεγάλους όγκους κειμένου χρησιμοποιώντας το NewOCR. Η υπηρεσία αντιμετωπίζει τα μικρά αρχεία με ένα κτύπημα.

Μέθοδος 4: OCR.Space

Ένας απλός και κατανοητός πόρος για την ψηφιοποίηση κειμένου, σας επιτρέπει να αναγνωρίζετε έγγραφα PDF και να εξάγετε το αποτέλεσμα σε ένα αρχείο TXT. Δεν υπάρχουν περιορισμοί στον αριθμό των σελίδων. Ο μόνος περιορισμός είναι ότι το μέγεθος του εγγράφου εισόδου δεν πρέπει να υπερβαίνει τα 5 megabyte.


Εάν χρειάζεται απλώς να εξαγάγετε κείμενο από ένα PDF και δεν σας ενδιαφέρει η τελική μορφοποίηση, το OCR.Space είναι μια καλή επιλογή. Το μόνο πράγμα είναι ότι το έγγραφο πρέπει να είναι "μονόγλωσσο", καθώς η αναγνώριση δύο ή περισσότερων γλωσσών ταυτόχρονα δεν προβλέπεται στην υπηρεσία.

Χαιρετισμούς, αγαπητοί αναγνώστες του ιστότοπου του ιστολογίου! Πιθανώς πολλοί από εσάς έχετε αντιμετωπίσει την ανάγκη αναγνωρίζουν κείμενοαπό κάποιο σαρωμένο έγγραφο, βιβλίο, φωτογραφία κ.λπ. Κατά κανόνα, για μεγάλο όγκο αναγνώρισης κειμένου από έγγραφα, χρησιμοποιούνται ειδικά και μάλλον ακριβά προγράμματα (OCR). Αλλά για να αναγνωρίσετε έναν μικρό αριθμό σελίδων κειμένου, δεν χρειάζεται να αγοράσετε μια ακριβή εφαρμογή. Υπάρχει ένα γνωστό δωρεάν πρόγραμμα αναγνώρισης κειμένου, για το οποίο έγραψα ήδη - CuneiForm. Είναι απλό και βολικό, αλλά πρέπει να εγκατασταθεί στον υπολογιστή σας.

Και αν η ανάγκη για αναγνώριση κειμένου από έγγραφα δεν προκύπτει τόσο συχνά, τότε μάλλον θα ήταν πιο λογικό να χρησιμοποιήσετε μια ειδική διαδικτυακή υπηρεσία που αναγνωρίζει το κείμενο δωρεάνή για ένα συμβολικό ποσό. Μπορείτε να βρείτε δεκάδες τέτοιες υπηρεσίες στο Διαδίκτυο. Και, κάθε υπηρεσία, κατά κανόνα, έχει τα δικά της πλεονεκτήματα και μειονεκτήματα, τα οποία μπορεί να καθοριστεί μόνο από τον ίδιο τον χρήστη.

Για τους αναγνώστες του ιστολογίου μου, αποφάσισα να κάνω μια μικρή επιλογή διαδικτυακών υπηρεσιών όπου μπορείτε αναγνωρίζει κείμενα από έγγραφαδιαφορετικές μορφές.

Η επιλογή έγινε με βάση τα ακόλουθα κριτήρια:

Η υπηρεσία αναγνώρισης κειμένου θα πρέπει να είναι δωρεάν.

Ο αριθμός των αναγνωρισμένων σελίδων κειμένου θα πρέπει να είναι απεριόριστος και εάν υπάρχουν μικροί περιορισμοί, τότε δεν σχετίζονται με την απόδειξη της ποιότητας αναγνώρισης εγγράφων.

Η υπηρεσία πρέπει να υποστηρίζει την αναγνώριση ρωσικού κειμένου.

Τι υπηρεσία αναγνωρίζει καλύτερα τα κείμενα, και ποιο είναι χειρότερο, εναπόκειται σε εσάς, αγαπητοί αναγνώστες, να αποφασίσετε. Εξάλλου, το αποτέλεσμα που προκύπτει μετά την αναγνώριση κειμένου εξαρτάται από πολλούς παράγοντες. Αυτό μπορεί να εξαρτάται από το μέγεθος του εγγράφου προέλευσης (σελίδα, φωτογραφία, σχέδιο, σαρωμένο κείμενο, κ.λπ.), τη μορφή και, φυσικά, την ποιότητα του εγγράφου που αναγνωρίζεται.

Έτσι, πήρα έξι υπηρεσίες όπου μπορείτε ασχολούνται με την αναγνώριση κειμένου online χωρίς ειδικούς περιορισμούς.

Στην πρώτη θέση βάζω την υπηρεσία Google Drive, όπου μπορείτε να κάνετε online αναγνώριση κειμένου, μόνο επειδή αυτός ο πόρος είναι στα ρωσικά. Όλες οι άλλες «αστικές» υπηρεσίες είναι στα αγγλικά.

Επτά υπηρεσίες όπου μπορείτε να αναγνωρίσετε κείμενο στο διαδίκτυο δωρεάν.

Google Drive

Απαιτείται εγγραφή εδώ εάν δεν έχετε δικό σας λογαριασμό Google. Αν όμως αποφασίσεις ποτέ δημιουργήστε το blog σαςστο blogspot, τότε έχετε ήδη λογαριασμό. Μπορεί να αναγνωρίσει εικόνες PNG, JPG και GIF και αρχεία PDF μεγέθους έως 2 MB. Στα αρχεία PDF αναγνωρίζονται μόνο οι δέκα πρώτες σελίδες. Τα αναγνωρισμένα έγγραφα μπορούν να αποθηκευτούν σε μορφές DOC, TXT, PDF, PRT και ODT.

Μετατροπή OCR.

Δωρεάν online υπηρεσία αναγνώρισης κειμένου που δεν απαιτεί εγγραφή. Υποστηρίζει μορφές PDF, GIF, BMP και JPEG. Έχοντας αναγνωρίσει το κείμενο, αποθηκεύει συνδέσμους ως διευθύνσεις URL με την επέκταση TXT, οι οποίες μπορούν να αντιγραφούν και να επικολληθούν στο αρχείο που χρειάζεστε. Σας επιτρέπει να ανεβάσετε πέντε έγγραφα έως και 5 MB ταυτόχρονα.

i2OCR.

Απαιτείται εγγραφή για αυτήν την ηλεκτρονική υπηρεσία. Υποστηρίζει έγγραφα OCR σε μορφές TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM. Μπορείτε να ανεβάσετε ένα έγγραφο έως 10 MB χωρίς περιορισμούς. Το αποτέλεσμα αναγνώρισης που προκύπτει μπορεί να ληφθεί στον υπολογιστή σας στην επέκταση DOC.

NewOCR.

Κατά τη γνώμη μου, η πιο σοβαρή και εξαιρετική ηλεκτρονική υπηρεσία που δεν απαιτεί εγγραφή. Χωρίς περιορισμούς, μπορείτε να αναγνωρίσετε σχεδόν όλα τα αρχεία γραφικών δωρεάν. Μεταφορτώστε πολλές σελίδες κειμένου ταυτόχρονα σε μορφές TIFF, PDF και DjVu. Μπορεί να αναγνωρίσει κείμενα από εικόνες σε αρχεία DOC, DOCX, RTF και ODT. Επιλέξτε και αναπτύξτε την απαιτούμενη περιοχή του κειμένου σελίδας για αναγνώριση. Υποστηρίζει 58 γλώσσες και μπορεί να κάνει μετάφραση κειμένου χρησιμοποιώντας Μεταφραστής Google στο διαδίκτυο. Μπορείτε να αποθηκεύσετε τα ληφθέντα αποτελέσματα αναγνώρισης σε μορφές TXT, DOC, ODT, RTF, PDF, HTML.

OnlineOcr.

Σας επιτρέπει να πραγματοποιείτε αναγνώριση κειμένου από 15 εικόνες σε μία ώρα χωρίς εγγραφή και δωρεάν με μέγιστο μέγεθος 4 MB. Μπορείτε να εξαγάγετε κείμενο από αρχεία JPG, JPEG, BMP, TIFF, GIF και να αποθηκεύσετε το αποτέλεσμα στον υπολογιστή σας με τη μορφή εγγράφων με την επέκταση MS Word (DOC), MS Excel (XLS) ή σε μορφή κειμένου TXT. Αλλά για να το κάνετε αυτό θα πρέπει να εισάγετε το captcha κάθε φορά. Υποστηρίζει 32 γλώσσες για αναγνώριση.

FreeOcr.

Μια διαδικτυακή υπηρεσία για δωρεάν αναγνώριση κειμένου που δεν απαιτεί εγγραφή. Αλλά για να πάρετε το αποτέλεσμα θα χρειαστεί να εισάγετε ένα captcha. Αναγνωρίζει αρχεία PDF και εικόνες JPG, GIF, TIFF ή BMP μία σελίδα τη φορά. Υπάρχουν περιορισμοί στην αναγνώριση όχι περισσότερων από 10 εγγράφων την ώρα και το μέγεθος της εικόνας δεν πρέπει να υπερβαίνει τα 5000 pixel και ο όγκος των 2 MB. Το αναγνωρισμένο κείμενο μπορεί να αντιγραφεί και να επικολληθεί σε ένα έγγραφο της επιθυμητής μορφής.

OCRonline.

Κατά την αναγνώριση κειμένων σε αυτήν την ηλεκτρονική υπηρεσία, συνιστάται τα αρχεία εικόνας να είναι υψηλής ποιότητας σε μορφή JPG (αν και δέχεται άλλες μορφές για αναγνώριση). Μπορείτε να αναγνωρίσετε μόνο πέντε σελίδες κειμένου την εβδομάδα και να το αποθηκεύσετε στον υπολογιστή σας σε μορφές DOC, PDF, RTF και TXT. Οι πρόσθετες σελίδες αναγνωρίζονται μόνο ως “bourgeois piastres” και πρέπει να εγγραφείτε.

Ελπίζω αυτά διαδικτυακές υπηρεσίες αναγνώρισης κειμένουκάποιος θα μπορεί να διευκολύνει την επίπονη διαδικασία πληκτρολόγησης κειμένων με το χέρι. Με τον ένα ή τον άλλο τρόπο, αυτές οι υπηρεσίες είναι χρήσιμες. Και ποιο είναι καλύτερο ή χειρότερο, ο καθένας θα το κρίνει μόνος του.

Θα περιμένω τα σχόλιά σας. Και αν σε κάποιον από τους αναγνώστες άρεσε αυτή η επιλογή υπηρεσιών αναγνώρισης κειμένου, θα ήμουν πολύ ευγνώμων σε όσους μοιράζονται τον σύνδεσμο προς αυτήν τη σελίδα με τους φίλους τους. Και εσείς και οι φίλοι σας θα έχετε ΤΥΧΗ!

Στο τέλος αυτού του άρθρου, θα ήθελα να ευχηθώ σε όλους καλή τύχη και επιτυχία.



Συνιστούμε να διαβάσετε

Κορυφή