Обзор программ для распознавания текста. Лучшие программы для распознавания текста

Детские товары 03.07.2020
Детские товары

У пользователей, которым приходится работать с документами, иногда возникает необходимость перевести текст с бумаги в цифровой документ, чтобы с ним можно было впоследствии работать в текстовом редакторе. Набирать текст с листка вручную - занятие довольно трудоемкое и неблагодарное, особенно если этого текста не один листик, а страниц 20-30, или даже больше. В таком случае может сильно пригодиться специальный инструмент для распознавания текста, называемый OCR (Optical Character Recognition). Программа оптического распознавания текста поможет выиграть время, которое вы могли бы потратить на перепечатку текста, а также даст возможность сохранить иллюстрации, что порой тоже очень важно. В данной статье мы проведем небольшой обзор наиболее популярных и востребованных OCR-инструментов

ABBYY Fine Reader

Программа ABBYY Fine Reader является одним из лучших инструментов для распознавания отсканированных документов. Также данная программа может распознавать PDF и DjVu-файлы.

Fine Reader имеет встроенный текстовый редактор с проверкой орфографии, может проводить распознавание текста с изображений почти всех форматов, поддерживает более 180-ти языков. Программа позволяет проводить довольно качественное извлечение текста даже из тех изображений, которые были сделаны при помощи цифровой камеры и имеют неравномерное освещение и недостаточную резкость.

Программа ABBYY Fine Reader выпускается в трех версиях: Home Edition, Professional Edition и Corporate Edition. Первая версия предназначена для домашнего использования и имеет слегка упрощенный интерфейс, вторая больше подходит для профессиональной работы с текстом, так как ее функциональность несколько шире, а версия Corporate Edition ориентирована на совместное использование в различных организациях.

ABBYY Fine Reader является платной программой, пробную демо-версию продукта можно бесплатно скачать на официальном сайте разработчика, который находится по адресу Abbyy.ru

OmniPage

OmniPage – это еще один качественный профессиональный инструмент для распознавания текста с графических и PDF-файлов. Программа обеспечивает качественное и быстрое распознавание документа с полным сохранением его структуры, что особенно важно при распознавании документов, которые содержат таблицы.

OmniPage имеет поддержку более чем 120 языков, также в программу встроены распознавательные словари для юридических, финансовых и медицинских терминов. Помимо распознавания текста, программа также имеет такие функции, как конвертация документов в PDF, конвертация электронных документов в аудиофайл и распознавание текста с изображения напрямую в аудиофайл.

Программа OmniPage также платная, приобрести ее можно на официальном сайте разработчика - Nuance.com .

OCR CuneiFrom

Программа OCR CuneiFrom после разработки позиционировалась как платный продукт, однако со временем компания-разработчик стала распространять ее бесплатно и даже открыла исходные коды программы, предложив всем желающим принять участие в улучшении работы программы. OCR CuneiFrom имеет простой, но приятный интерфейс, и может распознавать текст на более чем 20-ти языках. При распознавании программа сохраняет форматирование текста и расположение таблиц, а встроенные алгоритмы оптического распознавания позволяют выполнять извлечение текста даже из нечетких ксерокопий и факсов.

Программа OCR CuneiFrom является, пожалуй, лучшим бесплатным инструментом для распознавания документов. Скачать бесплатно данную утилиту можно на официальном сайте разработчика по адресу Cognitiveforms.ru .

Помимо программ для распознавания текста, вы можете воспользоваться еще и специальными сервисами, с помощью которых можно выполнять распознавание документов в режиме онлайн. Разумеется, их возможности несколько ограничены по-сравнению с возможностями специализированных программ, однако для небольших объемов такие сайты вполне сгодятся.

Бумага как основной носитель информации, постепенно утрачивает свое значение. Вместо бумажных документов используют их электронный вариант, если это возможно. Но как перевести в электронный вид имеющиеся архивы? Для решения этой задачи были созданы специальные программы для распознавания текста.

Что такое OCR-программы и как они работают

Эти программные продукты, использующие технологию ORC (Optical character recognition) или ICR (Intelligence character recognition). На русский язык эти аббревиатуры переводятся как «оптическое» или «интеллектуальное распознавание символов».

Программы, использующие OCR, работают следующим образом. Фотография с текстом, полученная от сканера, разбивается на множество фрагментов. Для каждого из них приложение создает несколько предположений. Проверяя их и сравнивая с эталонами, каждому фрагменту дает оценку, соответствующую степени совпадения. Выбирая наибольшую из них, программа «видит» символ и выводит его в поле встроенного текстового редактора.

IRC работает по тому же принципу, но для используются искусственные нейронные сети. Главное преимущество этого способа - компактность программ и непрерывное обучение. Это позволяет эффективно распознавать слова, написанные человеком рукописными буквами. Но эта технология не способна «прочесть» сплошной рукописный текст.

Для каждой из существующих операционных систем разработаны собственные OCR-программы. Наиболее популярными для работы в ОС Windows являются:

  • ABBYY FineReader;
  • OmniPage;
  • Readiris;
  • Samsung Scan OCR Program;

Кроме программ для ПК доступно много онлайн-сервисов по распознаванию текста. Среди них наиболее известны FineReader Online, OnlineOCR, FreeOCR.

ABBYY FineReader 14

Этот программный продукт разработан отечественной компанией ABBYY, является одной из лучших среди программ, использующих OCR. Основу программы составляет оригинальный движок под названием Finereader Engine. Он предоставляет следующие возможности:

  • Быстрое распознавание печатного текста с точностью выше 98 %. Невосприимчивость к качеству исходного изображения. Это позволяет одинаково на фотографиях, полученных при помощи сканера или фотоаппарата.
  • Технология ADRT позволяет распознавать не только текст, но и его форматирование: шрифт, отступы, абзацы, колонки.
  • Возможность многопоточной Это позволяет задействовать все ядра процессора (максимум 4) для ускорения процесса распознавания.
  • Поддержка более 190 языков, включая те, которые используют алфавит, отличный от латиницы или кириллицы (японский, китайский, арабский).
  • Встроенный текстовый редактор позволяет проверить результат распознавания или отредактировать его.
  • Взаимодействие с пакетом Office. Оно позволяет экспортировать распознанный текст в Microsoft Word и Exel для дальнейшей обработки.
  • Возможность обучения программы. Эта функция позволяет обучить программу «читать» специфические начертания букв. Например, нестандартный шрифт или печатные буквы, написанные рукой.
  • Работа с PDF. FineReader позволяет распознавать текст из этого типа файлов и «сшивать» несколько отсканированных изображений в PDF или PDF/A.

Главный недостаток этой программы - цена. Бессрочная лицензия для базовой версии обойдется в 7 тысяч рублей. Версии "Бизнес" и "Энтерпрайз" - в 12 и 39 тысяч рублей, соответственно. Если же предполагается использовать программу только дома, то можно скачать с торрент-трекера взломанную 11-ю или 12-ю версию продукта.

Системные требования:

  • Процессор: 32- или 64-битный, с тактовой частотой более 1 ГГц и поддержкой набора инструкций SSE 2. (Intel Celeron M и лучше, AMD Athlon 64 и лучше).
  • Оперативная память: 1 ГБ. Если процессор имеет более 1 ядра, то для каждого дополнительно требуется 512 МБ.
  • Жесткий диск: 3 ГБ - для установки и работы.
  • Сканер: поддерживающий драйверы TWAIN и WIA.
  • ОС: Windows 7,8,8.1,10.

Мнение пользователей о FineReader 14

Они отзываются о FineReader положительно, выделяя среди достоинств способность продукта распознавать текст с плохих бумажных оригиналов, удобный и простой интерфейс и высокую скорость обработки изображений.

Среди проблем, возникающих при использовании этой OCR-программы, некоторые юзеры отмечают некорректно работающий менеджер изображений. Например: неадекватная работа регулировки яркости отсканированного изображения.

OmniPage 18

Основной конкурент FineReader на российском рынке ORC-программ. По функционалу она очень похожа на оппонента, но имеет несколько отличий:

  • Возможность запуска процесса сканирования и распознавания при помощи кнопок сканера.
  • Поддержка 4-ядерных процессоров. Это позволяет уменьшить время распознавания и преобразовывать несколько изображений одновременно.
  • Создание собственной электронной библиотеки для букридера (электронной книги) Kindle.
  • Автоматическое определение распознаваемого языка.

Среди недостатков программы можно отметить низкую скорость работы, сравнимую с 10-й версией FineReader, и цену за лицензионную копию - 150 долларов.

Системные требования:

  • Процессор: x32- или x64-битный, с тактовой частотой более 1 ГГц, Intel Pentium и лучше, AMD Athlon и лучше.
  • Оперативная память: 512 МБ.
  • Видеокарта: любая, поддерживающая разрешение 1024 х 800 и глубину цвета 16 бит.
  • Жесткий диск: 1,1 ГБ для установки всех компонентов и 100 МБ для работы.
  • Сканер: поддерживающий драйверы TWAIN,WIA и ISIS.
  • ОС: Windows XP SP3,Vista SP2 x32/x64, 7,8.

Мнение пользователей об OmniPage

Отзываются они о ней резко негативно, т.к. проблемы есть во всех частях программы, начиная от красивого, но непонятного интерфейса, и заканчивая плохой справочной информацией. Продукт не адаптирован к работе в WinXP. Его можно заставить работать, но придется потратить какое-то время.

OmniPage имеет проблемы с распознаванием. Например: он легко распознает простой черный текст на листе бумаги с рисунками или таблицами, полученный со сканера. При использовании изображений с фотоаппарата или мобильного телефона точность распознавания падает до 70 %, а это очень неудобно при обработке больших документов.

Также 18-я версия может не запуститься из-за ошибок в коде. Для устранения этой проблемы нужно установить патч 18.01.

Read Iris Pro 17

Read Iris - это OCR-программа, что за меньшие деньги (8000 против 12 000) способна сравниться по функционалу и производительности с FineReader. Профессиональная версия обладает следующими возможностями:

  • Полноценная работа с PDF: распознавание, создание файлов для баз данных, сжатие и озвучивание текста.
  • Поддержка 140 языков.
  • Распознавание бумажных таблиц и текстов с возможностью экспорта в Exel и Word.
  • Получение изображений с любой модели сканера.

Также существует корпоративная версия, позволяющая защищать PDF-файлы водяными знаками и работать с документами объемом более 50 страниц.

Системные требования:

  • Процессор: x86 или x64, с тактовой частотой 1 ГГц или выше.
  • Оперативная память: 1 ГБ.
  • Видеокарта: любая, поддерживающая разрешение 1024 х 800.
  • Жесткий диск:400 МБ для установки.
  • Сканер: поддерживающий драйверы TWAIN,WIA.
  • ОС: Windows 7,8,10 x32/x64.

Мнение пользователей о ReadIris

Они отзываются об этой OCR-программе распознавания текста как о хорошем и быстром PDF to Word конвертере с рядом проблем:

  • Сложный интерфейс, в котором новичку нелегко разобраться.
  • Автоматическое пересканирование документа при изменении области сканирования.
  • Плохая техническая поддержка.
  • Иногда программа не активируется из-за ошибок в коде программы.

Samsung Scan OCR Program - что это за программа?

Это бесплатное программное обеспечение, входящее в комплектацию многофункциональных устройств «3 в 1» (принтер, сканер, копир) от компании "Самсунг". Оно разработано в сотрудничестве с компанией Iris, создавшей ReadIris Pro, и оптимизировано для работы с МФУ этого производителя. От оригинального "Ридирис" Samsung Scan ORC отличается интерфейсом, урезанным функционалом и размерами - на жестком диске она занимает 40 МБ.

Онлайн-сервисы

Они являются альтернативой ресурсоемким стационарным программам для распознавания текста. Например, OCR программе FineReader. Свойства систем подобных проектов позволяют распознавать текст с изображений намного быстрее, чем на автономном ПК. Среди сервисов, занимающихся извлечением текста из фотографий, можно выделить 3 наиболее удобных: FineReaderOnline, FreeOCR, OnlineOCR.

Первый является прямым развитием стационарной версии продукта. При регистрации новому пользователю дается 10 бесплатных страниц для обработки и 5 каждый месяц. Снять это ограничение можно, купив годовую подписку за 3200, 5500, 17800 рублей за 2000, 5000 и 10000 страниц соответственно. Если у пользователя есть лицензия для FineReader 14, то ему достаточно зарегистрироваться и активировать ее для использования в онлайн-версии. В этом случае он получит количество страниц, соответствующее типу приобретенной лицензии: "Стандарт" (2000), "Бизнес" (5000) или "Энтерпрайз" (10000).

Сервис OnlineOCR.com позволяет преобразовывать 15 изображений/час (ограничение для незарегистрированных пользователей) в текст и сохранять их в виде файлов.docx, .xlsx или.txt. После регистрации становится доступным:

  • Сохранение в.pdf, .doc, .xlx, .rtf.
  • Преобразование многостраничных PDF-файлов.
  • Количество страниц увеличивается до 50.

Если страниц недостаточно, то их можно приобрести в количестве 50-50 000 штук.

Проект FreeOCR.com отличается от предыдущего своей полной бесплатностью и отсутствием ограничений на количество обрабатываемых страниц. OCR-движок этого сайта поддерживает русский, украинский, турецкий, вьетнамский и все европейские языки - всего 29. Единственным недостатком этого портала является работа только с графическими изображениями, загружаемых последовательно, так как очередь обработки не предусмотрена создателями. Выводится распознанная информация без какого-либо форматирования в формате TXT.

Мнение пользователей об онлайн-OCR-сервисах

Эти сайты необходимы в тех случаях, когда загрузка и установка полноценной ORC-программы нецелесообразна. Например, для вставки в реферат нескольких объемных цитат из книги или журнала. Среди недостатков таких сайтов выделяют условную бесплатность (FineReader) и слабый функционал (FreeOCR,OnlineOCR).

Подводя итог, можно сказать, что OCR-программ распознавания текста с изображением или PDF-файлов создано немало, а в статье приведены лишь самые известные. Поэтому OCR-программу для сканера каждый пользователь сможет себе подобрать в соответствии с требованиями и бюджетом. Либо воспользоваться одним из множества бесплатных OCR-сервисов.

Необходимость работы с текстом, представленным в виде графических файлов, появляется довольно часто. Будь то картинка, отсканированный документ или фотокопия, ручной набор информации, представленной в них, может занять довольно продолжительное время.

Обзор программ

Программ для этой цели существует большое количество. Для начала работы с ними достаточно иметь изображение или отсканированный документ, который нужно перевести в текст. Большинство из них похожи своими функциями, но в то же время обладают и уникальными инструментами, подходящими для конкретных целей. Как не потеряться в их разнообразии, и на какие из них стоит обратить свое внимание? Это мы рассмотрим далее.

CuneiForm

Первой и программ, на которой мы остановимся, является CuneiForm. Это свободно распространяемый софт от компании Cognitive Technologies. Его основное предназначение – оптическое распознавание текстов, представленных в виде электронных копий или картинок. Он быстро переводит графический файл в текст, с которым можно работать в любом офисном приложении.

Основные особенности программы:


F reemore OCR

Подобной по своим функциям является и Freemore OCR. Это простая и находящаяся в свободном доступе программа, с помощью которой можно извлечь текст из изображений в разных форматах и PDF документов. После завершения сканирования полученный результат можно сохранить в файле, который открывается блокнотом или Word.

Freemore OCR – это:


Обратите внимание! Работа подобных приложений с документами в формате PDF может занимать больше времени, чем с обычным графическим файлом, что объясняется большим объемом исходного материала.

FreeOCR

FreeOCR – еще одно удобное приложение для оптического распознавания текста. Обладает интуитивно понятным интерфейсом и содержит набор всех необходимых для этого инструментов. Стоит заметить, что меню программы на английском языке, но благодаря необычному подходу к его дизайну, оно понятно каждому пользователю. Утилита поддерживает работу с множеством изображений в разных форматах и PDF-файлами.

Особенности FreeOCR:

  1. возможность конвертации изображений во всех популярных форматах;
  2. отсутствие стандартного меню, вместо которого пользователю предлагаются большие иконки с изображением нужного действия;
  3. минималистичность интерфейса, в котором сохранено только самое необходимое;
  4. поддержка распознавания множества языков, в том числе и русского;
  5. низкие системные требования.

Важно! Для установки FreeOCR необходимо подключение к сети Интернет. После запуска программа в автоматическом режиме обновит свою базу данных и скачает недостающие словари из онлайн-хранилища. Во время работы, при обнаружении незнакомых символов или языка, FreeOCR также может предложить обновление.

Видео: распознаем текст с картинки

SimpleOCR

SimpleOCR – аналогичная программа для распознавания текста после сканирования. Она отлично подходит для работы с иностранными языками, так как обладает большим и постоянно совершенствующимся словарем. Помимо стандартного набора функций, обладает возможностью поиска слова или сочетания в полученном тексте и расширенными опциями форматирования. Хорошо подходит для обработки объемных текстов.

Отличительные черты SimpleOCR:


RiDoc

RiDoc – приложение, основной функцией которого является работа с отсканированными копиями документов и их конвертации в обычный текст. В нем все готово для сканирования – достаточно подключить принтер и начать работу, после чего программа начнет обработку выбранных файлов.

Кроме этого, оно позволяет уменьшить размер документа без потери качества исходного материала. Функции RiDoc:

  1. большой набор инструментов для работы с принтерами, поддержка большинства популярных моделей;
  2. возможность объединения нескольких документов в один файл, их редактирование и компоновка;
  3. создание галереи, в которой хранятся все полученные результаты;
  4. экспорт в MS Word, PDF и графические файлы;
  5. отправка результата по электронной почте прямо из интерфейса приложения;
  6. создание водяных знаков, защищающих полученный результат;
  7. быстрота и удобство.

img2txt

img2txt – стандартное приложение, преобразующее различные виды графических файлов в текстовый материал. Программа поддерживает большинство известных форматов, легка в использовании и находится в свободном доступе.

Основные функции и особенности:

  1. конвертация изображений в разных форматах в текстовые файлы;
  2. распознавание сканов документов и фрагментов текста на картинках;
  3. предельно простое меню, содержащее достаточный набор инструментов;
  4. сохранение результата в различных форматах;
  5. бесплатность распространения.

Обратите внимание! img2txt, как и другие подобные приложения, имеет свою онлайн-версию, на разработке и улучшении которой сейчас сосредоточили свое внимание ее создатели.

SunnyPage

SunnyPage – удобная утилита, позволяющая загружать и конвертировать различные виды изображений, будь то отсканированная копия документа, картинка или же фото в хорошем качестве. Поддерживает она и работу с PDF-документами. В состав программы входит обширный словарь и функция автоматического распознавания языка.

Помимо этого, SunnyPage:

  1. поддерживает загрузку дополнительных словарей и ручное добавление новых слов и фраз;
  2. работает с большими объемами с возможностью их сохранения в единый файл;
  3. обладает набором функций для редактирования изображения, автоматической настройки их яркости и избавления от дефектов;
  4. «читает» большинство известных форматов;
  5. позволяет сохранять полученный результат в файл Word;
  6. обладает многоязычным интерфейсом.

Программа для сканирования и распознавания текста Abbyy Finereader

ABBYY FineReader – заслуженно лучшая в своем роде программа для распознавания текста. Ее популярность обусловлена наличием всех необходимых функций, которые пользователь ищет в подобных приложениях. Она полностью совместима с Microsoft Office, что позволяет начать работу с документом сразу поле окончания процесса конвертации.

Что может ABBYY FineReader?


Capture2Text

Capture2Text – портативное приложение, обладающее большим набором функций для работы с документами. Его отличительной особенностью является возможность создания снимка экрана или его части и сохранение в виде изображения. После этого можно приступать к работе, перенося полученную информацию в документ традиционных форматов.

Capture2Text не требует установки и может запускаться с флеш-накопителя. Это делает ее применимой во многих сферах и просто незаменимой для тех, кому всегда необходимо иметь под рукой простой и мощный конвертер.

Capture2Text обладает множеством интересных функций:

  • стандартной конвертацией изображений (картинок, сканов, фотокопий) в документы формата Word;
  • распознавание речи (в том числе и русской) и голосовой набор;
  • возможность назначения горячих клавиш;
  • захват текста с рабочего стола или его части и последующей обработкой.

Google Документы

Помимо всех вышеперечисленных утилит, функция оптического распознавания текстовых фрагментов присутствует в Google Документах. Данный сервис поддерживает работу как с файлами в форматах JPG, PNG и GIF, так и многостраничными PDF –документами. Исходниками могут служить изображения, полученные с помощью сканеров, а также обычные фотографии.

Стоит заметить, что при использовании данного сервиса, в результате не всегда сохраняется оригинальное форматирование. Некоторые структуры, как, например, списки, колонки и сноски, могут быть утеряны.

На это в значительной степени влияет качество загружаемого графического файла. Полученные документы могут быть сохранены на сервисе Google Диск, затем скачаны на компьютер или отосланы на электронную почту.

Каждая из рассмотренных программ обладает достаточным инструментарием для выполнения своего первоначального предназначения – конвертации файлов различных форматов в текстовые документы. Однако они отличаются своим набором дополнительных функций, интерфейсом и поддерживаемыми языками. Для работы стоит выбрать то приложение (или несколько), которое отвечает вашим нуждам и способно наиболее точно справиться с поставленной задачей.

>

OCR CuneiForm сможет отсканировать и мгновенно распознать бумажную документацию по технологии Optical Character Recognition в редактируемые текстовые и табличные форматы, совместимые с Microsoft Office Word и Excel. Потом материалы лучше сохранить и редактировать в офисных пакетах, текстовых и табличных редакторах, аналогах Microsoft Word и Microsoft Excel. Программа распространяется "как есть", разработчики не несут ответственности в связи с возможными проблемами и могут отменить действие свободной лицензии для следующих версий, поэтому стоит поторопиться и последнюю версию OCR CuneiForm скачать бесплатно для Windows 10, 8.1, 8, 7, Vista, XP, Linux или Mac OS X. Экономить время с КьюниФорм разработчики предлагают по принципу: чем лучше отсканировать и распознать, тем быстрее исправить и получить готовый результат.

Применение в CuneiForm новых технологических достижений

В начале XXI века считалось, что нормально работающей альтернативы ABBYY FineReader не существует. Несмотря на существование различных программ для OCR распознавания текста, ABBYY FineReader прочно оставался в лидерах индустрии сканирования и оцифровки документов. Это продолжалось до тех пор, пока самые продвинутые пользователи не попробовали для полноценного распознавания сфотографированного или сканированного текста скачать OCR CuneiForm 12 бесплатно без регистрации и SMS и протестировать потенциал этой по-настоящему бесплатной проги для Виндовс. При этом оказалось, что возможности OCR CuneiForm не уступают ABBYY FineReader ни в чем.

OCR CuneiForm умеет мгновенно идентифицировать все стандартные символы всевозможных начертаний и шрифтового исполнения. Распознаванию поддаются книги, журналы, листовки, газетки, принт-листы, факсовые рассылки, неудачные ксероксные копии, тексты с древних пишущих машинок и прочее, исключая декоративный шрифт и рукопись. В программном коде CuneiForm применяется ряд уникальных инновационных технологий Optical Character Recognition, таких как: адаптивное распознавание с применением шрифтонезависимых инструкций, нейронно-аналитические сети нормализации, когнитивная аналитика альтернативных вариантов трактовки текста, спецалгоритмы для матричного принтера, некачественных результатов ксерокопирования, факсов и машинописных страниц и прочие. При необходимости использовать все это для дела всегда можно бесплатно скачать CuneiForm для Windows 10, 8.. CuneiForm способен воссоздать абсолютную копию исходника. Сохраняется форматирование и структурирование, отступы, колонтитулы, сноски, индексы, количество и размеры колонок, абзацы, расположение отдельных фрагментов текста, табличных элементов и иллюстраций, стили шрифтов и другие элементы шрифтового оформления.

Интерфейс, языки, словари и функционал ОСР КьюниФорм

OCR CuneiForm отлично узнает и оцифровывает документацию, удобна в работе и не создает проблем начинающим пользователям, поскольку обладает удобным русскоязычным интерфейсом, имеет встроенные советы и всплывающие подсказки. Для закачки и подключения доступны популярные графические интерфейсы для КьюниФорм: YAGF, OCR Feeder, CF-Qt, Puma и прочие. Стандартный графический интерфейс имеет все инструменты, необходимые для полноценного распознания сканированного или сфотографированного текста. Мультиязычный интерфейс на родном языке способствует ускорению понимания оператором принципов работы и расширению спектра используемых возможностей. В настройках доступно конфигурирование под распознавание символов на русском, инглише, русско-английском и еще 20-ти европейских языковых раскладках. Качество мгновенного распознавания повышается при использовании словарей, которые можно расширять, импортируя слова из словарных файлов.

Основные функциональные преимущества программы OCR CuneiForm:

  • достойное OCR распознавание и скорость работы,
  • автоподбор оптимальных настроек сканирования,
  • импорт отсканированных, сфотографированных или принятых иным путем картинок,
  • поворот, переворот, инверсия, очистка и прочее редактирование изображений,
  • несколько вариантов идентификации абзацев текста, таблиц и картинок,
  • в работу идет любой материал, исключая декор и рукопись,
  • словарная поддержка для улучшения качества,
  • сравнительная демонстрация исходников и символьных результатов,
  • OCR-совместимость со свыше двадцати языками, включая русский.

Бесплатность, множество преимуществ, скорость и отсутствие проблем в работе являются весомыми аргументами, чтобы скачать CuneiForm бесплатно на сайте сайт русскую версию. Использование высокотехнологичного гарантирует высококачественные скан и распознавание документации с бумажных носителей или растровых файлов в форматы, подходящие для редактирования в соответствующих редакторах.

Немного исторических фактов

Cognitive Technologies образовалась в 1993 г. на основе главного центра ИИ ИСА Российской Академии Наук. Как итог научно-практических исследований появилась первая CuneiForm. В конце 1993 года был подписан OEM-контракт с Corel Corporation, по которому код КьюниФорм вошел в пакет Corel Draw. В дальнейшем после многих лет перерыва компания освободила проект, перестав продавать и поддерживать программу, но программа КьюниФорм настолько хороша, что сегодня отсканировать и распознать русский текст лучше и дешевле всего получится, если бесплатно скачать OCR CuneiForm русскую версию на свой компьютер.

Вскоре этот программный продукт оказался одним из наиболее востребованных средств оптического распознавания текстов и заслужил позитивные отзывы и комментарии пользователей на официальном сайте cognitiveforms в домене com, тематических сайтах и форумах, а также в социальных сетях. Сегодня CuneiForm выделяется из массы прочего Optical Character Recognition программного обеспечения достойным распознаванием некачественной документации. Среди достоинств КуниФорма отмечены качественный перевод в цифровой вид бумажной документации и растровых файлов с экспортом в мультиформатный текст и таблицы Microsoft Office Word и Excel или их аналоги.

Ошибка во взаимодействии со сканерами

Сканирование на HP, Epson, Mustek, Canon и некоторых других черевато ошибкой. Причина данной проблемы обусловлена нюансами взаимодействия TWAIN-интерфейса с оборудованием. Лечится проблема простым редактированием строки с содержимым TWAIN_TransferMode в файле C:\Windows\face.ini до состояния: TWAIN_TransferMode=memory-native и перезапуском программы. Как правило, сегодня таких проблем не наблюдается, и чтобы получить из бумажного документа редактируемую электронную версию, нужно просто бесплатно скачать CuneiForm на русском языке с этой страницы сайта сайт без регистрации и СМС и использовать ее по прямому назначению. Это сбережет время и освободит от ручного набирания текста в Microsoft Word и таблиц в Microsoft Excel или аналогах этого ПО.

Последнюю версию CuneiForm 12 скачать бесплатно на русском языке

Бесплатные программы скачать бесплатно

Сейчас Вы находитесь на странице с названием "OCR КьюниФорм для полноценного распознавания сфотографированного или сканированного текста" сайта , где каждый имеет возможность легально скачать программы для компьютера с Microsoft Windows. Эта страница создана/существенно обновлена 10.09.2015. Спасибо, что посетили раздел .

Наверное, каждому знакома ситуация, когда скан документа, например, страницы книги, необходимо преобразовать в печатный текст. Для этого существуют специальные программы, но основная их масса очень мало кому известна. На слуху у всех, пожалуй, только ABBYY FineReader. Действительно, FineReader вне конкуренции. Это лучшая программа для сканирования и распознавания текста на русском языке, однако выпускается она исключительно в платных версиях и стоит весьма недешево. Многие ли готовы выложить за самую бюджетную лицензию почти 7 000 рублей, если собираются обрабатывать одну-две книги в год?

Если вы считаете покупку дорогостоящего коммерческого продукта неоправданной, почему бы не воспользоваться аналогами, среди которых есть бесплатные? Да, они не так богаты функциями, но со многими задачами, которые, как считают многие, «по зубам» только FineReader, справляются вполне успешно. Так давайте познакомимся с несколькими доступными альтернативами. И заодно посмотрим, чем они отличаются от общепризнанного эталона.

Чтобы сравнивать другие программы с ABBYY FineReader , выясним, чем же он так хорош. Вот перечень его основных функций:

  • Работа с фотографиями, сканами и бумажными документами.
  • Редактирование содержимого файлов pdf — текста, отдельных блоков, интерактивных элементов и прочего.
  • Конвертация pdf в формат Microsoft Word и обратно. Создание pdf-файлов из любых текстовых документов.
  • Сравнение содержимого документов на 35 языках, например, отсканированного бумажного и электронного (не во всех редакциях).
  • Распознавание и преобразование сканированных текстов, таблиц, математических формул.
  • Автоматическое выполнение рутинных операций (не во всех редакциях).
  • Поддержка 192 национальных алфавитов.
  • Проверка орфографии распознанного текста на русском, украинском и еще 46 языках.
  • Поддержка 10 графических и 10 текстовых форматов входных файлов, не считая pdf.
  • Сохранение файлов в графическом и текстовом форматах, а также в виде электронных книг EPUB и FB2.
  • Чтение штрих-кодов.
  • Интерфейс на 20 языках, включая русский и украинский.
  • Поддержка большинства существующих моделей сканеров.

Возможности программы великолепны, но для домашних пользователей, которые не обрабатывают документы в промышленных объемах, избыточны. Впрочем, тем, кому нужно распознать лишь несколько страниц, компания ABBYY предоставляет услуги бесплатно — через веб-сервис FineReaderOnline . После регистрации доступна обработка 10 страниц отсканированного или сфотографированного текста, в дальнейшем — по 5 страниц в месяц. Больше — за доплату.

Стоимость самой недорогой лицензии FineReader для установки на компьютер — 6990 рублей (версия Standard).

Крошечная и крайне простая бесплатная утилитка , конечно, не в состоянии конкурировать с монстром, но основную задачу — распознавание сканированного текста, решает как положено. Причем для этого она не требует даже установки на ПК (портабельная). И управляется всего тремя кнопками.

Для распознавания текста с помощью WinScan2PDF нажмите «Выбрать источник» и укажите подключенный сканер (с готовыми файлами программа, к сожалению, не работает). Поместите в сканер документ и нажмите «Сканировать». Если хотите отменить операцию, нажмите «Отмена». Вот и вся инструкция.

Утилита поддерживает 23 языка, включая русский, и работает с многостраничными файлами. Готовый результат сохраняется в формате pdf, скан документа — в jpg.

Веб-сервис Free-OCR.com

Free-OCR.com (OCR — Optical character recognition, оптическое распознавание символов) — бесплатный Интернет-сервис для распознавания отсканированных или сфотографированных текстов, сохраненных в формате графического изображения (jpg, gif, tiff, bmp) или pdf. Поддерживает 29 языков, включая русский и украинский, причем пользователь может выбрать не один, а несколько, если их содержит исходный текст.

Free-OCR не требует регистрации и не имеет каких-либо ограничений по количеству загруженных документов. Ограничивается только размер файла — до 6 Mb. Многостраничные документы сервис не обрабатывает, точнее, игнорирует всё, кроме первого листа.

Скорость распознавания сканированного текста довольно высока. Лист А4 с фрагментом книги на русском языке был обработан примерно за 5 секунд, но вот качество не порадовало. Крупные шрифты — как в детских книжках, он распознает на 100%, а средние и мелкие — примерно на 80%. С англоязычными документами дела обстоят несколько лучше — мелкий и неконтрастный шрифт распознался правильно примерно на 95%.

Веб-сервис Free Online OCR

— еще один бесплатный веб-сервис, очень похожий на предыдущий, но с расширенным функционалом. Он:

  • Поддерживает 106 языков.
  • Обрабатывает многостраничные документы, в том числе на нескольких языках.
  • Распознает тексты на сканах и фотодокументах множества типов. Помимо 10 форматов графических изображений, обрабатывает документы pdf, djvu, doxc, odt, архивы zip и сжатые файлы Unix.
  • Сохраняет выходные файлы в одном из 3 форматов: txt, doc и pdf.
  • Поддерживает распознавание математических уравнений.
  • Позволяет повернуть изображение на 90-180° в обе стороны.
  • Правильно распознает текст в нескольких столбцах на одной странице.
  • Может распознать один выбранный фрагмент.
  • После обработки предлагает скопировать файл в буфер обмена, скачать на компьютер, загрузить на сервис Google Docs или опубликовать в Интернете. Также доступна возможность сразу перевести текст на другой язык, используя Google Translate или Bing Translator.

Надо отдать должное Free Online OCR и за то, что он неплохо читает картинки низкого разрешения и малой контрастности. Результат распознавания всех скормленных ему русскоязычных текстов отказался стопроцентным или близким к этому.

Free Online OCR, по нашему мнению, одна из лучших альтернатив FineReader, но бесплатно он обрабатывает только 20 страниц (правда, не указано, за какой период). Дальнейшее использование сервиса стоит от $0,5 за страницу.

Microsoft OneNote

Программа для создания заметок Microsoft OneNote , исключая очень старые и последнюю — 17 версии, тоже содержит функционал OCR. Он не такой продвинутый как в специализированных приложениях, но тоже пригодный к использованию, если нет других вариантов.

Чтобы распознать текст с изображения с помощью OneNote, вставьте картинку в файл («Рисунок» — «Вставить»), нажмите на нее правой клавишей мышки и выберите «Копировать текст из рисунка».

После этого вставьте скопированный текст в любое место заметки.

По умолчанию языком распознавания назначен английский. Если вам нужен русский или какой-либо другой, измените настройку вручную.

Качество распознавания русскоязычного текста в Microsoft OneNote оставляет желать лучшего, поэтому его нельзя назвать полноценной заменой FineReader. Да и обрабатывать в нем большие многостраничные документы весьма неудобно.

SimpleOCR

Старенькая бесплатная программа SimpleOCR — тоже весьма достойный инструмент распознавания текстов с электронных изображений и сканов, но, к сожалению, без поддержки русского языка. Зато в ней есть уникальная функция считывания рукописных слов, а также редактор, позволяющий исправить ошибки перед сохранением готового результата.

Другие возможности SimpleOCR:

  • Проверка орфографии с возможностью пополнять словарь вручную.
  • Чтение документов в низком разрешении и с помарками (есть опция очистки «шума»).
  • Максимально близкая подборка шрифта и передача стилей написания (жирный, курсив). При желании функцию можно отключить.
  • Одновременная обработка нескольких листов или отдельного фрагмента.
  • Выделение возможных ошибок в готовом тексте для ручного редактирования.
  • Поддержка множества модификаций сканеров.
  • Входные форматы электронных документов: tif, jpg, bmp, ink, а также сканы.
  • Сохранение готового текста в форматах txt и doc.

Качество распознавания и печатных текстов, и рукописей довольно высокое.

Программу можно было бы назвать универсальной, если бы не ограничение языковой поддержки. Последняя версия поддерживает только английский, французский и датский языки, добавление других, скорее всего, не планируется. Интерфейс полностью на английском, но прост для понимания. Кроме того, в главном окне есть кнопка «Demo», которая запускает обучающий ролик по работе с SimpleOCR.

Программа бельгийской компании-разработчика I.R.I.S — вот это действительно настоящий конкурент российскому ABBYY FineReader. Мощная, быстрая, кроссплатформенная, основанная на фирменном OCR-движке, используемом производителями Adobe, HP и Canon, она великолепно распознает даже самые трудночитаемые тексты. Поддерживает 137 языков, среди которых есть русский и украинский.

Особенности и функции Readiris:

  • Самая высокая скорость обработки файлов среди приложений такого класса, рассчитано на большие объемы.
  • Сохранение форматирования исходного текста (шрифты, кегль, стиль написания).
  • Одиночная и пакетная обработка файлов, поддержка многостраничных документов.
  • Распознавание математических уравнений, специальных символов и штрих-кодов.
  • Очистка текста от «шумов» — линий, помарок и т. п.
  • Интеграция с различными облачными сервисами — Google Документы, Evernote, Dropbox, SharePoint и некоторыми другими.
  • Поддержка всех современных моделей сканеров.
  • Форматы входных данных: pdf, djvu, jpg, png и другие, в которых сохраняют графические изображения, а также полученное непосредственно со сканера.
  • Форматы выходных данных: doc, docx, xls, xlsx, txt, rtf, html, csv, pdf. Поддерживается конвертация в djvu.

Интерфейс программы русскоязычный, использование интуитивно понятно. Она не предоставляет пользователям возможности редактировать содержимое файлов pdf, как FineReader, но с главной задачей — распознаванием текстов, на наш взгляд, справляется отлично.

Readiris выпускается в двух платных версиях. Стоимость лицензии Pro составляет 99,00€, Corporate — 199€. Почти как у ABBYY.

Freemore OCR

Freemore OCR — (! сайт программы http://freemoresoft.com/freeocr/index.php может блокироваться антивирусами из-за встроенного в установщик рекламного «мусора») — еще одна простая, компактная и бесплатная утилитка, которая тоже неплохо распознает тексты, но по умолчанию только на английском. Пакеты других языков нужно загружать и устанавливать отдельно.

Прочие функции и возможности Freemore OCR:

  • Одновременная работа с несколькими сканерами.
  • Поддержка множества форматов графических данных, в том числе проприетарных, вроде psd (файл Adobe Photoshop). Стандартные форматы графики поддерживаются все.
  • Поддержка pdf.
  • Сохранение готового результата в формате pdf, txt или docx, причем для экспорта текста в Word достаточно нажать одну кнопку на панели инструментов.
  • Встроенный редактор (к сожалению, форматирование исходного документа программа не сохраняет).
  • Просмотр свойств документа.
  • Печать распознанного текста прямо из главного окна.
  • Защита паролем файлов в формате pdf.

На первый взгляд интерфейс программы может показаться сложным, но на самом деле пользоваться ею очень легко. Инструменты поделены на группы, как на ленте Microsoft Office. Если рассмотреть их повнимательнее, назначение той или иной кнопки быстро станет понятным.

Чтобы загрузить электронный документ в окно Freemore OCR, сначала выберем его тип — изображение или файл pdf, и следом нажмем соответствующую кнопку «Load». Чтобы начать процесс распознавания, нажимаем на кнопку «OCR» в одноименной группе инструментов рядом с изображением волшебной палочки (показана на скриншоте).

Результат сканирования англоязычных текстов как с хорошо-, так и с плохочитаемой картинки оказался вполне удовлетворительным. Не понравилось лишь одно — то, что вместе с программой на компьютер устанавливается всякий мусор — какие-то липовые антивирусные сканеры, оптимизаторы и прочие ненужные вещи, причем без возможности отказаться от них во время установки. Словом, если бы не этот недостаток, приложение можно было бы рекомендовать в качестве неплохой бесплатной альтернативы FineReader.



Рекомендуем почитать

Наверх