Что такое PDF, чем его открыть и редактировать. Типы PDF-документов

Детские товары 15.06.2019
Детские товары

Доброго времени суток, дорогие читатели! Сегодня поговорим о такой штуке, которую многие видели, некоторые пользовались, а кому-то это кажется заморским колдунством и он обходит сие стороной, т.е про PDF .

Итак, прежде, чем рассказать что это, я расскажу для чего оно нужно. Предположим, вы открыли ваш любимый MS Word 2003/7/10/2048 , написали длинную простыню текста, оформили все это красивенько и довольные пошли показывать коллегам. И такой вот коллега берет ваш документ, открывает своим OpenOffice/LibreOffice/somethingotherOffice и ужасается от того безобразия, которое творится с документом.

Оформление поплыло, скриншоты отцентрированы криво, навигация не работает, отступ абзаца не по ГОСТу, шрифты фигпоймикакие, смотрит он на вас так вопросительно и недоумевает. А вместе с ним и вы недоумеваете, ведь у вас-то все ОК, и шрифты, специально скаченные, и отступы, выверенные с миллиметровой точностью, и скриншоты, отцентрированные с точностью до эпсилон в минус десятой. Показываете вы свое творение другому коллеге.

А у коллеги и офиса-то нету, Wordpad "ом прикажете открывать? То еще развлечение.

Так в чем же тут проблема?

Думаете в криворукости автора документа? Отнюдь, автор может и криворук, но дело совсем в другом. На самом деле, даже разные версии MS Word могут несколько по-разному смотреть на документы, не говоря уже о каких-то других программах для работы с электронной документацией. Так что же делать, чтобы другие люди могли увидеть Ваш документ именно в таком виде, в котором Вы его задумывали?

Здесь есть несколько способов:

  • Вы можете его распечатать, но это не самое удобное решение, особенно если люди находятся на другом конце синего шарика;
  • Вы можете его отправить по факсу, вот только этого факса на том конце может не быть;
  • Вы можете его сохранить в специальном формате. Тут-то и приходит на помощь PDF .

Вот о последнем, собственно, мы и поговорим.

Что такое PDF и с чем его едят

PDF (от англ. Portable Document Format ) - это специальный формат электронных документов, который не зависит от выбранной ОС, программы просмотра электронных документов или еще чего-нибудь. Он единый для любого устройства. Все, что нужно для открытия документов в этом формате - программа просмотра. Их существует великое множество, как бесплатных, так и платных.

Самая распространенная программка - это, несомненно, Adobe Reader (можно скачать , только не забудьте убрать галочки напротив McAfee и True Key ), которая написана авторами этой технологии.

Однако в AR часто находят уязвимости (а так же справедливо приписывают навязчивость, тормознутость и прочие ужасы жизни), так что кому это не нравится, смотрите в сторону аналогов (Foxit Reader, Nuance и тп).

Если кому интересно, так выглядит документ, открытый в Adobe Reader DC:

У PDF есть свои ограничения, как то:

  • Невозможность редактирования текста (кроме специализированных программ);
  • Необходимость вшивать нестандартные шрифты (для любителей делать не по ГОСТу);
  • Необходимость использования достаточно больших растровых изображений для внятного отображения при печати.

Среди преимуществ же:

  • Простота использования;
  • Возможность защитить файл от большинства действий нерадивых пользователей (пометка маркерами, поиск по словам, редактирование текста);
  • Независимость от программы просмотра. В любой программе просмотра он будет выглядеть одинаково.

Теперь поговорим о том, как его, собственно создать.

Как работать с PDF

В MS Word 2010, 13, 16 выбираете "Сохранить как " и указываете тип файла: "PDF ". Можно также снять галочку "Открыть файл после публикации ", чтобы не открывать каждый раз созданную вами PDF -ку.

Устанавливаете его, после чего запускаете Word , нажимаете на большую кнопку сверху-слева: "Сохранить как " -> "PDF или XPS " и сохраняете как PDF .

Если же вам нужен PDF файл из другой программы, при этом у нее нет возможности сохранять файлы в PDF , то достаточно скачать бесплатный виртуальный PDF принтер, например, .

Далее запускаете установщик, ждете, пока принтер установится, после этого открываете нужную вам программу, выбираете опцию "Печать ", выбираете виртуальный принтер и снова жмете на кнопку "Печать ".

Теперь выбираете интересующие вас настройки (я рекомендую отметить галочку "Embed fonts " для встраивания шрифта в ваш PDF ) и жмете на кнопку "OK ".

Есть еще и платные аналоги, но вы не подумайте, что они делают ровно тоже, но за деньги, нет. Они отличаются тем, что могут вставлять ссылки в PDF файлы, создавать закладки, оглавления, использовать водные знаки, зашифровывать PDF документ и еще много чего, что вам вряд ли в жизни пригодится:)

Кстати говоря, позволяют удобно и просто, без всяких плагинов, создавать PDF -фы на лету.

Послесловие

Вот в общем-то и все, что требуется для работы с данным форматом. Все возможности я описывать не стал, в этом нет особого смысла, ибо в большинстве случаев требуется просто сохранить файл или документ в PDF и потом открыть его каким-нибудь просмотрщиком. Так что пользуйтесь, очень удобный формат:)

Как и всегда, если есть какие-то вопросы, мысли, дополнения и всё такое прочее, то добро пожаловать в комментарии к этой записи.

PS : За существование статьи отдельное спасибо другу проекта и члену нашей команды под ником “barn4k“

Формат PDF. Описание (про PostScript), преимущества, недостатки. Предназначение и особенности формата. ПО для работы с форматом.

Читайте также:
  1. I. Коллективный анализ и целеполагание воспитатель­ной работы с привлечением родителей, учащихся, учите­лей класса.
  2. I. Особенности формирования отраслевой системы оплаты труда работников учреждений здравоохранения
  3. II. Особенности учета операций по осуществлению функций главного распорядителя, распорядителя и получателя средств федерального бюджета
  4. III Блок: 5. Особенности работы социального педагога с детьми-сиротами и детьми, оставшимися без попечения родителей.
  5. PR-мероприятия для СМИ (виды, характеристика, особенности).
  6. Абсолютная монархия в Англии. Предпосылки возникновения, общественный и государственный строй. Особенности английского абсолютизма.
  7. Абсолютная монархия в Англии. Предпосылки возникновения, общественный и государственный строй. Особенности английского абсолютизма. (лекция)

PDF (аббревиатура от англ. Portable Document Format) - разработанный фирмой Adobe Systems с использованием ряда возможностей языка PostScript, как независимый от платформы формат представления в электронном виде полиграфической продукции, различной электронной документации (в том числе электронные книги) и презентаций.

PostScript PostScript

Преимущества:



Недостатки:

Особенности: В формате PDF реализована возможность внедрять необходимые шрифты (построчный текст), векторные и растровые изображения, формы и мультимедиа-вставки. Поддерживает RGB, CMYK, несколько типов сжатия растровой информации. Имеет собственные технические форматы для полиграфии: PDF/X-1, PDF/X-3. Включает механизм электронных подписей для защиты и проверки подлинности документов. Имеется возможность импорта из большинства современных форматов текстовых документов, векторных и растровых графических форматов.



PDF MRC – свой метод сжатия. Это тот же PDF, но заимствующий многие элементы из DjVu.

При использовании MRC размер страницы уменьшается в несколько раз при сохранении качества. Это происходит благодаря решению разделить изображение на слои и каждый слой сжимать наиболее подходящим кодеком. Текст сжимается кодеком JBIG2, всё остальное сжимается с помощью JPEG/JPEG2000/ZIP с разным качеством.

PDF может быть использован для:

Создания электронных документов;

Обмена данными (многие приложения могут читать PDF-файлы);

Архивирования данных (существуют приложения, позволяющие индексировать PDF-файлы, что позволяет создавать электронные библиотеки в PDF-формате);

Интерактивных документов (PDF может быть использован для создания электронных форм, данные из которых хранятся в базе данных).

Традиционным способом создания PDF-документов является виртуальный принтер т.е. документ как таковой готовится в своей специализированной программе - графическом или текстовом редакторе, САПР и т.д. А затем экспортируется в pdf для распространения в электронном виде, передачи в типографию и т.п. Все данные в нем могут сжиматься, причем по-разному: JPEG, RLE, CCITT, ZIP. PDF может также сохранять всю информацию для выводного устройства, которая была в исходном PostScript-файле.

Для просмотра можно использовать официальную бесплатную программу Acrobat Reader, а также программы сторонних разработчиков.

Для создания и редактирования:

Многие приложения, такие как Corel Draw 9 или Adobe InDesign, имеют опцию «export to PDF».

Из приложений, которые не имеют этой опции, вы можете просто напечатать документ в PostScript-файл и затем использовать отдельное приложение под названием Adobe Acrobat Distiller для конвертации его в PDF-файл.

Приложение Adobe Acrobat (раньше называлось Exchange) может быть использовано для добавления в PDF-файл мультимедийных функций, гиперлинков, закладок и прочего.

5. Формат PDF. Описание, преимущества, недостатки. Обобщённая структура формата. Структура файла. Структура документа. Три типа структурированных документов.

PDF (аббревиатура от англ. Portable Document Format) - разработанный фирмой Adobe Systems с использованием ряда возможностей языка PostScript, как независимый от платформы формат представления в электронном виде полиграфической продукции, различной электронной документации (в том числе электронные книги) и презентаций.

PostScript – язык программирования для работы с принтерами. Технология PostScript позволяет упростить и автоматизировать процесс печати. Во время вывода на экран документа, содержащего изображение, программа макетирования страниц преобразовывает пиксели в коды PostScript, которые понятны принтеру. Во время вывода пиксели заменяются на последовательности полутоновых точек (half-tone-dots), которые и воспроизводятся при печати. Эти точки круглые, занимают несколько пикселей. В отличие от пикселей, эти точки не имеют специального цвета и не покрывают всего изображения. Бывают разного размера, благодаря чему при их просмотре невооруженном глазом создается впечатление, что присутствуют разные оттенки. Размер точки зависит от цветов тех пикселей, которые она заменила. Программы управления векторной графикой создают истинный код PostScript уровня 2 и 3, который впоследствии отправляется в печатающее устройство. PostScript – язык программирования, имеющий набор управляющих конструкций. Программа на языке PostScriptинтерпретируются, а не компилируются. Все данные, используемые операторами языка, хранятся в стеках. Программа на языке PostScript – это последовательность операторов, заданных в постфиксной нотации или обратной польской записи: операнды записываются перед оператором. Читая файл программы, интерпретатор записывает в стек операнды, затем выполняет оператор, снимая операнды со стека.

Преимущества:

Кроссплатформенность (означает, что вы можете увидеть документ точно таким же, каким он был создан, вне зависимости от того, на какой платформе он создавался);

Машино-независимость (может быть напечатан как на принтере, так и на полиграфической машине)

Компактность, т.к. PDF поддерживает большое количество алгоритмов компрессии данных.

Мультимедийность (поддерживает элементы, такие как видео- и/или звуковые ролики, так же как и гипертекстовые элементы и превью страниц)

PDF поддерживает безопасность. Создатель PDF-файла может задать несколько опций безопасности. Возможно заблокировать файл так, что он может быть открыт только после ввода пароля. Также возможно запретить изменение файла и/или его печать.

Недостатки:

PDF - патентованный формат компании Adobe, соответственно имеет закрытую структуру.

PDF пытается стать всеохватывающим стандартом, что не позволяет ему быть настолько эффективным, как специализированные решения. Вы можете использовать PDF в Интернете, но HTML-файлы более эффективны. Можно использовать PDF для обмена графикой, но большинство препресс-приложений используют форматы EPS и TIFF.

PDF-файлы сложно редактировать. Небольшие изменения могут быть внесены, но очень сложно, если не невозможно, добавлять блоки текста или изображения в существующий PDF-файл.

Структура формата:

Объекты (несколько типов: логические; числовые; последовательность символов; таблицы, состоящие из 2 элементов, включающих значения; объекты типа stream)

Структура файла

Структура документа

Страничное описание

Структура файла:

Заголовок (Первая строка PDF-файла, определяет номер спецификации PDF, которой придерживается данный файл, грубо говоря, версию файла )

Тело (Содержит последовательность косвенных объектов, входящих в состав публикации. Объекты - это компоненты публикации: страницы, изображения, шрифты. Комментарии могут быть во всем PDF-файле. Их синтаксис совпадает с синтаксисом комментариев в PostScript, они начинаются с % и заканчиваются символом конца строки)

Таблица перекрестных ссылок (Таблица содержит информацию о каждом объекте в файле в виде одной строки описания места объекта в файле. PDF-файл содержит таблицу, состоящую из одного или более разделов. Если нет изменений или добавлений в файл, таблица состоит из одного раздела. В противном случае в ее состав добавляется новый раздел.)

Трейлер (позволяет программному приложению при чтении PDF-файла быстро находить таблицу перекрестных ссылок и специальные объекты. Приложения должны читать PDF-файл с конца)

Структура документа – иерархия объектов, содержащихся в теле PDF-файла.

Каталог – главный объект, содержащий ссылки на дерево страниц в документе, ссылку на дерево объектов, представляющих схему документа, ссылки на статьи и места их назначения. Каталог может показывать также, где хранятся публикации.

Дерево страниц - доступ к страницам документа открывается через дерево узлов, названное деревом страниц. Это дерево определяет порядок страниц в документе. Структура дерева позволяет приложению быстро открыть документ, содержащий тысячи страниц, используя ограниченный объем памяти. Структура дерева страниц документа не связана с содержимым документа.

Дерево закладок – описывает содержание и последовательность закладок на странице.

Дерево статей – может включать несколько статей, которые могу содержать несколько фрагментов.

Место назначение - комментарии и закладки могут определять место назначения, которое состоит из страницы, места на странице и масштаба показа страницы.

3 типа структурирования PDF-файлов:

1) Неструктурированные файлы – они не обладают древовидной логической структурой, все содержимое интерпретируется, как единый блок, не имеющий никакой иерархии или внутренней связи. При конвертации таких файлов сохраняется только текст и исходные абзацы, все остальное форматирование исчезает.

2) Структурированные файлы – обладают древовидной структурой, позволяют сохранять содержимое в естественном порядке. В отличие от неструктурированных, эти файлы сохраняют и внутреннее форматирование (включая, например, атрибуты шрифта), но не сохраняют таблицы, списки и т.д.

3) Размеченные файлы – характеризуются логической структурой, набором четких связей между различными элементами, содержат дополнительную информацию, позволяющую выполнять форматирование.

Формат DjVu. Описание, преимущества, недостатки. Шесть основных технологий, которые лежат в основе формата. Разрушающие и не разрушающие методы сжатия. Технология разделения на слои.

DjVu – графический формат, который используется преимущественно для сохранения и сжатия отсканированных книг, содержащих цветные изображения и текст.

Особенности:

Чисто растровый формат

Применяется для учебной литературы

Для переноса информации с бумажных носителей в электронный вид (сканирование)

Сохраняет структуру фона

Структура формата открыта

Комбинация разрушающего и неразрушающего методов упаковки . Например, упаковка цветов в палитры (преобразование цветовых координат, в том числе преобразование цветного изображения в черно-белое) или схема аппроксимации по опорным точкам относятся к типичным "разрушающим" преобразованиям, в результате которых информация теряется безвозвратно. В качестве неразрушающего преобразования обычно используются различные вариации на тему алгоритма Лемпеля-Зива.

Плюсы:

Главный плюс – это, безусловно, небольшой размер;

При небольшом размере файла сохраняется хорошее качество изображений и особенно текста;

Обрабатывается только видимое изображение, что снижает нагрузку на потребление ресурсов компьютера, что особо актуально для файлов большого размера и для владельцев слабых машин;

Возможность использования формата для отображения литературы и документов, содержащих формулы, диаграммы, таблицы, а также исторических документов, с сохранением фактуры отсканированного документа;

Текст остается четким даже при сильном увеличении.

Минусы: DjVu – это сжатие изображения с потерями. То есть часть информации неизбежно теряется. В основном, это касается картинок.

В основу разработки формата положено 6 технологий :

1) Алгоритм отделения текста от фона на отсканированном изображении

2) Вейвлетный алгоритм сжатия фона IW44

3) Универсальный алгоритм сжатия ZIP

4) Алгоритм распаковки «по запросу» (позволяет показать часть изображения, не разворачивая всю картинку в оперативной памяти компьютера, а также легко масштаб. изображение)

5) Алгоритм «маскировки» изображений

6) Алгоритм сжатия чёрно-белых изображений JB2

Для сжатия цветных изображений в DjVu применяется специальная технология, разделяющая исходное изображение на три слоя: передний план, задний план и чёрно-белую (однобитовую) маску. Маска сохраняется с разрешением исходного файла; именно она содержит изображение текста и прочие чёткие детали. Разрешение заднего плана, в котором остаются иллюстрации и текстура страницы, по умолчанию понижается для экономии места. Передний план содержит цветовую информацию о маске; его разрешение обычно понижается ещё сильнее. Затем задний и передний планы сжимаются с помощью вейвлет-преобразования, а маска - алгоритмом JB2.

Особенностью алгоритма JB2 является то, что он ищет на странице повторяющиеся символы и сохраняет их изображение только один раз. В многостраничных документах каждые несколько подряд идущих страниц пользуются общим «словарём» изображений.

Загружая документ из Интернета, вы можете заметить, что он имеет формат.PDF. Возможно, вы также заметили, что его трудно (если вообще возможно) редактировать. Чтобы открыть файл.PDF формата нужно иметь специальную программу, например Adobe Acrobat Reader. Иногда пользователи путаются, какой формат выбрать. Почему люди используют PDF файлы? Разве не проще пользоваться.DOC или.DOCX форматами?

На самом деле, формат.PDF широко распространен для передачи различного рода документов и электронных книг. Почему так произошло? Давайте разберемся, что такое PDF файл , и узнаем его плюсы и минусы.

Преимущества PDF файлов

Давайте вернемся к вопросу “Что лучше, PDF или DOCX ?”. DOCX - отличный формат для пользователей, которые используют Microsoft Office на своих устройствах. DOCX это стандартный формат документов Microsoft Word. Но если кто-то открывает ваш файл, на его компьютере должен быть установлен текстовый редактор от MS, или другая программа, которая умеет работать с этим форматом. Хотя и большинство могут конвертировать.DOC в нужный формат, этот процесс иногда изменяет оригинальное форматирование и создает лишние хлопоты.

К счастью, большинство операционных систем полностью поддерживают PDF файлы. Это значит, что вам не нужно создавать документ специально для пользователей Windows, IOS, или Android. Просто выберите PDF и будьте уверены, что он откроется на любом устройства.

Когда стоит использовать.PDF формат?

В ситуациях, когда вы не знаете, на какой операционной системе будет открываться файл, используйте PDF. Скажем, вы решили выложить на сайт книгу, журнал, брошюру, или какой-либо важный документ. На сайт могут заходить люди с компьютеров под управлением Windows, Linux или владельцы смартфонов на IOS или Android. Лучшим вариантом в данном случае будет использование.PDF формата. Каждое устройство сможет его открыть и отобразить содержимое.

Еще лучше, если после загрузки документа, он автоматически открывается через браузер. Популярные браузеры, такие как Google Chrome (это одна из ) или Mozilla Firefox имеют встроенные PDF-просмотрщики, потому люди могут просмотреть документ просто и быстро.

Отдавайте преимущество PDF файлам при отправке по Email. Представим, что вы отправляете резюме. Хорошо, если получатель проверяет почту с компьютера, и может открыть.DOCX файл. А если нет? Со смартфона или планшета проще открыть.PDF ежели.DOC.

Недостатки.PDF формата

Получив файл, вы можете захотеть изменить его, но тут кроется одна из основных проблем PDF файлов - их сложно редактировать. Если DOC файл это оригинальный текстовый документ, который можно легко изменять, то PDF больше напоминает изображение. Редактирование возможно, но для этого нужен просмотрщик со встроенной функцией редактирования, или соответствующая программа.

Когда не нужно использовать PDF

Не используйте формат.PDF, когда вы хотите иметь “живой документ” , который может быть отредактирован другими пользователями. Вы можете добавить редактируемые поля в PDF документ, но полное редактирование требует немалых усилий. Если вы работаете с другими пользователями, желательно узнать, какие операционные системы они используют и договориться о типе файлов, который подходит всем.

По крайней мере, каждый может использовать облачную службу документов, например Google Docs. Для режима “только чтение” хорошо подойдет PDF, а для редактирования - его использовать не стоит.

Итог

Теперь вы знаете, что такое PDF файл , в каких случаях его стоит использовать, а которых лучше подойдет.DOC. Прежде чем создавать документ, подумайте о тех, кто будет им пользоваться. Желаю удачи.

Межкорпоративный документооборот (внешний ЭДО)

Чем отличается формат PDF от PDF/A, и какой формат лучше использовать для сохранения отсканированных образов документов?

Ришат Мухаметшин 16 мая 2013 г. 16:10

PDF (“portable document format”) - это универсальный формат электронных документов, которому, кстати, скоро исполнится 20 лет. Он создан по инициативе компании Adobe, и исходное его предназначение - электронное представление печатных материалов. Отсюда следует задача данного формата, связанная с хранением информации о цветовой схеме и расположении элементов, обеспечить идентичный вывод на разных мониторах и принтерах.

За время своего существования формат PDF значительно прибавил в возможностях. В первой же редакции формата появилась возможность вставлять в текст документа гиперссылки, шифровать документ с паролем и тем самым защищать его от модификации. В версии PDF 1.4 появилась возможность поверх изображения наносить текстовый слой, в том числе невидимый, давая пользователю возможность, видя “картинку”, тем не менее, копировать с неё текст. Кроме того, в этой же версии появилась возможность вставлять метаданные в виде пар “ключ-значение”, каждая из которых может быть связана с какой-то частью документа (например, отдельным изображением) или со всем документом целиком. Это важные нововведения, с точки зрения архивного хранения, и они поддерживаются форматом по сей день.

PDF/A - это подмножество формата PDF, содержащее ограниченный набор возможностей представления данных. Данный формат является стандартом ISO и предназначен для долгосрочного хранения электронных документов. Обеспечение длительного срока хранения достигается посредством внедрения в содержимое электронного документа в формате PDF/A всей информации, необходимой для его отображения. Такой информацией, в частности, являются шрифты - те из них, которые использованы в документе, включены в него. К слову, это влияет на его размер: документ в формате PDF/A не меньше, а вероятно даже больше по размеру, чем документ с аналогичным содержимым, сохранённый в формате PDF.

Считается, что документ, хранимый в формате PDF/A, ввиду полного отсутствия связи с такими изменчивыми вещами как гиперссылки и мультимедийный контент, можно будет открыть в любой операционной системе через какое угодно длительное время с помощью приложения, поддерживающего соответствующий формат. Поскольку PDF/A обеспечен статусом международного стандарта, его поддержка со стороны разработчиков ПО в долгосрочной перспективе оправдана, а использование целесообразно по сравнению с другими доступными форматами хранения, которые могут измениться в любой момент времени (вспомним недавнюю историю с отказом от поддержки документов Word старого образца до версии 2003 в Google Drive - старт умерщвлению формата Word 97–2003 дан).

При этом целостность и неизменность неподписанного документа в формате PDF/A не может быть гарантирована и не заявляется как особенность формата. Другими словами, несмотря на то, что данный формат позиционируется как обеспечивающий долгосрочное хранение, изменение содержимого документа возможно и не является отклонением от нормы, если оно не зашифровано. Однако есть ещё один нюанс: для каждого конкретного документа, формат которого заявлен как PDF/A, невозможно заведомо утверждать, что это действительно так. Необходима верификация на соответствие требованиям формата для каждого конкретного документа, и если на этапе размещения в архиве или после очередного изменения она не будет проведена, можно считать миссию обеспечения долгосрочного хранения потенциально проваленной (с некоторыми оговорками, но всё же).

Исходя из описанных выше различий между форматами PDF и его потомком PDF/A, вполне можно предположить, что первый больше пригоден для оперативного обмена и краткосрочного хранения электронных документов, тогда как PDF/A, несмотря на потенциально большой размер единичного документа (в него внедрены все использованные шрифты, а это для краткосрочного использования избыточный и ощутимый балласт), имея статус международного стандарта, гарантирует, что даже через продолжительное время, вне зависимости от окружения и операционной системы, любой пользователь сможет открыть документ в данном формате, располагая приложением-просмотрщиком. Этот факт укладывается в концепцию архива электронных документов и должен учитываться при сохранении каждого документа в нём.

Теперь необходимо определиться с тем, что такое отсканированный образ документов. В подавляющем большинстве случаев это растровое изображение. Предполагается, что текста поверх него нет, то есть в документе хранится исключительно отсканированный растр - изображение, текст на котором непонятен компьютеру, а понятен только человеку. В исключительных случаях поверх растрового изображения может быть расположен текстовый слой, частично или целиком наполненный либо вручную человеком, либо с помощью системы распознавания текста. Можно предположить, что документ содержит метаданные, так или иначе связанные с видом документа и его содержимым (например, если это счёт-фактура, метаданные могут содержать информацию о поставщике, дате выставления, сумме и т.д.).

Очевидно, что отсканированный образ документа допускает, но не подразумевает долгосрочного хранения. Но всё-таки в большинстве случаев образ должен храниться не меньше бумажного оригинала, а зачастую значительно дольше, поскольку значимость и важность его в контексте организации-владельца всегда держится выше нулевой отметки. Кроме того, образ снят с бумажного документа, а это значит, что его изменение не подразумевается, хотя и возможно.

На основании перечисленных особенностей, которыми обладает отсканированный образ документа, можно смело заявлять, что одинаково пригодны оба формата, поскольку для каждого конкретного документа не будут использованы возможности формата такие, которые не поддерживаются стандартом PDF/A. Последний допускает и метаданные, и текстовый слой поверх изображения, и даже подписание документа с целью защитить его от модификации. А необходимостью внедрения шрифтов в каждый документ можно пренебречь: поскольку речь идёт об образах, и текста нет, соответственно, нет и шрифтов, и добавочный вес в этом отношении будет мал.

(4,10 - оценили 10 чел.)

Приветствую, друзья!

Мне намедни сделали предложение написать обзор программы для в редактируемый формат. Естественно, от такого предложения я не смог отказаться, тем более, что мне пообещали подарить полную лицензию данной программулины. Да и лестно, если честно пообщаться с зарубежным разработчиком напрямую, а не через поддержку)))

К вопросу знания английского языка. Я как и многие в нашей стране владею только двумями)) языками: русским и матерным))) Но это не мешает мне спокойно общаться и с зарубежными разработчиками и с поддержкой (у меня есть и иногда приходиться задавать вопросы).

Вот так и переписываемся: они мне на английском, я им на русском. Причем, я как-то написал что, вот мол, звиняйте не владею английским, а мне в ответ пришло: «Ладно тебе, парень, я сам не особо владею английским, живу в Индии, работаю в поддержке удаленно и спокойно пользуюсь гугл-переводчиком». Вот так…

Сижу вот неделю уже кручу-верчу-изучаю программу, даже почти сел писать обзор… Но прежде, чем писать о программе (очень неплохая программа, кстати) решил еще раз написать о файлах PDF.

Спокойно! Не надо закрывать статью!

Все дело в том, что файлы PDF бывают разными. Да-да, именно разные. И именно поэтому, у многих людей не получается редактировать PDF-файлы. Ко всему прочему, недавно у меня сложилась некая структура того, какими бываю PDF-ки.

Итак, если рассматривать pdf-фалы с точки зрения их создания, то получим следующее:

Первое. PDF как изображения

Редактировать такие пдфки возможно только двумя способами:

  • Открывать в графическом редакторе, например в Фотошоп, и редактировать, как картинку(изменять яркость и контраст, менять насыщенность, вырезать и затирать и тд). Но если у вас отсканированный текст, то можно сделать проще.
  • Воспользоваться программой распознавания текста, так называемой системой OCR. За последние лет 20 (!), что я активно использую такие системы, пока ничего лучше программы FineReader не встречал. Нет, попадались мне хорошие решения, но как правило, с распознованием русского языка в них были проблемы…

Второе. PDF созданные из разных приложений

Еще пару лет назад создать PDF было проблемой, приходилось использовать или какие-то . Прогресс не стоит на месте и на текущий момент создать PDF-файл можно практически из любого офисного приложения (как сделать pdf в Word я писал ).

Так вот, pdf созданные подобным образом можно редактировать, практически, как угодно и чем угодно. Вплоть, до простого копировать-вставить.

Кстати, любой PDF-файл замечательно открывается в Фотошопе, имейте ввиду…

Исключением могут являться документы, на которых стоит защита. Но это уже другая, довольно занимательная, история… Я даже провел несколько экспериментов по установке и снятию защиты, но расскажу об этом в другой раз.

Третье. Интерактивные PDF

Современный тренд в подаче электронных материалов. В виде интерактивных PDF могут быть сделаны и книги, и журналы, и резюме и многое другое. Даже различные бланки и то, могут считаться интерактивными, хотя бы потому, что после заполнения такого бланка его можно отправить по электронной почте с помощью кнопки «Отправить» встроенной прямо в PDF-документ (Справедливости ради, стоит отметить, что реализован такой функционал довольно коряво — по нажатию на кнопку «Отправить» происходит запуск почтового клиента, типа OutLook, в котором уже открывается новое письмо с вложенным файлом…)

Кроме всего прочего, современный PDF позволяет встраивать и, соответственно, просматривать в любой программе для просмотра PDF:

  • Внешние и внутренние ссылки
  • Слайдеры (галерея самосдвигающихся картинок)
  • Видеоролики
  • Аудиотреки
  • Элементы интерфейса (кнопки, списки, выпадающие списки)
  • Увеличение изображений при наведении
  • Различные анимации

Если в двух словах, то в формате PDF можно сделать почти современный сайт со всем его функционалом…

Но есть тут и свои подводные камни:

Во-первых, чтобы реализовать такой интерактив, потребуется уметь пользоваться на хорошем уровне программой InDesign.

Во-вторых, не всегда и не на всех компьютерах такие файлы могут работать (на компьютере должен быть установлен флеш проигрыватель).

В-третьих, на мобильных устройствах такие интерактивные PDF очень плохо работают, как раз в силу малой мощности таких устройств (хотя все ближе тот миг, когда телефон будет мощнее настольного компьютера, не говоря уже о ноутбуках) и невозможности адаптации pdf-документа под размер мобильных устройств.

В-четвертых, я так и не смог заставить работать gif-анимацию в pdf, видимо эта штука не поддерживается. Если кто знает как сделать что бы работала gif-анимация в pdf, дайте знать в комментариях.

С другой стороны, преимущества интерактивного PDF перевешивают все его минусы. Да и при необходимости, отредактировать или конвертировать такой файл так же элементарно, как и PDF сделанный из Word.

Вот какие базовые виды PDF-файлов получили нынче распространение… Есть еще комбинированные виды, например можно комбинировать pdf-изображение и интерактивный pdf. Как всегда, все зависит от того, что вам требуетcя получить на выходе от pdf.

На этом, дорогие друзья, я с вами прощаюсь до следующей статьи. Всем удачи!



Рекомендуем почитать

Наверх