Как извлечь текст или изображения из файла PDF

PDF-файлы отлично подходят для обмена отформатированными файлами на разных платформах и между людьми, которые не используют одно и то же программное обеспечение, но иногда нам необходимо извлечь текст или изображения из PDF-файла и использовать их на веб-страницах, в текстовых документах, презентациях PowerPoint, или в программном обеспечении для настольных издательских систем. 

В зависимости от ваших потребностей и параметров безопасности, установленных в отдельном файле PDF, у вас есть несколько вариантов извлечения текста, изображений или обоих из файла PDF. Выберите вариант, который лучше всего подходит для вас.


  • Используйте Adobe Acrobat Professional. Если у вас есть полная версия Adobe Acrobat, а не только бесплатная программа Acrobat Reader, вы можете извлечь отдельные изображения или все изображения, а также текст из PDF-файла и экспортировать их в различные форматы, такие как EPS, JPG и TIFF. Чтобы извлечь информацию из PDF-файла в Acrobat DC, выберите инструменты > Экспорт PDF и выберите вариант. Чтобы извлечь текст, экспортируйте PDF в формат Word или формат расширенного текста и выберите один из нескольких дополнительных параметров, которые включают:

    • Сохранить текущий текст
    • Сохранить макет страницы
    • Включить комментарии
    • Включить изображения

    Параметры экспорта Acrobat Pro для MS Word.


  • Скопируйте и вставьте из PDF, используя Acrobat Reader. Если у вас есть Acrobat Reader, вы можете скопировать часть файла PDF в буфер обмена и вставить его в другую программу. Для текста просто выделите часть текста в PDF и нажмите Ctrl + С скопировать это.

    Затем откройте программу обработки текста, например Microsoft Word, и нажмите Ctrl + В вставить текст. С изображением нажмите на изображение, чтобы выбрать его, а затем скопируйте и вставьте его в программу, которая поддерживает изображения, используя те же команды клавиатуры.


  • Откройте файл PDF в графической программе. Если целью извлечения изображений является ваша цель, вы можете открыть PDF-файл в некоторых программах для иллюстрации, таких как более новые версии Photoshop, CorelDRAW или Adobe Illustrator, и сохранить изображения для редактирования и использования в настольных издательских приложениях.

    Извлечение изображений из PDF в Photoshop.


  • Используйте сторонние инструменты для извлечения PDF-файлов. Доступно несколько автономных утилит и плагинов, которые преобразуют файлы PDF в HTML, сохраняя макет страницы, извлекают и преобразуют содержимое PDF в форматы векторной графики, а также извлекают содержимое PDF для использования в программах обработки текстов, презентаций и настольных издательских систем. Эти инструменты предлагают различные варианты, включая пакетное извлечение / преобразование, извлечение всего файла или его части, а также поддержку нескольких форматов файлов. В основном это коммерческие и условно-бесплатные утилиты для Windows.


  • Используйте онлайн инструменты для извлечения PDF.С онлайн-инструментами извлечения вам не нужно загружать или устанавливать программное обеспечение. Сколько каждый может извлечь, варьируется. Например, с ExtractPDF.com вы загружаете файл размером до 14 МБ или предоставляете URL-адрес PDF для извлечения изображений, текста или шрифтов. 

    Сайт ExtractPDF.


  • Сделать скриншот. Прежде чем сделать снимок экрана в PDF-файле, увеличьте его как можно больше на экране. На ПК выберите строку заголовка окна PDF и нажмите Alt + PrtScn. На Mac нажмите команда + сдвиг + 4 и используйте курсор, который появляется, чтобы перетащить и выбрать область, которую вы хотите захватить.


Ссылка на основную публикацию