Как сохранить любую веб-страницу в виде изображения или PDF

Наверняка бывали случаи, когда вы читали что-то в интернете и хотели сохранить страницу для прочтения позже. В таком случае можно сохранить часть страницы в виде изображения или документа. В этой статье рассказано, как сохранять веб-страницы в файлы формата PDF и в виде изображений.

Мы часто сохраняем понравившиеся статьи в закладках браузера,
намереваясь вернуться позже. Со временем эта коллекция начинает захламляться, нужную страницу практически
невозможно отыскать или она пропадает с сайта. Если вы нашли полезную статью, которая пригодится в
будущем, лучше экспортировать ее на компьютер как отдельный документ. Рассказываем, как сохранить страницу
сайта в PDF для дальнейшего чтения, редактирования или копирования информации.

Если вы работаете в цифровой среде, вам может потребоваться поделиться веб-страницей со своими товарищами по команде. В большинстве случаев передачи ссылки достаточно, но вам необходимо преобразовать веб-страницы в формат PDF для автономного обмена или для целей ведения записей. Служба webtopdf.com может решить эти проблемы. Вы можете вручную создавать высококачественные PDF-документы с любого URL в вашем браузере, и он поставляется с различными встроенными опциями преобразования.

Почему выбран именно этот вариант?

Самым главным преимуществом является то, что для генерации PDF браузером Chrome не нужно расширять технологический стек. Фронтенд разработчики создают HTML привычными средствами разработки и сразу видят промежуточные результаты труда в браузере. В это же время Chrome уже наверняка крутится в тестах и перенести его на бекенд не составляет большого труда. Так же следует отметить тот факт, что верстальщику становится доступен весь арсенал css свойств включая Flexbox и Grid.
О недостатках и способах их обхода я расскажу по ходу статьи.

Время на прочтение

Как сохранить любую веб-страницу в виде изображения или PDF

Недавно в одном стартапе я решал задачу генерации билетов в формате PDF. На тот момент уже был готов сайт с устоявшимся стеком технологий, поэтому я искал подход, который бы не потребовал использования дополнительных инструментов. В итоге я предложил сперва создавать билеты в формате HTML, а затем конвертировать в PDF с помощью браузера Chrome. Как оказалось, данным способом можно генерировать не только билеты, богато декорированные CSS, но и самые разные отчеты с графиками на JavaScript. В этой статье я расскажу о том, как для этих целей запустить Chrome, дам несколько советов по настройке CSS, а так же обсужу недостатки данного решения.

Здесь не будут обсуждаться альтернативные варианты, потому как по ним написано уже достаточно, их легко найти, и они представляют собой готовые инструменты, информацию по которым лучше смотреть в первоисточниках — в документациях на официальных сайтах. Предлагаемый способ не является самостоятельным инструментом и больше похож на побочный продукт развития нескольких технологий. В русскоязычном сегменте интернета собранной воедино информации по нему немного, поэтому я и решил восполнить пробел.

О конвертировании отдельных веб-страниц в кроссплатформенный формат электронных документов Portable Document Format (PDF) мы недавно рассказывали. Пришло время поделиться методикой сохранения в единый PDF-файл сайтов целиком. В ряде случаев это может быть удобнее банального копирования сетевого контента в HTML, так как PDF четко структурирован, оснащен функциями поиска и отлично подходит для архивации тех или иных данных, включая веб-ресурсы.В результате откроется окно инструментария для конвертации сайтов в формат PDF, умеющего обрабатывать интернет-ресурсы с заданной глубиной сканирования и упаковывать разнородный сетевой контент в один файл с сохранением изображений, анимации, флеш-роликов и связей между страницами.После этого останется только указать адрес сайта, малость покумекать с настройками утилиты, дождаться завершения работы программы и компиляции PDF-документа. В зависимости от объемов скачиваемых и обрабатываемых данных, создание файла может занять продолжительное время.

Как сохранить страницу браузера целиком в Windows 10 и Windows 11

В операционных системах Windows 11 и Windows 10 имеется встроенный инструмент — виртуальный принтер Майкрософт. С его помощью можно сохранить в формате PDF веб-страницу, открытую в браузере, или использовать это приложение в других программах, имеющих функцию печати.

Этот способ работает по следующему принципу:

  • Пользователь открывает в любом браузере нужную веб-страницу, которую необходимо сохранить на компьютере в виде отдельного файла.
  • В настройках браузера выбирается печать.
  • Среди установленных принтеров необходимо выбрать виртуальный принтер Microsoft.
  • После установки параметров печати запускается функцию печати для сохранения страницы сайта в формате PDF.

Выполните следующие действия:

Как сохранить любую веб-страницу в виде изображения или PDF

Функция печати вызывается одинаково во всех популярных браузерах с помощью сочетания клавиш «Ctrl» + «P».

  • В браузере откроется окно настроек печати. Здесь отображены все характеристики, необходимые для печати веб-страницы.
  • В опции «Принтер» выберите «Microsoft Print to PDF».

Если необходимо, укажите другие параметры: сколько условных листов бумаги напечатать, раскладку, цвета печати, а в дополнительных настройках — размер бумаги, число страниц (все страницы или только отдельные страницы — в данном случае, это части одной веб-страницы, разделенные на несколько листов одного документа), поля, выберите масштаб.

На изображении ниже показаны свойства функции печати в браузере Google Chrome. В других браузерах имеются подобные настройки с небольшим отличием в интерфейсе.

Как сохранить любую веб-страницу в виде изображения или PDF

  • Нажмите на кнопку «Печать».
  • В окне «Сохранение результата печати» выберите место хранения документа, задайте имя файлу, а тип файла выбран по умолчанию — PDF-документ (*.pdf).
  • Нажмите на кнопку «Сохранить».

Как сохранить любую веб-страницу в виде изображения или PDF

В результате, на компьютере появится файл в формате PDF, который вы можете открыть с помощью приложения, поддерживающего просмотр данного типа файлов.

Как сохранить любую веб-страницу в виде изображения или PDF

Преобразование веб-страницы в PDF одним щелчком мыши! Скопируйте и вставьте URL-адрес веб-страницы и нажмите кнопку «Преобразовать».

Использовать Print Layout

Добавить номер страницы

Преобразовать в оттенки серого

Время ожидания секунды

Водяные знаки

  • Идеальное качество
  • Наш сервис может конвертировать любой сайт в PDF, сохраняя его в целости и сохранности. Существуют ли какие-либо онлайн-сервисы конвертации веб-страниц, такие как Webtopdf, которые предлагают такое высокое качество конверсии?
  • Преобразование стало проще
  • Простой интерфейс позволяет легко преобразовать сайт в PDF. Вы можете установить параметры и конвертировать всего за несколько кликов после ввода URL. Если у вас нормальное сетевое интернет-окружение, вы можете получить результат за считанные секунды.
  • Безопасность гарантирована
  • Загруженные файлы и данные автоматически и сразу удаляются после использования сервиса. Конвертированные файлы автоматически удаляются системой через 1 час после конвертации. Никто не имеет доступа к файлам, и он не оставляет следов работы после удаления. Webtopdf предоставляет защищенный сервис посредством передачи зашифрованных файлов на основе SSL.
  • Поддержка всех платформ
  • Webtopdf – это веб-приложение, которое обслуживается через веб-браузер. Поддержка Explorer, Chrome, Safari, Firefox, Opera. Наши сервисы основаны на браузере, поэтому их можно использовать на любой платформе, которая может запускать браузер, независимо от того, работает ли пользователь под управлением Windows, Linux или Mac.
  • Серверы в облаке
  • Вы можете использовать бесплатный сервис конвертации в любом месте с подключением к Интернету. Сервис Webtopdf отлично работает в облаке. Все преобразования выполняются в самом облаке, поэтому вы не потребляете ресурсы на своем компьютере. Вам не нужно устанавливать Active X, отдельное приложение для преобразования файлов.

Сейчас я расскажу о том, как сохранить файл в PDF на компьютере. Многие пользователи сталкиваются с необходимостью сохранения документов в формате PDF.

Формат PDF часто используется для официальных документов, документации, инструкций и т. п. Файлы в формате PDF (Portable Document Format) легко переносятся на другие устройства, так как это межплатформенный формат электронных документов.

Преимуществом данного формата является то, что файл в формате PDF одинаково выглядит на любом устройстве, в любой операционной системе. Для отображения файла на устройстве нужна лишь программа для просмотра PDF. Современные браузеры поддерживают открытие файлов PDF непосредственно в браузере.

Документы формата PDF создаются при помощи виртуального принтера, поэтому сохранить документ в PDF не составит большого труда. Для этого, необходимо наличие на компьютере виртуального принтера.

Пользователям операционной системы Windows 10 ничего не придется устанавливать, потому что виртуальный принтер Microsoft Print to PDF интегрирован в систему. Пользователи других версий операционной системы Windows могут установить на свой компьютер специальную программу — виртуальный принтер, например, бесплатные программы: Bullzip PDF Printer, PDFCreator, doPDF, CutePDF Writer.

После установки виртуального принтера, на компьютере появится возможность для сохранения файлов и документов в формате PDF, благодаря функции печати, которая встроена в большое количество приложений.

Для создания или сохранения файла в формат PDF выполните следующие действия:

  • Откройте файл или документ, который необходимо преобразовать в PDF, в программе, служащей для открытия файлов данного типа.
  • Отправьте файл на печать.
  • Выберите виртуальный принтер, среди предложенных системой принтеров.
  • Настройте другие параметры печати, например, количество сохраняемых страниц, качество печати и т. п.
  • Дайте имя файлу, выберите место сохранения.
  • Запустите процесс печати.
  • После завершения печати, получите на выходе файл в формате PDF.

При выборе принтера для печати ориентируйтесь на название принтера. Например, физические принтеры, печатающие содержимое файла на бумаге имеют обозначения, начинающиеся с названия фирмы производителя устройства, например, «HP», «Canon» и т. д. Виртуальный привод будет иметь другое название (смотрите примеры выше в статье).

Соответственно, при выборе реального физического принтера содержание документа будет напечатано на бумаге, а при выборе виртуального принтера — сохранено в формате PDF. В дальнейшем, если необходимо, файл ПДФ также можно напечатать на бумагу (сохранить в бумажном виде).

Довольно часто государственные организации требую для пересылки файлы в формате PDF. Имейте в виду, что размер файла ПДФ может быть большим, поэтому имеет смысл сжать PDF, перед отправкой по электронной почте.

Далее рассмотрим на примерах 3 способа для создания файла в формате PDF: сохранение документа, изображения, страницы сайта.

На странице посещаемого сайта могут находится нужные данные, которые необходимо иметь под рукой в любой момент времени. Один из вариантов не потерять важные сведения — сохранение содержимого страницы веб-сайта в формате PDF.

Существует несколько способов для сохранения необходимой информации с веб-сайтов в Интернете:

  • С помощью закладки в браузере.
  • Копирование URL-адреса с последующим сохранением его в текстовом документе.
  • Сделать скриншот страницы, сохранив изображение в виде графического файла.
  • Использование онлайн сервиса для отложенного чтения, например, Pocket.
  • Сохранение на ПК в виде файла HTML и папки с дополнительными данными.
  • При помощи виртуального принтера в формате PDF.

Все эти способы имеют свои преимущества и недостатки, когда используются в разных ситуациях.

После сохранения закладки на нужную веб-страницу в браузере можно снова легко открыть этот сайт. Но, этот способ вызовет затруднения, когда в вашем браузере уже имеется много закладок. Вам потребуется некоторое время на поиск.

В случае, сохранения ссылки в текстовом документе или в программе для заметок, велика вероятность забыть через некоторое время о том, где и что вы сохраняли.

:/>  Как добавить Мой компьютер на рабочий стол Windows 10: все способы вывода данного ярлыка на главный экран в Виндовс

На сервисе для отложенного чтения вы можете прочитать содержимое страницы сайта в удобное для вас время. Но для этого, как и в предыдущих способах, необходимо иметь постоянное интернет-соединение для связи с онлайн ресурсом.

Не забывайте о том, что веб-страницы в Интернете и даже целые сайты удаляются, поэтому вы не сможете больше найти необходимую информацию.

Если сохранить снимок веб-страницы в качестве файла графического формата, то не всегда удобно просматривать некоторые мелкие детали на подобном изображении.

При работе на компьютере, пользователи имеют возможности для сохранения необходимой информации, находящейся на веб-сайте в форматах HTML (включая формат архива HTML) и PDF. В этом случае, на вашем ПК появится локальный файл, который вы сможете использовать без наличия Интернета на любом устройстве.

Наиболее подходящий и распространенный метод — сохранение страницы сайта в PDF. Файл PDF — это универсальный формат документов, созданный в компании Adobe Systems, который одинаково отображается на любом устройстве.

При этом способе используется функция печати, выполняемая с помощью виртуального принтера, установленного в браузере, в операционной системе Windows или на специализированном онлайн сервисе. Это другой вид принтера, который используют помимо обычного физического принтера, подключенного к компьютеру.

В этой статье вы найдете инструкции о том, как сохранить страницу из интернета в PDF несколькими способами. Мы расскажем, как сохранить страницу браузера в PDF разными методами:

  • с помощью системного виртуального принтера;
  • применяя виртуальный принтер от стороннего разработчика;
  • при помощи виртуального принтера, встроенного в браузер;
  • используя расширение в браузере;
  • как сохранить веб-страницу в PDF онлайн:
  • сохранение в ПДФ на телефоне, работающем на ОС Android.

Иногда очень нужно сохранить какую-то страницу сайта в формате PDF – чтобы потом к ней можно было вернуться или же просто для дальнейшей печати (ведь доступ к принтеру есть под рукой не всегда). А еще я так иногда делаю, когда хочется показать сразу какую-то фишку нашей статьи на WIFiGid какому-то человеку. В этой заметке все показываю на примере нашего сайта.

Главная сложность новичка – если использовать стандартную функцию любого браузера «Сохранить как», то там просто нет варианта сохранения в PDF (доступен только html).

Способ 1 (главный) – Печать

Как сохранить любую веб-страницу в виде изображения или PDF

Суть способа – мы будем не сохранять страницу, а «печатать» ее. Суть в том, что на Windows теперь доступны виртуальные принтеры, которые позволяют выводить страницу не на физическую бумагу, а, например, в формат PDF. Этим и займемся.

Подходит для любого браузера – Chrome, Яндекс.Браузер, Opera, Edge, Firefox, Internet Explorer (помянем). Главное, найти где у него печать.

Как сохранить любую веб-страницу в виде изображения или PDF

Как сохранить любую веб-страницу в виде изображения или PDF

Для большей части людей этого будет достаточно. Сам лично пользуюсь только этим способом. Если же мне нужна точная картинка – проще сделать скриншот, а уже потом распечатать простое изображение.

Способ 2 – Расширения

Для всех популярных ныне браузеров сейчас доступно очень много расширений. Некоторые из них умеют сразу сохранять страницу в PDF. Если вы это, вдруг, делаете часто – можно попробовать поискать подобное под себя. Показываю на примере Chrome.

Как сохранить любую веб-страницу в виде изображения или PDF

Как сохранить любую веб-страницу в виде изображения или PDF

Как сохранить любую веб-страницу в виде изображения или PDF

Способ 3 – Интернет сервисы

Если ничего не хочется устанавливать, а первый способ чем-то не устраивает – гуглим что-то вроде «сохранить страницу сайта в pdf онлайн» и натыкаемся на ряд сервисов, которые попросят у вас только ссылку на исходную страницу сайта. Работают все примерно одинаково, как разовое действие вполне себе пойдет. Ниже оставляю подборку случайно найденных сайтов:

Способ 4 – Adobe Acrobat Pro DC

В былые времена программы Adobe Acrobat устанавливались чуть ли не на каждый компьютер, поэтому если кто-то вдруг пользуется ей, просто напомню, что там можно было в процессе создания документа PDF выбрать источником веб-страницу (Инструменты – Создать PDF – Веб-страница).

Как сохранить любую веб-страницу в виде изображения или PDF

Способ 5 – Android

Способы выше описаны на примере работы с компьютером (Windows 10 или Windows 11). Но что если у нас под рукой только телефон с Android? Оказывается, там тоже можно сохранять страницу в PDF через обычную «Печать».

  • Открываем нужную страницу сайта.
  • В основном меню браузера выбираем «Поделиться».

Как сохранить любую веб-страницу в виде изображения или PDF

Как сохранить любую веб-страницу в виде изображения или PDF

Как сохранить любую веб-страницу в виде изображения или PDF

Способ 6 – iPhone

На iOS тоже доступен вариант с «Поделиться».

  • Открываем нужную страницу через Chrome или Safari.
  • Нажимаем «Поделиться» через меню.
  • Выбираем «Напечатать».

Как сохранить любую веб-страницу в виде изображения или PDF

Как сохранить любую веб-страницу в виде изображения или PDF

Видео по теме

Ежедневно в процессе деятельности регистратора REG.RU, в котором я работаю программистом, совершаются сотни операций, требующих оформления каких-либо официальных документов. Среди них — различные договоры, счета, сертификаты и т.п., которые необходимо печатать как компании, так и клиентам. Для таких целей хорошо подходит формат PDF, который на сегодняшний день стал де-факто основным для обмена и распространения документации. Основными преимуществами этого формата можно назвать: кроссплатформенность, аппаратную независимость и безопасность. Все вышеперечисленное позволило PDF завоевать популярность среди пользователей и стать одним из самых распространенных.

Как можно создавать документы в формате PDF на лету, из скрипта? Для таких целей существуют различные инструменты. Одним из них является язык разметки LaTeX, позволяющий автоматизировать многие задачи по подготовке статей, включая набор текста на нескольких языках, нумерацию разделов и формул, перекрёстные ссылки, размещение иллюстраций и многие другие. Но у LaTeX есть одна очень серьезная проблема: у него очень крутая кривая обучения. Чтобы выучить его, требуется затратить много времени. И в LaTeX’е очень неудобно работать с таблицами. Потратив много времени на поиск наилучшего решения, я пришел к выводу, что проще всего конвертировать готовую HTML страницу в PDF и передать клиенту. Я сделал обзор программ, которые можно использовать для такой конвертации.

Требования к конвертерам

Основное внимание уделялось таким особенностям конвертеров как:

  • Простота настройки шрифтов
  • Вставка разрыва страницы
  • Безразличие к X серверу
  • Поддержка CSS

Желательно, чтобы шрифты и кодировку можно было легко настроить. В идеале, конвертер должен сам распознавать используемую кодировку и шрифт. Чтобы нужные данные помещались на одной странице, а не расползались на две, пользователи делают разрыв на странице. Хотелось бы иметь возможность создавать разрывы простым способом — через CSS свойство. Конвертер должен быть независим от X Windows, поскольку работает на Web-сервере, который и без X Windows’a сильно загружен. Конечно же, можно использовать Xvfb, но это не подходящее решение. Для теста были сделаны две простые HTML-странички, прошедшие валидацию. Первая страница содержит разрыв, сделанный CSS свойством, вторая — содержит сложную таблицу с объединениями ячеек.

Так странички отображаются в браузере:

Как сохранить любую веб-страницу в виде изображения или PDF

Обзор

wkhtmltopdf. Наверное, самый популярный на сегодняшний день конвертер и, как оказалось, неспроста. Его основа — движок webkit: шрифты берет из системы, умеет делать разрывы страниц, а для работы нужны библиотечные файлы от X-сервера.
Пример работы:

Как видно из примера, wkhtmltopdf хорошо справился. Все блоки на месте, присутствуют картинки, есть разрыв страницы.

webkit2pdf. Аналог wkhtmltopdf. Ему нужен запущенный X-сервер. С результатами его работы можно ознакомиться чуть выше.

pisa(xhtml2pdf). Конвертер написан на python, а, значит, независим от Х-сервера. Умеет делать разрывы, шрифты настраиваются в отдельном CSS файле, путь к которому передается через параметр. Однако, очень привередливый: в случае малейших ошибок или недочетов в HTML коде падает.
Пример работы:

Очень плохо: шрифт определил правильно, с разметкой не справился.

html2pdf. Прост в обращении, шрифты берет из системы, умеет делать разрывы страниц. Для конвертации использует какую-то старую версию браузера Firefox. Но ему нужен запущенный X-сервер. Помимо этого, может заглючить и отказаться работать. Платный.
Пример работы:

Кроме подвала на второй странице, все блоки и картинки на месте.

htmldoc. Простой конвертер без наворотов.
Пример работы:

Не понимает CSS.

html2ps, ps2pdf. По характеристикам похож на htmldoc.
Пример работы:

prince. Платный конвертер, стоит недешево. Использует системные шрифты, умеет делать разрывы, безразличен к X-серверу.
Пример работы:

Все съехало, проблемы с позиционированием.

Результаты в виде таблицы

Как оказалось, с задачами конвертации лучше справились бесплатные конвертеры. Если нужно конвертировать страничку с большим объемом графики, фреймов и javascript, то лучше использовать конвертеры, основанные на webkit. Если же страничка с минимальным количеством HTML-элементов, то со своей задачей хорошо справится htmldoc.

Примечание

Обзор по PHP конвертерам можно почитать тут. А тут можно почитать обзор по online конвертерам.

UPD: Отключите ваш блокиратор рекламы если картинки не видны.

Как выполнить конвертацию?

С помощью нашего онлайн-конвертера вы можете делать полные прокручиваемые веб-страницы, а не делать несколько скриншотов, которые потом нужно объединить. Давайте посмотрим, как сохранить веб-страницу в формате PDF, шаг за шагом.

  • Откройте веб-страницу HTML в вашем браузере и скопируйте URL.
  • На нашем веб-сайте перейдите к нашему инструменту Преобразование веб-страниц в PDF.
  • Вставьте URL, который вы хотите преобразовать в текстовое поле.
  • Чтобы изменить настройки конвертации по умолчанию, нажмите кнопку «Параметры».
  • Нажмите кнопку «Конвертировать».
  • Загрузите экспортированную веб-страницу.

В следующих разделах описаны все параметры, доступные при преобразовании веб-страниц в PDF или изображения. Настройки по умолчанию оптимизированы для часто используемых размеров страницы «А4».

Типографика в CSS

При двусторонней печати можно задать разные отступы от края для правых и левых страниц по отдельности если в дальнейшем предполагается брошюровка:

Для первой страницы можно задать собственное оформление, например, увеличенный отступ от верхнего края:

Есть возможность установить разрыв страницы перед заголовком первого уровня так, чтобы он начинался на нечетной странице:

Посредством свойства page-break-after можно запретить разрыв страницы сразу после некоторого элемента, например, заголовка второго уровня:

Свойство page-break-inside поможет избежать разрыва страниц там, где делать это нежелательно, например посреди таблицы

Свойства orphans и orphans помогут избежать разрыва страниц в начале и в конце абзаца:

Что еще не так?

Я вижу две основные проблемы:

  • Невозможность простого определения положения элементов в документе. Это делает затруднительным формирование оглавления с автоматическим указанием номеров страниц, особенно, если размер контента заранее неизвестен.
  • Преобразованием занимается Chrome — продукт Google который собирает о пользователях самую разную информацию. Если утечка данных из документа недопустима, к предлагаемому решению нужно относится осторожно — закрыть браузеру выход на внешние ресурсы, или вовсе поискать другое решение. Использование Chromium с открытыми исходниками не решает проблемы — в нем уже находили жучки от Google.

Как сохранить страницу сайта в PDF

При помощи браузера, пользователь может без труда сохранить интернет страницу в PDF на своем компьютере.

  • Запустите браузер на компьютере.
  • Перейдите на сайт, откройте нужную веб-страницу.
  • В настройках браузера выберите «Печать».
  • В настройках для печати выберите виртуальный принтер. В браузер Google Chrome встроен виртуальный принтер, поэтому можете выбрать «Сохранить как PDF». Есть возможность для сохранения файла на Google Диск.
:/>  Windows 8.1 and Windows Server 2012 R2 KMS-activation

Как сохранить любую веб-страницу в виде изображения или PDF

  • Нажмите на кнопку «Печать» или «Сохранить», в зависимости от выбранного виртуального принтера.
  • В диалоговом окне назовите файл и выберите место для сохранения.

Кроме того, есть расширения для браузера, сохраняющие страницы сайтов в ПДФ. Для сохранения страницы сайта в удобном виде, без лишних элементов, воспользуйтесь сервисом Print Friendly.

Запускаем Chrome через Selenium

Итак, устанавливаем Selenium командой pip install selenium, скачиваем с http://chromedriver.chromium.org/ хромдрайвер, соответствующий Вашей версии Chrome и используем функцию get_pdf_from_html из примера ниже:

Для получения PDF файла можно запустить этот пример из командной строки указав url и имя файла для сохранения PDF, либо вызвать функцию get_pdf_from_html и передать ей три аргумента:

  • path — url html документа;
  • chromedriver — путь на локальной машине к хромдрайверу (по умолчанию должен лежать в локальной директории);
  • print_options — дополнительные атрибуты печати.

Следует отметить, что Selenium не имеет стандартного интерфейса для печати страницы в PDF, к тому же это умеет делать только Chrome, поэтому приходится напрямую вызывать driver.command_executor._request.

Теперь разберемся, какие средства доступны для контроля размещения контента на многостраничных документах.

Печать и сохранение в формате ПДФ через браузер

Обычно каждый компьютер имеет виртуальный принтер, способный преобразовать файл, доступный для печати, в
формат PDF. Запустить эту функцию можно через любой современный браузер.

Преобразование сайта в ПДФ в Google Chrome

В браузере Google Chrome необходимую функцию можно вызвать несколькими способами. Давайте рассмотрим это
пошагово.

  • Откройте сайт и запустите принтер сочетанием клавиш Ctrl+P либо кликните правой кнопкой мыши по экрану и
    найдите пункт «Печать». Также эту функцию можно вызвать, нажав на три точки в правом верхнем углу.
  • Если у вас установлен принтер по умолчанию, он отобразится как основной. Если его нет, выберите
    «Сохранить как PDF».
  • Компьютер рассчитает количество создаваемых страниц в зависимости от ориентации и размера. Все эти
    настройки можно установить вручную или оставить как есть.
  • Если вас все устраивает, нажмите «Сохранить». Выберите папку, куда будет отправлен файл, и снова
    кликните «Сохранить».

Вот и все, что нужно для экспорта HTML в PDF через Google Chrome. Остальные браузеры действуют по схожему
алгоритму.

Извлечение ПДФ из Microsoft Edge

Перед тем, как использовать Microsoft Edge, убедитесь, что у вас установлены последние обновления браузера.
Иначе может возникнуть ошибка в версии PDF, а некоторые сайты могут не открываться в устаревшей версии.
После этого сделайте следующее:

  • Вызовите функцию печати клавишами CTRL + P либо через кнопку меню справа вверху.
  • Укажите принтер, формат макета количество страниц. Раскрыв пункт «Другие настройки», дополнительно можно
    выбрать размер страниц, масштаб, поля и фон.
  • Нажмите «Сохранить» и выберите папку для экспорта.

Стоит отметить, что браузер от Microsoft – единственный из представленных, который иногда сбивает
внутренние стили при генерации PDF. Поэтому перед экспортом страницы проверяйте, как она выглядит. Впрочем,
проблему с наполнением документа можно легко исправить в любом бесплатном PDF-редакторе.

Что с производительностью?

На Core i5-8600K 3600MHz в один поток одно преобразование простого документа выполняется за 0.6 сек. На моей портативной печатной машинке конца 2013 года 2.4 Ггц — 1.5 секунды.
Очевидно, что основные ресурсы тратятся на запуск браузера. Можно сократить время преобразования большого количества файлов, если запустить Chrome один раз как микросервис и отправлять ему URL для преобразования. Реализация этого способа выходит за рамки данной статьи.

Как сохранить страницу в PDF в Firefox

Подобным способом в Mozilla Firefox выполняется сохранение веб-страницы в файл формата PDF.

  • В окне открытого сайта в браузере Mozilla Firefox нажмите на кнопку «Открыть меню приложения».
  • В свойствах печати, в опции «Получать» установите «Сохранить в PDF».
  • Если потребовалось, измените настройки печати.
  • Нажмите на кнопку «Сохранить».

Как сохранить любую веб-страницу в виде изображения или PDF

  • В окне «Сохранить как», в поле «Тип файла:» выбран формат — PDF.
  • Нажимайте на кнопку «Сохранить», чтобы получить готовый файл на своем компьютере.

Как сохранить страницу в PDF на Андроид

Пользователи использующие телефоны, работающие в операционной системе Android, могут сохранять веб-страницы в качестве PDF-файла, подобно тому, как это делается на ПК.

Пройдите несколько шагов:

  • Перейдите на страницу сайта.
  • Нажмите на кнопку настроек браузера Chrome (три точки).
  • В следующем окне нажмите на кнопку «Печать» (покрутите панель).

Как сохранить любую веб-страницу в виде изображения или PDF

  • Нажмите на стрелку около опции «Виртуальный принтер».
  • Выберите «Сохранить как PDF».
  • В окне папки по умолчанию, предназначенной для загрузки файлов, нажмите на кнопку «Сохранить».

Как сохранить любую веб-страницу в виде изображения или PDF

Как в Яндекс Браузер сохранить страницу в PDF

Яндекс Браузере основан на Chromium, поэтому там используется встроенный виртуальный принтер, как в браузерах Google Chrome, Microsoft Edge, Opera, Vivaldi и так далее.

  • Нажмите на кнопку «Настройки Яндекс.Браузера».
  • В контекстном меню выберите пункт «Дополнительно».
  • В открывшемся подменю нажмите на «Печать».
  • В поле «Принтер» потребуется указать «Сохранить как PDF».
  • После завершения выбора других параметров, нажмите на кнопку «Сохранить».

Как сохранить любую веб-страницу в виде изображения или PDF

Вы можете добавить водяной знак. В таблице ниже приведены настройки, которые вы можете изменить для управления водяными знаками. То же самое относится ко всем страницам. Если текст водяного знака пуст, водяной знак не применяется.

Как сохранить изображение в PDF

Подобным образом из фото или картинки создается PDF файл. Откройте файл графического формата (png, jpeg, bmp, gif, tiff и т. д.) в любом графическом редакторе.

На этом примере я сохраню изображение в формате JPEG в PDF. Я открыл фотографию в стандартном Средстве просмотра фотографий Windows.

Далее нужно нажать «Печать» («Ctrl» + «P»).

Как сохранить любую веб-страницу в виде изображения или PDF

В открывшемся окне, среди списка доступных принтеров, необходимо выбрать виртуальный принтер и параметры сохранения изображения: качество, количество экземпляров, размер и т. д.

Как сохранить любую веб-страницу в виде изображения или PDF

После нажатия на кнопку «Печать», выберите место для сохранения файла, дайте ему название.

Подобным образом можно сохранить в PDF чертеж, документы Word, Excel и т. д.

Из изображений и документов можно создать электронную книгу в формате PDF, объединив несколько отдельных файлов в один файл.

Настройки конверсии

В таблице ниже приведены параметры, которые вы можете изменить, чтобы управлять процессом преобразования. Они будут в значительной степени определять содержание полученного файла PDF.

Настройки страницы

Когда вы изменяете веб-страницу на PDF или изображение, есть несколько вариантов, которые вы можете изменить для управления настройками страницы. Заданное вами значение определяет макет PDF.

Размер страницы

Мы разрешаем вам использовать все основные стандартные форматы страниц для размера страницы вашего PDF. Они перечислены в таблице ниже, с их соответствующими размерами. Формат страницы по умолчанию – «А4».

Как сохранить любую веб-страницу в виде изображения или PDF

Как сохранить любую веб-страницу в виде изображения или PDF

Ориентация

Ориентация страницы – это направление, в котором документ отображается или печатается. Два основных типа ориентации страницы – книжная (вертикальная) и альбомная (горизонтальная). Большинство мониторов имеют альбомную ориентацию, а большинство документов печатаются в портретном режиме. Ориентация по умолчанию, как правило, книжная, но вы можете изменить ее на альбомную, если хотите, чтобы ширина была больше высоты.

Маржа

Вы можете установить размеры левого, верхнего, правого и нижнего полей в мм (millimeters). Значения от 0 до 100 действительны.

Увеличить

Увеличьте или уменьшите масштаб страницы перед преобразованием. Значения от 10% до 200% действительны.

Верхний и нижний колонтитулы

Вы можете добавить верхние и нижние колонтитулы на всю страницу. То же самое относится ко всем страницам.

Сохранение веб-страницы сайта с помощью PDFCreator

Пользователи в других операционных системах — Windows 7, Windows 8, Windows 8.1, не имеющих подобного системного средства, могут установить на свой компьютер бесплатный виртуальный принтер, например PDFCreator, чтобы сохранять в PDF веб-страницы или другие документы.

Потребуется сначала установить на свой ПК соответствующее программное обеспечение, чтобы воспользоваться функциями стороннего виртуального принтера.

Принцип действия идентичен, как в случае использования встроенного компонента Windows:

  • Откройте в браузере нужный сайт.
  • Нажмите на клавиши «Ctrl» + «P».
  • В параметре «Принтер» укажите «PDFCrerator».
  • Нажмите на кнопку «Печать».

Как сохранить любую веб-страницу в виде изображения или PDF

  • В окне программы выберите подходящий профиль.
  • По умолчанию выбран формат PDF, также можно выбрать форматы: PDF/A (долгосрочное хранение), высокое качество или высокое сжатие. При необходимости, измените имя файла, каталог, введите метаданные для итогового файла.
  • Нажмите на кнопку «Сохранить».

Как сохранить любую веб-страницу в виде изображения или PDF

Зачем сохранять веб-страницы в ПДФ

В отличие от других форматов электронных документов, PDF полностью адаптирует стили форматирования.
Страница сохранится с картинками, таблицами, ссылками и другими данными точно так же, как отображается на
сайте. Это пригодится, если нужно:

  • Экспортировать бизнес-анализы со всеми графиками и прочими данными;
  • Извлечь информацию с сайта, который не поддерживает копирование текста;
  • Экспортировать веб-страницу или шаблон для дальнейшего редактирования с сохранением стилей, абзацев,
    расположением картинок и пр.;
  • Сохранить подтверждение какого-либо действия (например, записи в соцсети, если есть вероятность, что их
    удалят).

PDF автоматически сохраняется в размере А4 и поддерживается для чтения любыми современными ридерами и
браузерами. От скриншота или экспорта в хтмл этот вариант отличается тем, что ПДФ можно изменить в
редакторах и объединить в многостраничный файл, например, для рабочей документации.

Управление правами

При преобразовании веб-страниц в PDF вы можете использовать настройки шифрования (также называемые управлением правами PDF) в таблице ниже. Если вы решите преобразовать изображение в изображение не в формате PDF, оно не будет применено.

Сохранение веб-страницы в виде изображения

Есть более интересные методы, если вы хотите сохранить веб-страницу, которая целиком не умещается на одном экране.

Браузеры Opera и Edge обладают встроенными инструментами создания скриншотов. В первом нужно нажать на иконку с изображением камеры справа от адресной строки, во втором в меню на команду «Сделать снимок экрана» (или нажмите Ctrl + Shift + S).

Как сохранить любую веб-страницу в виде изображения или PDF

Оба браузера позволяют выбирать часть страницы или целиком для сохранения в виде изображения. Сначала нужно прокрутить страницу до конца, чтобы всё было выделено. Edge подходит лучше, поскольку сохраняет изображение быстрее и именно так, как оно выглядит на экране. Opera работает медленнее и не всегда точно.

В обоих браузерах можно редактировать, выделять и добавлять к изображению текст, прежде чем сохранить в файл или копировать в буфер обмена.

Как сохранить любую веб-страницу в виде изображения или PDF

В браузерах Chrome или Firefox для  этого потребуется поставить расширение. Для браузера Chrome подойдёт расширение GoFullPage, а для Firefox существует FireShot. Их функциональность даёт возможность редактировать снимки экрана и сохранять в виде изображения и файлов PDF.

Евгений Тарасов

Автор, новостной редактор.

Преобразование сайта в документ через онлайн-сервисы

В интернете существует достаточно много сервисов для работы с PDF в режиме онлайн. Некоторые из этих сайтов
позволяют перевести отдельные веб-страницы в документы с возможностью редактирования. Этот вариант удобен
тем, что его можно использовать на мобильных смартфонах айфон или андроид.

:/>  SUPRA STV-LC3215W. Ремонт, схема, сервис

PDFmyURL

Этот англоязычный сайт создан
специально для тех, кто хочет узнать, как сохранить веб страницу в PDF. Разработчикам разрешается встраивать
API конвертера на свои сайты, а пользователи могут быстро преобразовать ссылки с любым контентом.

Чтобы конвертировать страницу, введите URL-ссылку в соответствующую строку и нажмите «Save as PDF». Сервис
сгенерирует документ, после чего он автоматически загрузится на ваш компьютер.

Как сохранить любую веб-страницу в виде изображения или PDF

Преобразование по ссылке полностью бесплатно, но также можно купить PRO-лицензию. Она предоставляет
инструменты вроде наложения личного логотипа, выбора размера листа, удаление стилей и многое другое. Также
становится доступен пакетный режим, если требуется обработать несколько страниц, и функция конвертации всего
сайта целиком.

PDFCrowd

Сервис предлагает 3 варианта
преобразования: пользователи могут добавлять прямую ссылку, загрузить предварительно сохраненную
HTML-страницу или ввести хтмл-код в специальное окошко.

Как сохранить любую веб-страницу в виде изображения или PDF

Лучшая программа для конвертации и редактирования ПДФ

Сохранение всех элементов – один из плюсов при экспорте веб-страниц в PDF. Но это также огромный минус, так
как в документ встраиваются ненужные элементы: рекламные блоки, навигация и прочее. Чтобы удалить эти
участки и отредактировать текст, потребуется специальное программное обеспечение.

Одним из лучших решений в этом случае станет PDF Commander. Эта программа на русском языке позволяет
вставить новые объекты, установить защиту, настроить метатеги и многое другое. В том числе софт можно
использовать, если вы хотите узнать, как открыть
повреждённый ПДФ. Редактор корректно работает с любыми документами, даже созданными в других
программах.

Как сохранить любую веб-страницу в виде изображения или PDF

Решаем задачу одной строкой

В командной строке вызываем Chrome в безголовом режиме с сохранением страницы в pdf:

chrome –headless –disable-gpu –print-to-pdf https://google.com

Пользователям Linux может понадобиться вместо chrome запускать chromium-browser.
Пользователям MAC может быть полезно предварительно создать alias:

alias chrome=”/Applications/Google\ \Chrome.app/Contents/MacOS/Google\ \Chrome”

UPDATE: В комментариях внесли уточнение, что пользователям Windows необходимо явно задавать имя PDF файла –print-to-pdf=output.pdf

Если у Вас уже есть генератор HTML документов, вместо https://google.com укажите URL для получения этого документа.

Открываем в локальной директории файл output.pdf и смотрим результат.
Первое, что может броситься в глаза — это наличие Header с датой печати и Footer с URL и нумерацией страниц. Для того, чтобы их убрать нужно добавить несколько CSS правил. Эти правила вряд ли получится добавить на страницу google.com, поэтому для дальнейшей работы лучше создать собственный HTML документ.

Сохранение страницы сайта при помощи расширения Save as PDF

До того, как в популярных браузерах появился встроенный виртуальный принтер, пользователи устанавливали в обозреватели интернета расширения (дополнения), которые решали эти задачи. Сейчас нет особого смысла в использовании подобных расширений, то любители могут попробовать их в качестве альтернативы.

Расширение Save as PDF от онлайн сервиса Pdfcrowd.com доступно для браузеров, созданных на базе Chrome и Firefox.

Этим расширением пользоваться элементарно:

  • После установки в браузер на панели расширений появится значок расширения Save as PDF.
  • Щелкните по значку расширения на веб-странице сайта.

Как сохранить любую веб-страницу в виде изображения или PDF

Сохранение веб-страницы в формат PDF

В последних версиях Windows по умолчанию доступна возможность печатать документы в формате PDF. На самом деле вы не печатаете документ на принтере, а просто сохраняете файл PDF. Так можно поступать и с веб-страницами.

Перед сохранением прокрутите всю страницу и убедитесь, что все изображения и текст загружены. В противном случае в файле PDF могут остаться пустые места.

Сохранение в PDF в разных браузерах происходит по-разному. Обычно для этого нужно перейти в главное меню браузера или в настройки. В браузере Chrome откройте меню нажатием на кнопку в правом верхнем углу и выберите команду «Печать».

Как сохранить любую веб-страницу в виде изображения или PDF

Здесь отображаются стандартные варианты печати. В меню выберите «Сохранить как PDF». В других браузерах команда может называться по-другому, вроде Microsoft Print as PDF.

При желании можно поменять макет на альбомный, чтобы эффективнее использовать доступное пространство. Ещё можно активировать параметр «Фоновая графика» для правильного сохранения изображений.

Если поменять масштаб, вы сможете лучше подогнать веб-страницу под макет документа. Чем больше это значение, тем шире страницы для заполнения листов PDF. Чтобы документ был больше похож на вид на веб-сайтах, нужно выбирать масштаб между 60 и 75.

Как сохранить любую веб-страницу в виде изображения или PDF

Можно указать количество страниц на листе. Чтобы в файле PDF не было десятков листов, нужно увеличить данное значение.

Качество форматирования и функциональность варьируются в зависимости от браузера. Microsoft Edge и Chrome похожи, а Firefox имеет несколько дополнительных настроек управления макетом PDF и может создавать более привлекательные документы.

Для тестирования использовали браузер Opera. Применяя команду «Сохранить как PDF», удалось полностью сохранить макет страницы, чтобы результат больше походил на оригинал. Если сравнивать с применением функции «Печать», где необходимо настраивать масштабирование и другие параметры для правильного сохранения страницы, функция «Сохранить как PDF» позволяет сделать всё одним щелчком мыши.

Как сохранить любую веб-страницу в виде изображения или PDF

Можно использовать расширения для браузеров, которые также способны сохранять файлы в PDF. Расширение PDF Mage для Chrome обладает малой функциональностью и для его работы нужно подключение к интернету, зато позволяет справиться с задачей несколькими щелчками мыши.

Функциональность расширения Print Friendly & PDF для Microsoft Edge и Mozilla Firefox примерно такая же, но вы получите более краткую версию веб-страницы, без рекламы и навигации.

Есть сетевые сервисы для сохранения веб-страниц. На них нужно указать URL-адрес нужной страницы, а дальше сервис самостоятельно сохранит её в формате PDF. В качестве примера такого сервиса можно назвать Webtopdf.

Хотя многие онлайн-сервисы удобны и просты в работе, по качеству они не сравнятся с возможностями сохранения в браузере Opera.

Добавляем CSS

Этот способ сработает только для одностраничных документов, при печати двух и более страниц на последней внизу останется Footer с URL и нумерацией страниц. Можно явно попросить Chrome отключить отображение Header и Footer, задав параметр печати displayHeaderFooter = False, но на данный момент он не вынесен в интерфейс командной строки. Чтобы добраться до него, понадобятся инструменты для автоматизации работы с браузером: Selenium или puppeteer. Дальше я рассмотрю первый вариант, потому как в моем проекте использовался Python.

Как сохранить страницу в PDF в Хроме

Помимо системного способа с виртуальным принтером или программным обеспечением от стороннего производителя, пользователь может сохранить страницу в PDF в Chrome встроенным средством. Браузер имеет свой встроенный виртуальный притер, который подходит для этих целей.

  • Войдите на веб-страницу сайта.
  • Нажмите на клавиши «Ctrl» + «P».
  • В параметрах печати выберите «Сохранить как PDF».
  • Измените, если нужно, другие настройки, а затем нажмите на кнопку «Сохранить».

Как сохранить любую веб-страницу в виде изображения или PDF

Как сохранить любую веб-страницу в виде изображения или PDF

Как сохранить документ в формате PDF

Сейчас я покажу алгоритм действий на примере программы Universal Viewer, которая открывает большое количество форматов файлов. Открытый документ может быть любого электронного текстового формата (txt, doc, docx, djvu, fb2 и т. д.).

Я открыл файл в формате «TXT» в Universal Viewer (этот формат можно открыть в Блокноте, действия аналогичные).

Как сохранить любую веб-страницу в виде изображения или PDF

Далее в меню «Файл» нужно нажать на пункт «Печать». Можно сделать по-другому: вывод на печать в приложениях осуществляется при помощи «горячих клавиш» «Ctrl» + «P».

В открывшемся окне «Печать», для выбора свойств печати, необходимо выбрать виртуальный принтер.

Для выбора подходящего принтера нужно нажать на значок в виде галки, находящийся напротив имени принтера. Здесь предлагается несколько вариантов: физический принтер Canon, виртуальный принтер от (в Windows 10) и некоторые другие приложения. Я выбирал виртуальный принтер Microsoft Рrint to PDF.

В окне «Печать» настраиваются некоторые другие параметры печати: количество страниц, число копий, ориентация, размер и т. п.

Далее нужно нажать на кнопку «ОК».

Как сохранить любую веб-страницу в виде изображения или PDF

В окне предварительного просмотра, если необходимо, настраиваются другие дополнительные параметры. Для запуска процесса создания документа ПДФ, нажмите на кнопку «Печать».

Как сохранить любую веб-страницу в виде изображения или PDF

В открывшемся окне Проводника присвойте имя документу, выберите место для сохранения.

Данный документ сохранится на компьютере в формате PDF.

Превратить текст в PDF с помощью расширений

Если у вас отключена функция виртуального принтера, сохранить сайт в PDF можно при помощи расширения для
браузера.

PDF Mage

Для начала установите плагин для Chrome,
Opera или Firefox.
Расширение работает со всеми сборками, основанными на Chromium, поэтому он также подходит для Cent и Яндекс
браузер.

Как сохранить любую веб-страницу в виде изображения или PDF

Плагин начнет генерацию документа, после чего в браузере Опера будет автоматически сохранен на жесткий
диск. В Firefox и Google Chrome откроется новая вкладка с предпросмотром. Для экспорта готового файла
потребуется кликнуть на иконку со стрелкой в верхнем правом углу экрана.

Как сохранить любую веб-страницу в виде изображения или PDF

Это расширение является разработкой сервиса PDF Crowd и работает в Google
Chrome, Firefox. После того как вы установите его в браузер, на панели управления появится синяя
иконка. Кликните по ней, когда будете находиться на нужной странице.

Как сохранить любую веб-страницу в виде изображения или PDF

В Google Chrome сгенерированный документ автоматически загрузится на жесткий диск компьютера. Если вы
работаете в Firefox, появится окно опций, в котором нужно выбрать вариант «Сохранить файл».

Как сохранить любую веб-страницу в виде изображения или PDF

Как сохранить страницу сайта в PDF онлайн на Print Friendly

Print Friendly & PDF — бесплатный онлайн сервис, на котором можно сохранить страницу сайта в удобном для чтения виде. Вы можете сохранить страницу сайта в неизменном виде или удалить с нее лишнее и ненужное: блоки рекламы, ссылки, элементы интерфейса и так далее.

Выполните следующий порядок действий:

  • Используйте в браузере расширение Print Friendly, букмарклет или скопируйте ссылку на страницу, вставив ее на онлайн сервисе: .
  • Нажмите на кнопку «Preview».
  • В окне откроется страница сайта, подготовленная для сохранения.
  • При помощи курсора мыши вы можете удалить ненужный текст или другие элементы (они выделяются желтым цветом).

Как сохранить любую веб-страницу в виде изображения или PDF

Выводы статьи

Чтобы сохранить необходимую информацию из Интернета, пользователи применяют различные методы. Один из самых распространенных вариантов — сохранение веб-страниц в качестве файла в формате PDF, который можно просматривать на любом устройстве. В этом случае, на помощь пользователю придут различные инструменты: виртуальный принтер на компьютере или в браузере, расширение для браузера или онлайн сервис.

Как сохранить веб-страницу сайта в PDF (видео)

В программах, которые открывают файлы определенных форматов, с помощью виртуального принтера можно сохранить документы, файлы, страницы сайтов в формате PDF на компьютере.

Заключение

Выводы о допустимости использования такого подхода предлагаю сделать самостоятельно. Каждый проект уникален по своему. Подойдет ли этот способ в Вашем проекте, решать Вам.