Збережіть точну копію захищеної веб-сторінки у векторній графічній формі


9

Я хотів би зберегти точну репліку веб-сторінки у векторно-графічній формі, тому я не можу використовувати знімок екрана (оскільки це зберігає зображення у графічній формі).

Я спробував "надрукувати у pdf" та "зберегти як pdf" через Safari, Chrome та Firefox. Це працює більшу частину часу. Однак збережений pdf не є точною репліками для всіх веб-сторінок. Наприклад, спробуйте зберегти цю веб-сторінку у форматі PDF та зауважте, як піктограми upvote / downvote не включаються до збереженого PDF.

Я також спробував зберегти як WebArchive з Safari. Проблема тут полягає в тому, що мені потрібно обрізати отриманий файл, і я не знаю, як обрізати WebArchive, оскільки Preview не може його відкрити, і він просто відкриється в Safari (назад до квадратного).

Я також спробував плагіни веб-браузера, які забезпечують рішення одним натисканням кнопки, щоб зберегти веб-сторінку у форматі PDF (векторно-графічна форма). Це працює краще (точна сторінка збережена) і майже вирішує проблему, за винятком того, що ці програми працюють, надсилаючи URL-адресу сторінки в хмарну програму на запит, а потім зберігаючи сторінку. Це означає, що ця методика не працюватиме на веб-сайтах https, які потребують моїх облікових даних для входу.

Тож я в кутку. Я намагаюся зберегти точну репліку векторної графіки веб-сторінки, для перегляду якої потрібні мої дані для входу. Як я можу це зробити?


1
Думаю, ви заплуталися - PDF - це не векторний формат.
Кевін Панько

Не плутати; просто не переживаючи надто детально, що PDF - це контейнер, який може зберігати векторну графіку, оскільки я думаю, що головне в цьому питанні передається
Клейтон Стенлі

Здається, ваше запитання: "Як я можу зберегти веб-сторінку як PDF-файл, точно так, як це показано на екрані, і працює зі сторінкою, для якої потрібен пароль для входу?"
Кевін Панько

Не обов'язково має бути pdf; це лише один шлях до збереження веб-сторінки, де текст знаходиться у векторній графічній формі. Мені не потрібно брати на себе цей формат. Я додаю захищений до заголовка для другої ноти, щоб це було підкреслено краще.
Клейтон Стенлі

Відповіді:


6

У результаті отримання друку сторінки в PDF ви отримуєте інші результати, ніж ви бачите при перегляді сторінки на екрані.

Це відбувається тому, що веб-сторінка містить таблицю стилів CSS, яка змінює сторінку під час її друку.

Це питання допоможе вам уникнути цієї проблеми: як надрукувати таблицю стилів екрану?

Дотримуйтесь вказівок, щоб надрукувати сторінку на екранній таблиці стилів.

Тоді ви маєте змогу надрукувати у PDF та отримати той самий результат, який ви бачите на екрані.


1
Тільки для отримання повної документації я закінчив користуватися плагіном веб-розробника Chrome і редагував css через цей плагін. Не вдалося оновити сторінку для друку після редагування css за допомогою вбудованого Інструменту для розробників Google Chrome, але це, швидше за все, тому, що я не знайомий з цим інструментом.
Клейтон Стенлі

4

Якщо ви не боїтеся невеликих сценаріїв, спробуйте скористатися програмою phantomjs для OSX від http://phantomjs.org/

Тоді ви просто запустите включений двійковий файл за допомогою сценарію rasterize.js з такою командою, як:

phantomjs.exe rasterize.js http://www.example.com/sitepage 8.5in*11in outfile.pdf

Пара зазначає:

  • Він називається 'rasterize.js', але сам текст зберігається у PDF як фактичний текст.

  • Аутентифікацію на захищеному сайті за допомогою автентифікації Windows можна здійснити, додавши кілька рядків до сценарію rasterize.js після ініціалізації об’єкта сторінки:

var page = need ('веб-сторінка'). create (),
    system = вимагати ('система'),
    адреса, вихід, розмір;
    page.settings.userName = "serviceUserName"; // Я додав ці
    page.settings.password = "послугаPassword"; // 2 рядки тут

якщо (system.args.length 5) {

фантомні скелі!
Метью Лок
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.