Останнім часом я бачив, що scribd дуже ускладнює користувачам (безкоштовним користувачам) перегляд документа, розміщеного на їхньому сайті. Немає можливості шукати в документі, не кажучи вже про те, щоб завантажити той самий.
Використовуючи javascript, вони завантажують сторінки за запитом у браузері, і тому функція "зберегти як" браузера не дуже допомагає.
На моє здивування, я побачив, що навіть копіювання / вставлення тексту копіює безглуздість до буфера обміну! Щоб перевірити, що було не так, я вимкнув javascript у браузері, а потім знову завантажив той самий документ. Вуала, я бачив хитрість. Отже, схоже, що javascript від scribd якось розшифровує невдалий текст і потім відображає його у браузері.
Тепер моє запитання, навіть після включення javascript і тексту належним чином відображається у браузері, якщо я загляну на об'єкти DOM, що відповідають обраному тексту, я все ще бачу химерний текст.
Отже, зараз я розгублений. Текст відображається нормально для користувача, але об'єкти DOM все ще містять хитрість. Отже, питання полягає в тому, який тип гачків / код JavaScript використовує сайт, щоб мати змогу зберегти безглуздість в об'єктах DOM і все-таки зробити декодований текст?
Чи є спосіб отримати доступ до розшифрованого тексту? Мій намір полягає не в тому, щоб розробити інженерний алгоритм для декодування, а знайти місце, де зберігається розшифрований текст?
Приклад документа:
Подивіться, що станеться при включенні / вимкненні Javascript!