Як я можу “сплющити” розсипку PDF у багатьох точках, згенерованих за допомогою R?


1

У мене є розсіювач, який я створив за допомогою R, він показує багато тисяч точок перекриття. Мені потрібно додатково графічно анотувати сформований PDF у форматі PDF за допомогою Inkscape. Однак працювати з цим файлом просто неможливо, оскільки тут занадто багато точок (Inkscape збоїв, все одно стає занадто повільним, щоб працювати з ними, точки дуже важко вибрати тощо).

Я хочу «розгладити» PDF, тобто. видаліть усю інформацію, яка все одно не відображається (точки, приховані під купинами інших точок тощо).

Я все ще хочу зберегти векторну інформацію, я не хочу растровувати фігуру.

Це потрібно робити з вільно доступними інструментами, і у мене немає Acrobat X.

Я шукав вирівнювання PDF у контексті bash / linux, однак потім знаходжу інструменти, пов'язані з обробкою PDF-форм, що абсолютно інша тема.

Відповіді:


4

Це прекрасний приклад великої проблеми, яку потрібно вирішити, але неправильного питання. Ви вже працюєте з вхідними даними в R, то чому б не обробити їх там? PDF по суті є двійковим, тому вам не пощастило зробити що-небудь з ним як є.

Ваша найкраща ставка - попередньо обробити дані в R перед тим, як створити PDF (саме для цього було створено R). Найкращим способом вирішити це було б провести циклічне введення даних та видалити всі інші точки, що мають однакові координати в межах певного порогу. Я б перетворив це на функцію, щоб ви могли експериментувати з різними порогами - але я впевнений, що ви зрозуміли цю ідею.

Не надто ускладнюйте речі, вводячи зайві рівні абстракції та додаткові формати файлів. Ви вже маєте дані , працюйте з даними .


Я вважаю, що наступні питання щодо переповнення стека можуть допомогти:

як видалити часткові дублікати з фрейму даних?

Визначте дублікати даних із порогом


Нарешті, ви можете розглянути можливість використання теплової карти, якщо це застосовно, оскільки це може відображати ту саму інформацію (колір, що представляє щільність точок, знайдених у певних областях), хоча і не потрібно окремо надавати кожну точку даних.


2
Немає жодних неправильних запитань, і ваша "відповідь" є просто покровительською і не конструктивною.

2
@gojira, як хтось, що працює з набором даних у R, ви не вважаєте, що найпростішим способом було б просто генерувати розсип з меншими балами? Це буквально вирішить кожне питання, яке ви окреслили у своєму запитанні. Я вважаю, що моя відповідь забезпечує оптимальне рішення того, чого ви хочете. Якщо ви не бажаєте хоча б розглянути таке рішення, то я б заперечував, що це питання не є конструктивним, оскільки воно є.
Прорив

Це не буде працювати для сюжетів GWAS Manhattan, кожна точка має своє унікальне положення x і y, без дублікатів.
zx8754
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.