Запитання з тегом «text-extraction»

13
Модуль Python для перетворення PDF в текст [закрито]
Зачинено. Це питання не відповідає вказівкам щодо переповнення стека . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для переповнення стека. Закрито 5 років тому . Чи є модуль python для перетворення PDF-файлів у текст? Я спробував один фрагмент коду, знайдений в Activestate, який …

13
Як витягнути підрядку за допомогою регексу
У мене є рядок, в якому є дві одиничні лапки, 'символ. Між єдиними цитатами є дані, які я хочу. Як я можу написати регулярний вираз для отримання "потрібних мені даних" з наступного тексту? mydata = "some string with 'the data i want' inside";

15
Як витягнути текст з PDF? [зачинено]
Зачинено. Це питання не відповідає вказівкам щодо переповнення стека . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для переповнення стека. Закрито 5 років тому . Удосконаліть це питання Чи може хтось порекомендувати бібліотеку / API для вилучення тексту та зображень із PDF? Нам …

8
Як витягти рядок за шаблоном за допомогою grep, регулярного виразу або perl
У мене є файл, який виглядає приблизно так: <table name="content_analyzer" primary-key="id"> <type="global" /> </table> <table name="content_analyzer2" primary-key="id"> <type="global" /> </table> <table name="content_analyzer_items" primary-key="id"> <type="global" /> </table> Мені потрібно витягти що - або в лапках , які слідують name=, тобто content_analyzer, content_analyzer2і content_analyzer_items. Я роблю це на коробці Linux, тому рішення …

5
Витягування тексту з PDF-файлу за допомогою PDFMiner у python?
Я шукаю документацію або приклади того, як витягти текст з PDF-файлу за допомогою PDFMiner з Python. Схоже, PDFMiner оновив свій API, і всі відповідні приклади, які я знайшов, містять застарілий код (класи та методи змінилися). Знайдені мною бібліотеки, які полегшують завдання вилучення тексту з файлу PDF, використовують старий синтаксис PDFMiner, …

2
Розбір PDF за допомогою Python - вилучення відформатованих та простих текстів [закрито]
Зачинено. Це питання не відповідає вимогам щодо переповнення стека . Наразі відповіді не приймаються. Хочете покращити це питання? Оновіть питання, щоб воно було актуальним для переповнення стека. Закрито 5 років тому . Удосконалюйте це питання Я шукаю бібліотеку PDF, яка дозволить мені витягти текст із PDF-документа. Я розглянув PyPDF, і …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.