Чи існують API для сканування конспекту паперу?


13

Якщо у мене дуже довгий список назв паперу, як я можу отримати конспекти цих паперів з Інтернету чи будь-якої бази даних?

Назви паперу схожі на "Оцінка корисності веб-майнінгу для сфери охорони здоров'я".

Хтось знає API, який може дати мені рішення? Я спробував сканувати вчений google, однак google заблокував мого сканера.


2
Сумніваюся, для цього є якийсь загальний API. Ви можете спробувати сканувати різні сервіси, такі як Academia.edu, сайти видавців тощо. Тим не менше, було б простіше спочатку створити локальну базу документів, а потім експериментувати з витягом тез.
Войцех Вальчак

Дякую за вашу відповідь! Я вже створив для цього локальну базу даних. Проблема сканування з різних служб полягає в тому, що я повинен скласти правила розбору для кожного веб-сайту.
Алекс Гао

Отже, як щодо перетворення PDF-файлів у TXT, а потім вилучення тез регулярними виразами?
Войцех Вальчак

Дякую! Однак в договорі зазначено, що масове завантаження паперів не допускається. Це створює певний головний біль.
Алекс Гао

2
Я думаю, що це посилання відповідей на переповнення стека дає найкращу відповідь, яку я можу отримати. Можливо, люди, які стикаються з цією проблемою, також могли зазирнути на цю сторінку.
Алекс Гао

Відповіді:


8

Подивіться на:

Якщо ви отримаєте єдиний точний збіг за титулом, ви, напевно, знайшли потрібну статтю, і можете заповнити решту інформації звідти. Обидва дають посилання для завантаження та вихід у стилі бібтекс. Що ви, ймовірно, хочете зробити, хоча для отримання ідеальних метаданих - це завантажити та проаналізувати pdf (якщо такий є) та шукати ідентифікатор стилю DOI.

Будь ласка, будьте приємні і обмежте свої запити, якщо ви це зробите.


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.