Чи є спосіб фільтрувати таблиці Вікіпедії?


12

Я шукаю спосіб фільтрації таблиць, які часто зустрічаються у статтях Вікіпедії, тому я можу порівнювати лише ті рядки (і стовпці), які мене цікавлять.

Чи є і те

  1. вбудована функція двигуна Wikipedia, про яку я не знаю
  2. або плагін браузера, який підтримує це

Особливості, про які я можу придумати:

  • Фільтр за значенням стовпця
  • Сховати стовпці
  • Багаторівневе сортування

Аааа ... мінне поле поза темою. Дивіться пункт 3 першої таблиці. Я прошу щось конкретне для Вікіпедії. Насправді сценарій Greasemonkey міг би зробити, але його не вдалося знайти
pufferfish

Відповіді:


8

Якщо ви розмістите цю формулу в комірці в Google Sheet, вона скребить табличні дані з цього посилання на статтю у Вікіпедії: http://en.wikipedia.org/wiki/Demographics_of_India

=IMPORTHTML("http://en.wikipedia.org/wiki/Demographics_of_India", "table", 4)

Коли ви отримаєте дані в Google Sheet, ви можете фільтрувати за значенням стовпця (виберіть заголовок стовпця, виберіть Фільтр у меню Дані ) та сховати стовпець (виберіть стовпчик, виберіть Сховати стовпець у контекстному меню)

Знімок екрана Google Таблиць


1

Столи? Ви маєте на увазі інформаційні поля? Ви, ймовірно, повинні скористатися Wikidata http://wikidata.org/w/api.php і витягти звідти інформацію (вона буде чистішою), а потім представити її як вам зручніше.

В іншому випадку ви можете display: noneскрізь розсипати відповідні ідентифікатори та класи для відповідних таблиць, але це буде нескінченна гонитва за неструктурованою інформацією.


1

Сценарій фільтр Greasemonkey для фільтру « Вікіпедія» виконує все, що вам потрібно:

Підсумок сценарію: Фільтрує таблиці вікіпедій, видаляючи всі рядки, які мають небажане значення, або видаляючи певні рядки та стовпці.

Можливо, вам доведеться додати httpsверсію URL-адреси wikiedia до списку фільтрів, що включає в себе сценарій, щоб він працював.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.