API / канали даних, доступні як пакети в R


53

EDIT: Перегляд завдань CRAN веб-технологій та послуг містить набагато більш повний перелік джерел даних та API, доступних у Р. Ви можете надіслати запит на виклик на github, якщо ви хочете додати пакет до подання завдання.


Я складаю список різних каналів даних, які вже підключені до R або які легко налаштувати. Ось мій початковий список пакунків, і мені було цікаво, що ще мені не вистачає.

Я намагаюся обмежити цей список "потоками даних / API в режимі реального часу" або "близькими до реального часу", де основні дані можуть змінюватися між завантаженнями. Існує безліч списків для статичних наборів даних, які потребують лише одного завантаження.

Цей список наразі є упередженим щодо даних про фінансові / часові ряди, і я можу скористатись деякою допомогою розширити його в інші сфери.

Free Data:
Джерело даних - Пакет
Google Finance історичні дані - quantmod
Google Фінанси Баланси - quantmod
Yahoo Finance історичні дані - quantmod
Yahoo Finance історичні дані - tseries
Yahoo Finance поточні параметри ланцюга - quantmod
Yahoo Finance оцінки історичного аналітика - fImport
Yahoo Finance поточні ключових статтях - fImport - здається, зламана
Oanda історичних обмінних курсів / цін на метали - quantmod
FRED історичні макроекономічні показники - quantmod
Світового банку історичні макроекономічні показники - ІМР
Google Trends історичний пошуковий обсяг даних - RGoogleTrends
Google Docs - RGoogleDocs
Google Storage - RGoogleStorage
Twitter - Twitter
Zillow - Zillow
New York Times - RNYTimes
перепису населення США, 2000 - UScensus2000
infochimps - infochimps
datamarket - rdatamarket - вимагає безкоштовної облікового запису
Factual.com - factualR
геокодування адреси - RDSTK
Координати на карті до політичних кордонів - RDSTK
Weather Underground - Покатайте свою власну
Google News - Ролл своїх власного
Earth Sciences NetCDF дані - Ролл своїх власних
кліматичних даних - Ролл свого власного
дані громадської охорони здоров'я - Ролл свого власного
OAI Комбайн - Open Archives Initiative комбайн
RAmazonS3 - S3 Amazon сервер зберігання
Rflikr - Flikr апі

Потрібна підписка:
Bloomberg - RBloomberg
LIM - LIM
торги та котирування від NYSE - RTAQ
Interactive Brokers - IBrokers


1
залежить від того, що ви маєте на увазі під «легким налаштуванням» ... У мене є ряд спеціальних сценаріїв, які «легко налаштувати»
David LeBauer

2
Зараз я визначаю "просте налаштування" як "пакет існує" або "хтось опублікував / опублікував функцію для завантаження даних"
Зак

Я б далі визначив "пакети існують" як "пакет знаходиться в CRAN" або "пакет знаходиться в R Forge", "пакет знаходиться в якомусь CRAN-подібному публічному сховищі".
Зак

Додавання: API Федерального реєстру (у роботах).
о.

Цей потік може бути також інтерес: імпорт ціна акцій з Yahoo Finance в R .
gung - Відновіть Моніку

Відповіді:


8
  1. Інструкції щодо використання R для завантаження даних NetCDF можна знайти тут , загальний формат, який використовується для зберігання даних про земну науку, наприклад, як у морських геопросторових даних OpenEarth або драйвер кліматичної моделі та прогнози з UCAR

  2. rnpn (у стадії розробки) дозволяє отримати дані з Національної фенологічної мережі - науково-дослідного проекту для відстеження термінів зеленої рослини, цвітіння та старіння. Дивіться публікацію в блозі розробника .

  3. -obsolete- RClimate надає інструменти для завантаження та маніпулювання кліматичними даними з плоскими файлами (підручники, у тому числі тут -

  4. Завантажте історичні дані з фінансів tseries::get.hist.quote

  5. Документи Майкла Самуеля, які завантажують дані охорони здоров'я

  6. raster::getData забезпечує доступ до змінних клімату через worldclim


Що таке "netCDF дані?"
Зак

@Zach NetCDF - це своєрідний універсальний структурований спосіб зберігання великих наборів даних. Альтернативний підхід покладається на формат HDF5 .
chl

@David (+1) Дякую за четвертий бал!
chl

Що відбувається з RC кліматом? Я ніде не можу знайти пакунок
Daniel Ryback

тепер на R є бібліотека ncdf4 для обробки netcdf4. Встановити його складніше, ніж ncdf, але я вважаю, що пізніший застарілий. Кілька років тому мені навіть вдалося встановити netcdf4 з Min GW64, щоб цей пакет працював на Windows :), якщо я це зробив, це означає, що це можливо ... і здається, що Д. Пірс (автор пакету) надає джерела на своєму веб-сайті cirrus.ucsd.edu/~pierce/ncdf
robin girard

8

Існує проект, спрямований на створення R-пакетів з цією метою (інтерфейс R до API в режимі реального часу) під назвою rOpenSci , який нараховує 18 пакетів на даний момент або знаходиться на стадії розробки. Деякі (rnpn, rfishbase) вже є у вашому списку.

Чудовий список! та повне розкриття інформації - я є частиною проекту rOpenSci.


1
  1. ONETr - ефективна взаємодія з API O * NET ™, що пропонує дані дескриптора професій з Міністерства праці США.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.