Варіанти розміщення для загальнодоступних даних


12

Тож ви вирішили підтримати ідею відтворюваних досліджень і хочете зробити свої дані доступними в Інтернеті, щоб люди могли їх бачити та використовувати. Питання в тому, де ви його приймаєте?

Моя перша схильність - це, звичайно, приватне веб-простір, який я маю на університетському сервері, але ці речі насправді не є настільки стійкими - якщо я вийду, каталог залишається відкритим дуже короткий проміжок часу, перш ніж він зникне. Навряд чи правильне налаштування для зберігання даних, доступних для людей, які можуть використовуватись та працювати з ними в майбутньому.

Ви використовуєте щось на зразок GitHub чи SourceForge? Або інша послуга?

Дані, про які йдеться, є результатом моделювання, що викликає дуже вузький інтерес, тому я не обов'язково думаю, що десь, як InfoChimps чи інше сховище загальнодоступних даних, це правильний дім. Це менше "Ви можете дізнатися речі за допомогою цього коду!" тощо "Ви можете повторити малюнок 3 у цьому документі".


1
Відповідне, можливо, копія: stats.stackexchange.com/questions/10045/…
Метт Паркер

1
Абсолютно актуально - додавання деяких деталей, які підказують, чому я не вважав, що це дублікат.
Фоміт

@EpiGrad: Яку дату ви маєте на увазі? Якщо це вихідний код, пов'язаний з вашим дослідницьким проектом, ви можете прикріпити його до препринта arXiv .
Piotr Migdal

@PiotrMigdal В ідеалі я хотів би, щоб дані могли вивішуватися протягом декількох років, достатньо довгих, щоб звичне розповсюдження цитатних книг тощо. Я би приєднав його до препринта arXiv, якби тільки моє поле використовувало його;)
Fomite

@EpiGrad Тоді, можливо, вдалим місцем для пошуку є відкриті дані як аспект відкритої науки - michaelnielsen.org/blog/open-science .
Пьотр Мігдал

Відповіді:


4

Один з простих варіантів - github .

Я використовую його трохи для обміну даними та кодом аналізу даних. Кілька хороших прикладів інших кодів та даних про обмін на сайті наведено у цьому питанні .

Переваги github

  • Легко завантажуватись після ознайомлення з git, а чому б не використовувати git для потреб контролю версій.
  • Ви можете використовувати суточки для простих одиночних файлів
  • Іншим легко завантажувати окремі або кілька файлів у архів
  • Він має хорошу кількість безкоштовного сховища
  • вихідний код можна переглядати в Інтернеті
  • і більше...

Звичайно, github не ідеально підходить для даних. Я бачу достоїнства використання більш постійного інституційного сховища чи якогось іншого спеціалізованого інструменту для більш серйозного архівування.


1
Це власне рішення, з яким я пішов. Частина проблеми інституційного сховища полягає в тому, що в якому закладі я перебуваю в потоці, і дані насправді недостатньо важливі для одного з великих сховищ даних.
Фоміт

4

Іншим варіантом, здається, є Dataverse , який доступний як сервіс і як програмне забезпечення з відкритим кодом. Я цього не пробував.


2

Однією з можливостей для тих, хто входить в академію, є використання цифрового сховища кампусу, яке часто розміщується бібліотеками університету (для мене логічний локус для наборів даних, які супроводжують публікації).

Популярним (безкоштовним) цифровим сховищем є DSpace, який, наскільки я розумію, може розміщувати набори даних. Але це послуга, яку повинен приймати хтось у вашому закладі.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.