"Відтворювальне дослідження" як відтворювальний аналіз
Відтворювані дослідження - це термін, який використовується в деяких дослідницьких областях для позначення конкретного проведення таких аналізів
- код перетворює необроблені дані та метадані в оброблювані дані,
- код виконує аналізи даних і
- код включає в себе аналіз у звіт.
Коли такі дані та код обмінюються, це дозволяє іншим дослідникам:
- виконувати аналізи, про які не повідомляли початкові дослідники
- перевірити правильність аналізів, проведених оригінальними дослідниками
Це використання можна побачити в обговоренні таких технологій, як Sweave . Наприклад, Фрідріх Лейш пише в контексті Sweave, що "звіт можна автоматично оновлювати, якщо змінити дані або аналіз, що дозволяє реально відтворити дослідження". Це також можна побачити в CRAN Task View на відтворюваних дослідженнях, де сказано, що "метою відтворюваних досліджень є прив’язання конкретних інструкцій до аналізу даних та експериментальних даних, щоб стипендія була відтворена, краще зрозуміла та перевірена".
Ширше використання терміна "відтворюваність"
Відтворюваність - це основна мета науки. Це не нове. Звіти про дослідження включають розділи щодо методів та результатів, які мають окреслити, як дані створювалися, оброблялися та аналізувалися. Загальне правило полягає в тому, що надані деталі повинні бути достатніми для того, щоб відповідний компетентний дослідник міг взяти надану інформацію та повторити дослідження.
Відтворюваність також тісно пов'язана з поняттями повторюваності та узагальнення.
Таким чином, термін "відтворювані дослідження", сприйнятий буквально, як застосований до таких технологій, як Sweave, є помилковим, враховуючи, що він пропонує релевантність ширшу, ніж охоплює. Також, представляючи такі технології, як Sweave, дослідникам, які не використовували таких технологій, такі дослідники часто дивуються, коли я називаю процес "відтворюваним дослідженням".
Кращий термін, ніж "відтворювані дослідження"
Зважаючи на те, що "відтворювані дослідження", що використовуються в контексті Sweave, стосуються лише одного аспекту відтворюваних досліджень, можливо, слід прийняти альтернативний термін. Можливі альтернативи включають:
- Відтворювальний аналіз:
- Аналіз даних, що відтворюються
- Відтворюваний статистичний аналіз
- Відтворювальна звітність
Всі перераховані вище терміни є більш точним відображенням того, що тягне за собою аналіз Sweave. Відтворюваний аналіз короткий і милий. Додавання "даних" або "статистичних" ще більше роз'яснює речі, але також робить термін і довшим, і вужчим. Крім того, "статистичний" має вузьке і широке значення, і, безумовно, у вузькому значенні, значна частина обробки даних не є статистичною. Таким чином, широта, що передбачається терміном "відтворювальний аналіз", має свої переваги .
Йдеться не лише про відтворюваність
Іншим додатковим питанням, що стосується терміна "відтворювані дослідження", є мета технологій, що нагадує, а не просто "відтворення". Є кілька взаємопов'язаних цілей:
- Відтворюваність
- Чи можна легко повторно провести аналіз, щоб перетворити необроблені дані у підсумковий звіт з однаковими результатами?
- Правильність
- Чи відповідає аналіз даних намірам дослідника?
- Чи правильні наміри дослідника?
- Відкритість
- Прозорість, підзвітність
- Чи можуть інші перевірити та перевірити точність проведених аналізів?
- Розширюваність, модифікованість
- Чи можуть інші змінювати, розширювати, повторно використовувати та збивати дані, аналізи чи обидва для створення нових науково-дослідних робіт?
Є аргумент, що відтворювальний аналіз повинен сприяти правильному аналізу, оскільки є письмовий запис аналізів, який можна перевірити. Крім того, якщо дані та код спільні, це створює підзвітність, яка спонукає дослідників перевіряти їх аналіз, а також дозволяє іншим дослідникам відзначати виправлення.
Відтворюваний аналіз також тісно вписується в концепції навколо відкритих досліджень. Звичайно, дослідник може використовувати технологію, що нагадує Плетіння, лише для себе. Принципи відкритих досліджень заохочують обмін даними та кодом аналізу, щоб забезпечити більше використання та відповідальність.
Це насправді не критика використання слова "відтворюється". Скоріше, це просто підкреслює, що використання технологій, подібних до переплетення, необхідно, але недостатньо для досягнення цілей відкритих наукових досліджень.