Контекст: У відповідь на попереднє запитання про відтворювані дослідження Джейк писав
Однією з проблем, які ми виявили під час створення нашого архіву JASA, було те, що змінилися версії та типові параметри CRAN-пакетів. Отже, в цей архів ми також включаємо версії пакетів, які ми використовували. Система, що базується на віньєтці, ймовірно, зламається, коли люди змінюють свої пакети (не впевнені, як включити додаткові пакети до пакету, який є Компендіумом).
Нарешті, мені цікаво, що робити, коли змінюється сам R. Чи існують способи виготовлення, скажімо, віртуальної машини, яка відтворює все обчислювальне середовище, що використовується для паперу, таким чином, щоб віртуальна машина не була величезною?
Питання:
- Які хороші стратегії для забезпечення відтворення аналізу даних, які можна відтворити в майбутньому (скажімо, через п’ять, десять чи двадцять років після публікації)?
- Зокрема, які хороші стратегії для досягнення максимальної тривалості відтворюваності під час використання Sweave та R?
Це, мабуть, пов’язане з проблемою забезпечення того, щоб проект аналізу даних, що відтворюється, запускався на чужому апараті з дещо іншими за замовчуванням, пакетами тощо.