У мене є менші одиничні тести, які використовують невеликі фрагменти з реальних наборів даних. Я також хотів би перевірити свою програму на повний набір даних з безлічі причин. Єдина проблема полягає в тому, що один реальний набір даних становить приблизно ~ 5 Гб. Я не знайшов жодних важких цифр для зберігання репозиторіїв Git, але це здається занадто великим.
Моя команда вирішила, що проект має файл, який містить шлях до мережевої файлової системи, що містить наші тестові дані. Файл Git ігнорується.
Я відчуваю, що це недосконале рішення з двох причин. Коли NAS не працює, працює повільно, або працює в режимі зниження, ми не можемо провести повний тест. Друга причина полягає в тому, що коли хтось вперше клонує сховище, тестові одиниці виходять з ладу, тому вони повинні з'ясувати, як з'єднати речі з певним іменем та синтаксис, який використовується для створення файлу шляху тестування.
Отже, моє запитання двократне. Скільки даних - це занадто багато даних для зберігання в контролі редагування?
Який кращий спосіб обробити велику кількість тестових даних?