Ви не можете дійсно зняти знаючу людину з циклу і очікувати розумних результатів. Це не означає, що людина має дивитись на кожен окремий предмет окремо, але в кінцевому підсумку потрібні деякі фактичні знання, щоб знати, чи резюме / графіки даних є розумними. (Наприклад: чи може змінна A бути від'ємною, чи може змінна B бути більшою за змінну A, чи є 4 або 5 варіантів для категоріальної змінної C?)
Після того, як ви поцікавились людськими поглядами на дані, ви, ймовірно, можете скласти ряд правил, які ви можете використовувати для автоматичного тестування даних. Проблема в тому, що можуть виникнути інші помилки, про які ви не думали. (Наприклад, помилка програмування в процесі збору даних, що дублює змінну A на змінну C.)