Якщо ви маєте основи (визначення сторонніх, відсутніх значень, зважування, кодування) залежно від теми, у звичайній академічній літературі можна знайти набагато більше. Наприклад, в опитувальних дослідженнях (це тема, коли багато речей може піти не так, і схильна до багатьох джерел упередженості), можна знайти багато хороших статей.
Готуючись до регулярної кроссекційної регресії, справи можуть бути менш складними. Проблема може виникнути, наприклад, у тому, що ви видалите занадто багато "чужих людей" і тим самим штучно добре підходите до своєї моделі.
Тому я також рекомендую вам, крім того, щоб вивчити хороші методики, також пам’ятайте про здоровий глузд. Переконайтесь, що ви застосовуєте методи правильно, а не сліпо. Щодо обговорення програмного забезпечення в інших відповідях. Я думаю, що SPSS не є поганим для підготовки даних (я також чув хороші речі про SAS) залежно від розміру вашого набору даних. Випадаючі меню дуже інтуїтивно зрозумілі.
Але як пряма відповідь на ваше запитання, академічна література може бути чи не дуже корисним джерелом для підготовки ваших даних залежно від теми та аналізу.