Мені подобається книга G van Belle « Статистичні правила великого пальця» , і меншою мірою поширені помилки в статистиці (і як їх уникнути) від Філіппа I Good та Джеймса У. Хардіна. Вони стосуються загальних підводних каменів під час інтерпретації результатів експериментальних та спостережних досліджень та надають практичні рекомендації щодо статистичних висновків або дослідницького аналізу даних. Але я відчуваю, що "сучасних" настанов дещо бракує, особливо з постійно зростаючим використанням обчислювальної та надійної статистики в різних галузях, або впровадженням методів машинобудівного співтовариства, наприклад, клінічної біостатистики або генетичної епідеміології.
Окрім обчислювальних хитрощів або загальних підводних каменів у візуалізації даних, які можна було б вирішити в іншому місці, я хотів би запитати: Які основні правила ви рекомендуєте для ефективного аналізу даних? ( одне правило на відповідь, будь ласка ).
Я думаю про вказівки, які ви можете надати колезі, досліднику, що не має значного досвіду статистичного моделювання, або студенту середнього та прогресивного курсу. Це може стосуватися різних етапів аналізу даних, наприклад стратегій вибірки, вибору особливостей чи побудови моделі, порівняння моделей, післяоцінки тощо.