Більш продуктивним може бути питання "чому він не був використаний у класичній статистиці, яку я дізнався?"
Залежно від рівня (рівнів), на якому він викладався, змісту курсу (та часу, доступного) цей вибір може бути обумовлений поєднанням різних факторів. Часто важливі теми залишаються осторонь, оскільки інші матеріали повинні викладатися з тих чи інших причин, сподіваючись, що вони можуть бути висвітлені в наступних темах.
Принаймні, в деяких сенсах, цим поняттям вже давно користуються різноманітні люди. Він був більш поширеним в деяких районах, ніж в інших. Багато статистичних даних не мають прогнозування чи вибору моделі в якості основного компонента (або в деяких випадках навіть взагалі), і в цьому випадку використання зразків тримання може бути менш критичним, ніж тоді, коли прогнозування є головним моментом. Можливо, воно повинно було отримати більш широке використання на більш ранній стадії в деяких відповідних додатках, ніж це було, але це не те саме, що невідомо.
Якщо ви подивитесь на сфери, орієнтовані на прогнозування, то поняття оцінки моделі шляхом прогнозування даних, які ви не використовували для оцінки вашої моделі, безумовно, було навколо (хоча і не універсальним). Я, безумовно, робив це за допомогою моделювання часових рядів, якими я займався у 1980-х, наприклад, де особливо важливе значення має вибірка прогнозування останніх даних.
Поняття про вибуття принаймні деяких даних використовувалося як в регресії (видалені залишки, PRESS, так і в тому подібному випадку), а також у зовнішньому аналізі, наприклад.
Деякі з цих ідей давно повертаються багато. Стоун (1974) [1] посилається на документи про перехресну перевірку (із словом у назві) з 1950-х та 60-х років. Можливо, ще ближче до вашого наміру, він згадує використання Саймоном (1971 р.) Термінів "будівельний зразок" та "зразок валідації" - але також вказує, що "Ларсон (1931 р.) Використовував випадковий поділ вибірки в навчальній множині" -регресійне дослідження ".
Такі теми, як перехресне підтвердження, та використання статистики, заснованої на прогнозуванні тощо, стали значно частішими, наприклад, у статистичній літературі у 70-х та 80-х роках, але багато основних ідей існували досить довго навіть потім.
[1]: Стоун, М., (1974)
"Перехресний вибір та оцінка статистичних прогнозів",
Журнал Королівського статистичного товариства. Серія B (Методологічні) , Вип. 36, № 2. С. 111-147