Мене завжди вчили, що CLT працює при повторному відборі проб, причому кожен зразок є достатньо великим. Наприклад, уявіть, що у мене є країна з 1 000 000 громадян. Я розумію CLT, що навіть якщо розподіл їх висоти не було нормальним, якщо я взяв 1000 зразків по 50 осіб (тобто проводив 1000 опитувань по 50 громадян у кожному), то обчислював їх середній зріст для кожного зразка, розподіл цього зразка значить було б нормально.
Однак я ніколи не бачив справжнього світового випадку, коли дослідники брали повторні зразки. Натомість вони беруть одну велику вибірку (тобто опитування 50 000 громадян про їхній зріст) і працюють над цим.
Чому в статистичних книгах навчають повторного відбору зразків, а в реальному світі дослідники проводять лише одну вибірку?
Редагувати: Реальний випадок, про який я замислююся, - це статистика набору даних 50 000 користувачів Twitter. Цей набір даних, очевидно, не є повторними зразками, це лише одна велика вибірка з 50000.