Як ми можемо дізнатися коливання населення?


10

У тестуванні гіпотез поширене питання - що таке дисперсія населення? Моє запитання - як ми можемо коли-небудь знати дисперсію населення? Якби ми знали весь розподіл, ми також могли б знати середню кількість всього населення. Тоді в чому сенс тестування гіпотез?


Деяка відповідна література: nber.org/papers/w20325
dv_bn

Різницю можна знати, не знаючи нічого про середину. Наприклад, дисперсію можна відновити з квадратів усіх різниць величин у сукупності, але ці відмінності не дають інформації про середнє значення. Незважаючи на те, я не бачу, як твердження та запитання в цій публікації призводять до самого питання про тестування гіпотез.
whuber

Відповіді:


10

Я не впевнений, що ця проблема дійсно виникає "часто" поза статистикою 101 (вступ до статистики). Я не впевнений, що коли-небудь бачив. З іншого боку, ми викладаємо матеріал таким чином під час викладання вступних курсів, оскільки це забезпечує логічну прогресію: Ви починаєте з простої ситуації, коли є лише одна група, і ви знаєте дисперсію, а потім переходите до того місця, де не хочете. знайте дисперсію, потім переходите туди, де є дві групи (але з рівною дисперсією) тощо.

Щодо дещо іншого питання, ви запитуєте, чому ми б турбувались про тестування гіпотез, якби ми знали дисперсію, оскільки, таким чином, ми також повинні знати середнє значення. Остання частина є розумною, але перша частина - це непорозуміння: середнє значення, яке ми б знали, було б середнім під нульовою гіпотезою. Це те, що ми тестуємо. Розглянемо приклад @ StephanKolassa з показниками IQ. Ми знаємо, що середнє значення - 100, а стандартне відхилення - 15; ми тестуємо, якщо наша група (скажімо, ліворукі або, можливо, вступні студенти зі статистикою) відрізняється від цього.


2
(+1) Можливо, це з'являється більше, коли "вибірка з населення" - це спосіб думати про процес генерування даних, а не про те, щоб сприймати буквально. Знаючи, наприклад, точність вимірювального приладу.
Scortchi

Гунг, як практикуючий з 20-річною кар'єрою, це питання виникало в моєму досвіді частіше, ніж ви маєте на увазі. Я не припускаю, що це часто виникало, тільки що дебати відбувалися. Однак, і якщо ви говорили про статистику 101, то частіше обговорювались червоні оселедці, які вирішували мало або нічого щодо деталей дослідження чи проекту - хтось просто хотів створити вигляд інтелекту, задаючи питання.
Майк Хантер

1
@DJohnson, я думаю, це залежить від тем, над якими ти працюєш.
gung - Відновіть Моніку

4

Часто ми не знаємо різницю популяції як такої - але ми маємо дуже надійну оцінку з іншої вибірки. Наприклад, ось приклад для оцінки того, чи знизилася середня вага пінгвінів, де ми використовуємо середнє значення для зразка з невеликим результатом, але відхилення від більшого незалежного зразка. Звичайно, це передбачає, що дисперсія однакова для обох груп населення.

Іншим прикладом можуть бути класичні ваги IQ. Вони нормалізуються з середнім значенням 100 і стандартним відхиленням 15, використовуючи дійсно великі зразки. Потім ми можемо взяти конкретний зразок (скажімо, 50 ліворуких червоношкірих) і запитати, чи є їх середній IQ значно більшим за 100, використовуючи 15 ^ 2 як "відому" дисперсію. Звичайно, ще раз тут виникає питання, чи дійсно дисперсія однакова між двома зразками - зрештою, ми вже тестуємо, чи відрізняються засоби, тож чому повинні бути рівні відхилення?

Підсумок: ваші занепокоєння справедливі, і зазвичай тести з відомими моментами служать лише дидактичним цілям. На курсах статистики зазвичай їх одразу проводять з тестами з використанням оціночних моментів.


2

Єдиний спосіб дізнатися відмінність чисельності населення - це вимірювання всього населення.

Однак вимірювання цілого населення часто недоцільне; для цього потрібні ресурси, включаючи гроші, інструменти, персонал та доступ. З цієї причини ми відбираємо вибірки; тобто вимірювання підмножини населення. Процес відбору проб повинен бути розроблений ретельно та з метою створення вибіркової сукупності, яка є репрезентативною для населення; даючи два ключові міркування - розмір вибірки та методику відбору проб.

Приклад іграшки: Ви хочете оцінити відхилення у вазі для дорослого населення Швеції. Є десь 9,5 мільйонів шведів, тому малоймовірно, що ви зможете вийти і виміряти їх усіх. Тому потрібно виміряти вибіркову сукупність, за допомогою якої можна оцінити справжню дисперсію всередині населення.

Ви вирушаєте на вибірку населення Швеції. Для цього ви їдете і стоїте в центрі міста Стокгольма, і просто так трапляється біля популярної вигаданої шведської мережі гамбургерів Burger Kungen . Насправді дощ і холодно (повинно бути літо), тому ти стоїш всередині ресторану. Тут ви важите чотири людини.

Швидше за все, ваш зразок не буде дуже добре відображати населення Швеції. У вас є зразок людей у ​​Стокгольмі, які перебувають у ресторані для гамбургерів. Це погана методика відбору проб, оскільки це може призвести до зміщення результату, не надаючи справедливого представлення населення, яке ви намагаєтеся оцінити. Крім того, у вас невеликий розмір вибірки, тож у вас є високий ризик забрати чотирьох людей, які перебувають у крайності населення; або дуже легкий, або дуже важкий. Якщо ви взяли вибірку на 1000 осіб, ви рідше викликаєте зміщення вибірки; набагато менше шансів вибрати 1000 людей, які незвичні, ніж вибрати чотирьох, які незвичайні. Більший розмір вибірки принаймні дасть точнішу оцінку середньої величини та різниці ваги серед клієнтів Burger Kungen.

введіть тут опис зображення

Гістограма ілюструє ефект відбору проб, сірий розподіл може представляти населення Швеції, яке не їсть у Бургер-Кунген (середнє 85 кг), тоді як червоний може представляти популяцію споживачів Burger Kungen (в середньому 100 кг) , а сині тире можуть бути чотирма людьми, яких ви пробуєте. Правильна методика відбору проб повинна була б зважити чисельність населення, і в цьому випадку ~ 75% населення, таким чином 75% відміряних проб, не повинні бути замовниками Burger Kungen.

Це головне питання з великою кількістю опитувань. Наприклад, люди, які можуть відповісти на опитування задоволеності клієнтів або опитування думок на виборах, як правило, непропорційно представлені особами, які мають крайні погляди; люди з менш сильною думкою, як правило, більш стримано висловлюють їх.

Суть тестування гіпотез ( не завжди ), наприклад, у тестуванні, чи відрізняються дві групи один від одного. Наприклад, чи важать клієнти Burger Kungen більше, ніж шведи, які не їдять в Burger Kungen? Можливість точно перевірити це залежить від правильної методики відбору та достатнього розміру вибірки.


Код R для тестування робить це все:

df1 = data.frame(rnorm(9500000, 85, 15), sample(c("Y","N","N","N"), replace = T))
colnames(df1) = c("weight","customer")
df1$weight = ifelse(df1$customer == "Y", df1$weight + rnorm(length(df1$weight[df1$customer =="Y"]), 15, 2), df1$weight)
subsample = sample(df1$weight[df1$customer=="Y"], size = 4)

png(paste0(path,"SwedenWeight.png"), res =1000, width = 4, height = 4, units = "in")
par(mar=c(5,6,2,2))
hist(df1$weight[df1$customer=="N"], xlab = "Kilograms", col = rgb(0,0,0,0.5), main ="")
hist(df1$weight[df1$customer=="Y"], add = T, col = rgb(1,0,0,0.5))
axis(side = 1, at = c(subsample), labels = c("","","",""), tck = -0.03, col = "blue")
axis(side = 1, at = c(0,150), labels = c("",""), tck = -0)
dev.off()

t.test(df1$weight~df1$customer)

Результати:

> t.test(df1$weight~df1$customer)

        Welch Two Sample t-test

data:  df1$weight by df1$customer
t = -1327.7, df = 4042400, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -15.04688 -15.00252
sample estimates:
mean in group N mean in group Y 
       84.99555       100.02024 

1

Так, це правда, але в цих випадках також існує масштабування до фіксованої середньої величини, тому це не спричинить ситуацію, коли є невідоме середнє та відома дисперсія. Також масштабування проводиться після того, як всі значення будуть відомі.
Бен - Відновлення Моніки

1

Єдиний реалістичний приклад, який я можу придумати, коли середнє значення невідоме, але відома дисперсія - це випадковий вибірки точок на гіперсфері (у будь-якому вимірі) з фіксованим радіусом та невідомим центром. Ця проблема має невідоме середнє значення (центр сфери), але фіксовану дисперсію (радіус квадрата сфери). Я не знаю жодних інших реалістичних прикладів, коли є невідома середня, але відома дисперсія. (І щоб було зрозуміло: просто наявність зовнішньої оцінки дисперсії за іншими даними не є прикладом відомої дисперсії. Крім того, якщо ви маєте цю оцінку дисперсії від інших даних, чому ви також не маєте відповідної середньої оцінки з тих самих даних дані?)

На мою думку, вступні статистичні курси, які викладають тести з невідомою середньою та відомою дисперсією, є анахронізмом, і вони неправильно керуються як сучасний інструмент навчання. Педагогічно набагато краще почати безпосередньо з Т-тесту на випадок невідомого середнього та дисперсії, і трактувати z-тест як асимптотичне наближення до цього, що має місце, коли градуси свободи великі (чи ні навіть взагалі намагаюся викладати z-тест). Кількість ситуацій, коли була б відома дисперсія, але невідома середня величина, зникає мало, і студенти вводять в оману введення цього (шалено рідкісного) випадку.


0

Іноді в прикладних проблемах є причини, представлені фізикою, економікою тощо, які говорять нам про дисперсію і не мають невизначеності. В іншому випадку кількість населення може бути обмеженою, і нам може траплятися знати деякі речі про кожного, але нам потрібно вибирати та проводити статистику, щоб дізнатись решту.

Як правило, ваша турбота досить справедлива.


5
Мені важко зобразити приклад з фізики чи економіки, де ми могли б знати дисперсію, але не середню. Аналогічно для дискретних розподілів. Чи можете ви навести конкретний приклад чи два?
Стефан Коласа

@StephanKolassa Я вважаю, що експериментальні вимірювання фізики можуть бути прикладом - у нас може бути процес або пристрій вимірювання, який має добре відому дисперсію (похибка вимірювання), тож при вимірюванні конкретної події ви можете припустити, що дисперсія однакова, але ви можна лише оцінити справжню середню.
Петріс

2
@ Петерис: це має сенс - але це схоже більше на випадок, зазначаю , що дисперсія (вашого інструменту) була оцінена на попередніх "зразках калібрування". Я б очікував, що теоретично виведена дисперсія без невизначеності (!) Буде іншою справою.
Стефан Коласа
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.