Що ми можемо сказати про значення населення в розмірі вибірки 1?


43

Я задаюся питанням, що ми можемо сказати, що якщо що - небудь, про повну загальну середню населення, , коли все у мене є один вимір, (розмір вибірки 1). Очевидно, ми б хотіли мати більше вимірювань, але ми не можемо їх отримати.y 1μy1

Мені здається, оскільки значення вибірки тривіально дорівнює , то . Однак, коли розмір вибірки дорівнює 1, дисперсія вибірки не визначена, і, таким чином, наша впевненість у використанні в якості оцінювача також не визначена, правда? Чи може якийсь спосіб обмежити нашу оцінку ? y1E[ ˉ y ]=E[y1]=μ ˉ y µμy¯y1E[y¯]=E[y1]=μy¯μμ


Так, інтервал довіри на може бути побудований за певних припущень. Якщо його ніхто не публікує, я відстежу його. μ
soakley

5
Дивіться stats.stackexchange.com/questions/1807 для іншої версії того ж питання (середнє значення вибірки доступне, але не його розмір вибірки, тому ефективно середнє є одиничним спостереженням з невідомого розподілу вибірки) та stats.stackexchange .com / questions / 20300 для пов’язаної дискусії.
whuber

остання стаття, що обговорює оптимальність цих оцінювачів у звичайному випадку: tandfonline.com/doi/full/10.1080/00031305.2017.1360796
користувач795305

Відповіді:


8

Ось нова стаття з цього питання для справи Пуассона, яка має приємний педагогічний підхід:

Андерссон. Per Gösta (2015). Класовий підхід до побудови приблизного інтервалу довіри середнього Пуассона за допомогою одного спостереження. Американський статистик , 69 (3), 160-164, DOI: 10.1080 / 00031305.2015.1056830 .


... на жаль за платною стіною.
Тім

@Tim: це так. Знову ж таки, членство в ASA - це не дуже дорого, і ви отримуєте доступ до американського статистика , JASA та ще багатьох інших журналів за дуже розумною ціною, яку я особисто дуже щасливо оплачую з власної кишені. Я дійсно думаю, що ти тут коштуєш свої гроші. YMMV, звичайно.
С. Коласа - Відновіть Моніку

4
+1, але випадок Пуассона кардинально відрізняється від звичайного випадку, оскільки дисперсія повинна дорівнювати середній. Результат Пуассона досить простий, тоді якрезультат для нормального випадку є контрінтуїтивним та загадковим. x±9.68|x|
Амеба каже: Відновіть Моніку

@amoeba: цілком коректно, але в ОП не було вказано жодних обмежень на розповсюдження.
S. Kolassa - Відновіть Моніку

Це настільки коротко, що краще послужити коментарем. Але оскільки це прийнята відповідь, ви, мабуть, не захочете перетворювати її на коментар. Чи могли б ви потім узагальнити основні моменти статті?
Річард Харді

42

Якщо популяція, як відомо, нормальна, довірчий інтервал 95% на основі одного спостереження задаєтьсях ± 9,68 | х |x

x±9.68|x|

Про це йдеться у статті "Ефективний інтервал довіри для середніх зразків розміру один і другий" від Wall, Boen and Tweedie, The American Statistician , May 2001, Vol. 55, №2 . ( pdf )


5
Я ненавиджу звучати нерозумно, але .... точно не. Це залежить від одиниць і не веде себе належним чином (правильно маю на увазі скалярне множення ....)
Алек Тіл

8
@ Алек Тільки тому, що процедура залежить від одиниць вимірювання (тобто вона не є інваріантною), це не означає, що вона автоматично є недійсною або навіть поганою. Це дійсно: читайте статтю і займайтеся математикою. Багато хто визнає, що це трохи непокоїть . Ще більше дивно, що вам навіть не потрібно вважати, що базовий розподіл є нормальним: подібний результат справедливий для будь-якого одномодального розподілу (але 9,68 потрібно збільшити приблизно до 19 або більше): дивіться посилання, які я надав у коментарі до цього питання.
whuber

4
У наступному номері журналу було три листи до редактора, один з яких підніс думку Алека Теля про підрозділи. У відповіді Уолла сказано так: "Інтервал довіри не є еквівалентним (тобто, його ймовірність покриття залежить від відношення ...)" Пізніше вона "Інтервал довіри не базується на ключовій кількості ..." Це незвичний підхід і результат, без сумніву! |μ|σ
soakley

5
Тільки для того, щоб зберегти трохи роботи: листи до редактора та відповіді на замітки @soakley з'явилися в The American Statistician , vol. 56, ні. 1 (2002) .
С. Коласа - Відновіть Моніку

3
Здається, це дає інтервали довіри, що охоплюють середнє значення з вірогідністю близько коли але зі значно більшою ймовірністю в іншому випадку. Якщо то явно ймовірність становить оскільки довірчі інтервали завжди містять . σ | мк | > 0 мк = 0 100 % 095%σ|μ|>0μ=0100%0
Генрі

28

Звичайно, є. Використовуйте байєсівську парадигму. Швидше за все , у вас є принаймні деяке уявлення про те , що могло бути - наприклад, що він фізично не може бути негативним, або що це , очевидно , не може бути більше , ніж 100 (можливо , ви вимірюєте висоту місцевих середніх шкіл членів вашої футбольної команди в ногах). Поставте заздалегідь це, оновіть його своїм одиноким спостереженням, і у вас є чудова задня частина.μ


18
(+1) Одне спостереження буде переповнене попереднім, тому, здавалося б, те, що ви виходите з задньої частини, не буде набагато більше, ніж те, що ви поклали в попереднє.
whuber

Що робити, якщо ми поєднали такий пріоритет із видом ймовірності, яку мав на увазі той жалюгідний? x±9.68|x|
Саймон Куанг

@SimonKuang: одна концептуальна проблема полягає в тому, що ми можемо використовувати лишеінтервал після того, як ми спостерігали , тому це не може ввести попередній . хx±9.68|x|x
S. Kolassa - Відновіть Моніку

@StephanKolassa Ні, цей інтервал (і пов'язаний з ним розподіл) формує ймовірність. Наш попередній роздільний.
Саймон Куанг

@SimonKuang: так, ти маєш рацію, моя помилка. На жаль, наразі у мене немає часу пройти це, але якщо ви це зробите, будь ласка, опублікуйте те, що знайдете!
S. Kolassa - Відновіть Моніку

14

Невелика імітаційна вправа, щоб проілюструвати, чи працює відповідь @soakley:

# Set the number of trials, M
M=10^6
# Set the true mean for each trial
mu=rep(0,M)
# Set the true standard deviation for each trial
sd=rep(1,M)
# Set counter to zero
count=0
for(i in 1:M){
 # Control the random number generation so that the experiment is replicable 
 set.seed(i)
 # Generate one draw of a normal random variable with a given mean and standard deviation
 x=rnorm(n=1,mean=mu[i],sd=sd[i])
 # Estimate the lower confidence bound for the population mean
 lower=x-9.68*abs(x)
 # Estimate the upper confidence bound for the population mean
 upper=x+9.68*abs(x)
 # If the true mean is within the confidence interval, count it in
 if( (lower<mu[i]) && (mu[i]<upper) ) count=count+1
}
# Obtain the percentage of cases when the true mean is within the confidence interval
count_pct=count/M
# Print the result
print(count_pct)
[1] 1

З одного мільйона випадкових випробувань інтервал довіри включає справжню середню мільйон разів, тобто завжди . Цього не повинно статися, якщо довірчий інтервал склав 95% довірчий інтервал.

Отже, здається, формула не працює ... Або я зробив помилку кодування?

Редагувати: той самий емпіричний результат має місце при використанні ; однак, це для - таким чином, досить близький до 95% довірчого інтервалу.0.950097 0.95 ( μ , σ ) = ( 1000 , 1000 )(μ,σ)=(1000,1)
0.9500970.95(μ,σ)=(1000,1000)


2
Дійсно, для не дорівнює 0, це корисно (і +1 для надання коду в першу чергу!). Я щойно мав на увазі, що для , це прострочений висновок, що 0 завжди буде захоплено. µ = 0μμ=0
Вольфганг

2
(@ Вольфганг) Це не спосіб перевірити довірчий інтервал. Визначення не вимагає, щоб ІР-рівень рівня охоплював середнє значення часу у кожному випадку : воно вимагає лише, щоб (а) мав принаймні таке велике покриття у кожному випадку і (б) він наближає це покриття У деяких випадках. Таким чином, щоб ваш підхід був достовірним та переконливим, вам доведеться шукати велику кількість можливостей. Спробуйте1 - αα1αsim <- function(rho, n.iter=1e5, sigma=1, psi=9.68) { mu <- runif(n.iter, 0, sigma) * rho; x <- rnorm(n.iter, mu, sigma); mean(p <- abs(x - mu) <= psi * abs(x)) }; sim(1.75)
whuber

2
Я розумію, що ви намагаєтесь зробити, але я категорично не згоден із твердженням, що "це не спосіб перевірити інтервал довіри". У визначенні / побудові ІС параметр є фіксованою постійною. У своєму моделюванні постійно змінюється. Для фіксованих , якщо метод справді дає 95% ІС, він повинен охоплювати в 95% випадків. Це не так. Крім того, навіть при вашій будівництві дається покриття дуже близьке до 1 (звичайно, зараз ми знову наближаємось до того, що буде фіксовано 0). ц ц цμμμsim(0.1)μ
Вольфганг

2
@Вольфганг перевірте визначення, яке використовується в цитованому папері, це: , тобто ймовірність, що є в інтервалі не менше 0,95. μP(Xζ|X|μX+ζ|X|)1αμ
Тім

2
Знову ж, - це константа. Отже, це цілком чудово імітувати з . Звичайно, тоді охоплення повинно бути 1. Метод забезпечує КІ, що має принаймні 95% покриття, і приклад показує (за допомогою моделювання чи через міркування), що в деяких умовах покриття може бути до 100%. Отже, це не 95% ІС. Це все ще досить розумний метод зробити якийсь висновок з такої мало інформації. µ = 0μμ=0
Вольфганг

0

Див. Edelman, D (1990) "Інтервал довіри для центру невідомого одномовного розподілу на основі вибірки розміру один" Американський статистик, т. 44, № 4. Стаття охоплює випадки звичайного та непараметричного.


3
Ласкаво просимо до Stats.SE. Чи можете ви редагувати відповідь, щоб розширити її, щоб включити основні моменти книги, яку ви цитуєте? Це буде корисніше як для оригінального плаката, так і для інших людей, які шукають на цьому веб-сайті. До речі, скористайтеся можливістю взяти тур , якщо ви цього ще не зробили. Дивіться також кілька порад щодо відповіді , про допомогу щодо форматування та записування рівнянь за допомогою LaTeX / MathJax .
Ertxiem - відновити Моніку

Ласкаво просимо на наш сайт, Девіде. Ваш вклад, як автор цієї статті (яку, на мою думку, було цитовано тут у кількох темах), дуже вдячний, тому будь-яка перспектива чи коментарі, які ви можете надати у цій відповіді, були б дуже вітали.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.