Запитання з тегом «sample-size»

Цей тег дуже неоднозначний. Використовуйте його, коли питання щодо розміру вибірки і НІКОЛІ з наступного є більш доречним: [малий вибірки], [великі дані], [аналіз потужності], [потужність], [недоозначений] або [неврівноважений-класи].

1
Чому розподіл дисперсії вибірки є розподілом у квадраті?
Заява Розподіл вибірки дисперсії вибірки - це розподіл у квадратичній формі зі ступенем свободи, рівним , де - розмір вибірки (враховуючи, що випадкова змінна величина, що становить інтерес, зазвичай розподіляється).nn - 1н-1n-1ннn Джерело Моя інтуїція Це ніби має для мене інтуїтивний сенс 1) тому, що тест чі-квадрата виглядає як сума …

1
Показано, що 100 вимірювань для 5 суб'єктів дають набагато менше інформації, ніж 5 вимірювань для 100 предметів
На конференції я почув таке твердження: 100 вимірювань для 5 суб'єктів дають набагато менше інформації, ніж 5 вимірювань для 100 предметів. Це начебто очевидно, що це правда, але мені було цікаво, як можна це довести математично ... Я думаю, що можна використовувати лінійну змішану модель. Однак я не знаю багато …

4
Як спроектувати новий вектор на простір PCA?
Після проведення аналізу основних компонентів (PCA) я хочу спроектувати новий вектор на простір PCA (тобто знайти його координати в системі координат PCA). Я розрахував PCA мовою R за допомогою prcomp. Тепер я повинен мати можливість помножити свій вектор на матрицю обертання PCA. Чи повинні головні компоненти в цій матриці розташовуватися …
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

3
Приклад розподілу, коли для теореми центральної межі необхідний великий розмір вибірки
У деяких книгах зазначено, що розмір вибірки розміром 30 або вище необхідний, щоб теорема про центральну межу дала хороший наближення для . Х¯X¯\bar{X} Я знаю, цього недостатньо для всіх дистрибутивів. Я хотів би побачити кілька прикладів розподілів, де навіть при великому розмірі вибірки (можливо, 100, 1000 або більше) розподіл середнього …

1
Чи є статистичний тест для порівняння двох зразків розміром 1 і 3?
Для екологічного проекту моя лабораторна група додала оцту до 4-х резервуарів, що містять рівний об'єм води в ставку, 1 контроль без елодеї (водної рослини) та 3 обробки з однаковою кількістю елодеї в кожному. Метою додавання оцту було зниження рН. Гіпотеза полягала в тому, що цистерни з елодеєю швидше повернуться до …

1
Що означає зробити розмір вибірки випадковою змінною?
Френк Харрелл запустив блог ( статистичне мислення) . У своєму прем'єрському посту він перераховує деякі ключові риси його статистичної філософії. Серед інших предметів він включає: Зробіть розмір вибірки випадковою змінною, коли це можливо Що означає "зробити розмір вибірки випадковою змінною"? Які переваги цього робити? Чому це може бути кращим?

4
Розрахунок необхідного розміру вибірки, точність оцінки дисперсії?
Фон У мене є змінна з невідомим розподілом. У мене є 500 зразків, але я хотів би продемонструвати точність, з якою я можу обчислити дисперсію, наприклад, стверджувати, що розмір вибірки 500 достатній. Мені також цікаво знати мінімальний розмір вибірки, який би знадобився для оцінки дисперсії з точністю .X%X%X\% Запитання Як …

6
Чи можна довіряти вагомому результату t-тесту, якщо розмір вибірки невеликий?
Якщо результат мого одностороннього t-тесту є значним, але розмір вибірки невеликий (наприклад, нижче 20 або більше), чи можу я все-таки довіряти цьому результату? Якщо ні, то як мені поводитися та / або тлумачити цей результат?


8
Мінімальний розмір вибірки для непарного тесту
Чи існує "правило" для визначення мінімального розміру вибірки, необхідного для тестування тесту? Наприклад, потрібно порівняти між засобами двох груп населення. Є 7 точок даних від однієї сукупності та лише 2 точки даних від іншого. На жаль, експеримент дуже дорогий і забирає багато часу, а отримання більшої кількості даних неможливо. Чи …

2
Як вибрати рівень значущості для великого набору даних?
Я працюю з набором даних, що має близько 200 000. У регресії я бачу дуже малі значення значущості << 0,001, пов'язані з дуже малими розмірами ефекту, наприклад r = 0,028. Що я хотів би знати, чи існує принциповий спосіб визначення відповідного порогу значущості щодо розміру вибірки? Чи є якісь важливі …

3
Як ви визначаєте розмір вибірки при опитуванні великої кількості населення?
В даний час в Австралії проводяться вибори, і зрозуміло, що ЗМІ щодня повідомляють про нові результати політичного опитування. У 22 мільйонах країн, який відсоток населення потрібно взяти на вибірку, щоб отримати статистично достовірний результат? Чи можливо, що використання занадто великої вибірки може вплинути на результати, або статистична обгрунтованість монотонно зростає …

3
Завантажувальний інструмент: питання про оснащення
Припустимо, виконується так звана непараметрична завантажувальна програма шляхом складання зразків розміром кожна з вихідних спостережень із заміною. Я вважаю, що ця процедура рівнозначна оцінці функції кумулятивного розподілу за емпіричним cdf:BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function а потім отримання зразків завантажувальної машини шляхом імітації спостережень із розрахункового cdf разів підряд.nnnBBB Якщо я маю рацію в …

2
Неоднакові розміри вибірки: Коли її дзвонити, вона припиняється
Я рецензую статтю академічного журналу, і автори написали наступне як обґрунтування того, що не повідомляють про будь-яку інфекційну статистику (я визначив характер двох груп): В цілому 25 з 2349 (1,1%) респондентів повідомили X . Ми належним чином утримуємося від подання аналізів, які статистично порівнюють групу X з групою Y (інші …

7
Чи варто моделювати короткі часові серії?
Ось якийсь контекст. Мені цікаво визначити, як дві змінні середовища (температура, рівень поживних речовин) впливають на середнє значення змінної реакції протягом 11-річного періоду. Протягом кожного року є дані з понад 100 тис. Локацій. Мета - визначити, чи реагувало протягом 11 років середнє значення змінних реакцій на зміни змінних умов навколишнього …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.