Статистика та великі дані sample-size

1

Чому розподіл дисперсії вибірки є розподілом у квадраті?

Заява Розподіл вибірки дисперсії вибірки - це розподіл у квадратичній формі зі ступенем свободи, рівним , де - розмір вибірки (враховуючи, що випадкова змінна величина, що становить інтерес, зазвичай розподіляється).nn - 1н-1n-1ннn Джерело Моя інтуїція Це ніби має для мене інтуїтивний сенс 1) тому, що тест чі-квадрата виглядає як сума …

22 distributions normal-distribution sampling chi-squared sample-size

1

Показано, що 100 вимірювань для 5 суб'єктів дають набагато менше інформації, ніж 5 вимірювань для 100 предметів

На конференції я почув таке твердження: 100 вимірювань для 5 суб'єктів дають набагато менше інформації, ніж 5 вимірювань для 100 предметів. Це начебто очевидно, що це правда, але мені було цікаво, як можна це довести математично ... Я думаю, що можна використовувати лінійну змішану модель. Однак я не знаю багато …

21 mixed-model variance repeated-measures sample-size intraclass-correlation

4

Як спроектувати новий вектор на простір PCA?

Після проведення аналізу основних компонентів (PCA) я хочу спроектувати новий вектор на простір PCA (тобто знайти його координати в системі координат PCA). Я розрахував PCA мовою R за допомогою prcomp. Тепер я повинен мати можливість помножити свій вектор на матрицю обертання PCA. Чи повинні головні компоненти в цій матриці розташовуватися …

21 r pca r variance heteroscedasticity misspecification distributions time-series data-visualization modeling histogram kolmogorov-smirnov negative-binomial likelihood-ratio econometrics panel-data categorical-data scales survey distributions pdf histogram correlation algorithms r gpu parallel-computing approximation mean median references sample-size normality-assumption central-limit-theorem rule-of-thumb confidence-interval estimation mixed-model psychometrics random-effects-model hypothesis-testing sample-size dataset large-data regression standard-deviation variance approximation hypothesis-testing variance central-limit-theorem kernel-trick kernel-smoothing error sampling hypothesis-testing normality-assumption philosophical confidence-interval modeling model-selection experiment-design hypothesis-testing statistical-significance power asymptotics information-retrieval anova multiple-comparisons ancova classification clustering factor-analysis psychometrics r sampling expectation-maximization markov-process r data-visualization correlation regression statistical-significance degrees-of-freedom experiment-design r regression curve-fitting change-point loess machine-learning classification self-study monte-carlo markov-process references mathematical-statistics data-visualization python cart boosting regression classification robust cart survey binomial psychometrics likert psychology asymptotics multinomial

3

Приклад розподілу, коли для теореми центральної межі необхідний великий розмір вибірки

У деяких книгах зазначено, що розмір вибірки розміром 30 або вище необхідний, щоб теорема про центральну межу дала хороший наближення для . Х¯X¯\bar{X} Я знаю, цього недостатньо для всіх дистрибутивів. Я хотів би побачити кілька прикладів розподілів, де навіть при великому розмірі вибірки (можливо, 100, 1000 або більше) розподіл середнього …

19 mean sample-size normality-assumption central-limit-theorem

1

Чи є статистичний тест для порівняння двох зразків розміром 1 і 3?

Для екологічного проекту моя лабораторна група додала оцту до 4-х резервуарів, що містять рівний об'єм води в ставку, 1 контроль без елодеї (водної рослини) та 3 обробки з однаковою кількістю елодеї в кожному. Метою додавання оцту було зниження рН. Гіпотеза полягала в тому, що цистерни з елодеєю швидше повернуться до …

19 hypothesis-testing t-test sample-size

1

Що означає зробити розмір вибірки випадковою змінною?

Френк Харрелл запустив блог ( статистичне мислення) . У своєму прем'єрському посту він перераховує деякі ключові риси його статистичної філософії. Серед інших предметів він включає: Зробіть розмір вибірки випадковою змінною, коли це можливо Що означає "зробити розмір вибірки випадковою змінною"? Які переваги цього робити? Чому це може бути кращим?

18 sample-size random-variable regression-strategies

4

Розрахунок необхідного розміру вибірки, точність оцінки дисперсії?

Фон У мене є змінна з невідомим розподілом. У мене є 500 зразків, але я хотів би продемонструвати точність, з якою я можу обчислити дисперсію, наприклад, стверджувати, що розмір вибірки 500 достатній. Мені також цікаво знати мінімальний розмір вибірки, який би знадобився для оцінки дисперсії з точністю .X%X%X\% Запитання Як …

18 estimation random-variable variance sampling sample-size

6

Чи можна довіряти вагомому результату t-тесту, якщо розмір вибірки невеликий?

Якщо результат мого одностороннього t-тесту є значним, але розмір вибірки невеликий (наприклад, нижче 20 або більше), чи можу я все-таки довіряти цьому результату? Якщо ні, то як мені поводитися та / або тлумачити цей результат?

17 statistical-significance t-test interpretation sample-size small-sample

2

Який взаємозв'язок між розміром вибірки та впливом попереднього на заднє?

Якщо у нас невеликий розмір вибірки, чи вплине попередній розподіл на задній розподіл сильно?

17 bayesian sample-size prior

8

Мінімальний розмір вибірки для непарного тесту

Чи існує "правило" для визначення мінімального розміру вибірки, необхідного для тестування тесту? Наприклад, потрібно порівняти між засобами двох груп населення. Є 7 точок даних від однієї сукупності та лише 2 точки даних від іншого. На жаль, експеримент дуже дорогий і забирає багато часу, а отримання більшої кількості даних неможливо. Чи …

16 t-test sample-size small-sample wilcoxon-mann-whitney

2

Як вибрати рівень значущості для великого набору даних?

Я працюю з набором даних, що має близько 200 000. У регресії я бачу дуже малі значення значущості << 0,001, пов'язані з дуже малими розмірами ефекту, наприклад r = 0,028. Що я хотів би знати, чи існує принциповий спосіб визначення відповідного порогу значущості щодо розміру вибірки? Чи є якісь важливі …

15 regression probability statistical-significance sample-size

3

Як ви визначаєте розмір вибірки при опитуванні великої кількості населення?

В даний час в Австралії проводяться вибори, і зрозуміло, що ЗМІ щодня повідомляють про нові результати політичного опитування. У 22 мільйонах країн, який відсоток населення потрібно взяти на вибірку, щоб отримати статистично достовірний результат? Чи можливо, що використання занадто великої вибірки може вплинути на результати, або статистична обгрунтованість монотонно зростає …

15 sample-size polling

3

Завантажувальний інструмент: питання про оснащення

Припустимо, виконується так звана непараметрична завантажувальна програма шляхом складання зразків розміром кожна з вихідних спостережень із заміною. Я вважаю, що ця процедура рівнозначна оцінці функції кумулятивного розподілу за емпіричним cdf:BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function а потім отримання зразків завантажувальної машини шляхом імітації спостережень із розрахункового cdf разів підряд.nnnBBB Якщо я маю рацію в …

14 bootstrap sample-size sample small-sample finite-population

2

Неоднакові розміри вибірки: Коли її дзвонити, вона припиняється

Я рецензую статтю академічного журналу, і автори написали наступне як обґрунтування того, що не повідомляють про будь-яку інфекційну статистику (я визначив характер двох груп): В цілому 25 з 2349 (1,1%) респондентів повідомили X . Ми належним чином утримуємося від подання аналізів, які статистично порівнюють групу X з групою Y (інші …

14 hypothesis-testing sample-size power-analysis power group-differences

7

Чи варто моделювати короткі часові серії?

Ось якийсь контекст. Мені цікаво визначити, як дві змінні середовища (температура, рівень поживних речовин) впливають на середнє значення змінної реакції протягом 11-річного періоду. Протягом кожного року є дані з понад 100 тис. Локацій. Мета - визначити, чи реагувало протягом 11 років середнє значення змінних реакцій на зміни змінних умов навколишнього …

14 time-series regression sample-size small-sample

Запитання з тегом «sample-size»