Статистика та великі дані cross-section

5

Як боротися з ієрархічними / вкладеними даними в машинному навчанні

Я поясню свою проблему на прикладі. Припустимо, ви хочете передбачити дохід фізичної особи за деякими ознаками: {Вік, стать, країна, регіон, місто}. У вас такий навчальний набір даних train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID …

29 regression machine-learning multilevel-analysis correlation dataset spatial paired-comparisons cross-correlation clustering aic bic dependent-variable k-means mean standard-error measurement-error errors-in-variables regression multiple-regression pca linear-model dimensionality-reduction machine-learning neural-networks deep-learning conv-neural-network computer-vision clustering spss r weighted-data wilcoxon-signed-rank bayesian hierarchical-bayesian bugs stan distributions categorical-data variance ecology r survival regression r-squared descriptive-statistics cross-section maximum-likelihood factor-analysis likert r multiple-imputation propensity-scores distributions t-test logit probit z-test confidence-interval poisson-distribution deep-learning conv-neural-network residual-networks r survey wilcoxon-mann-whitney ranking kruskal-wallis bias loss-functions frequentist decision-theory risk machine-learning distributions normal-distribution multivariate-analysis inference dataset factor-analysis survey multilevel-analysis clinical-trials

1

Що таке поперечний переріз у «поперечному перерізі повернення запасів»?

Чи може хтось дати визначення перерізу в «поперечному перерізі повернення запасів»? Спасибі

13 finance cross-section

2

Чому використання даних поперечного перерізу для висновку / прогнозування поздовжніх змін погана річ?

Я шукаю папір, який, сподіваюся, існує, але не знаю, чи є. Це може бути набір тематичних досліджень та / або аргумент теорії ймовірностей про те, чому використання даних поперечного перерізу для висновку / прогнозування поздовжніх змін може бути поганою річчю (тобто це не обов’язково, але може бути). Я бачив помилку, …

11 references panel-data inference causality cross-section

2

Чи дозволено використовувати середні показники на наборі даних для поліпшення співвідношення?

У мене є набір даних із залежною та незалежною змінною. Обидва - це не часовий ряд. У мене 120 спостережень. Коефіцієнт кореляції 0,43 Після цього розрахунку я додав стовпчик для обох змінних із середнім значенням на кожні 12 спостережень, у результаті чого з’явилися 2 нові колонки зі 108 спостереженнями (пари). …

9 regression correlation mean predictor cross-section

Запитання з тегом «cross-section»