Статистика та великі дані ecology

5

Як боротися з ієрархічними / вкладеними даними в машинному навчанні

Я поясню свою проблему на прикладі. Припустимо, ви хочете передбачити дохід фізичної особи за деякими ознаками: {Вік, стать, країна, регіон, місто}. У вас такий навчальний набір даних train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID …

29 regression machine-learning multilevel-analysis correlation dataset spatial paired-comparisons cross-correlation clustering aic bic dependent-variable k-means mean standard-error measurement-error errors-in-variables regression multiple-regression pca linear-model dimensionality-reduction machine-learning neural-networks deep-learning conv-neural-network computer-vision clustering spss r weighted-data wilcoxon-signed-rank bayesian hierarchical-bayesian bugs stan distributions categorical-data variance ecology r survival regression r-squared descriptive-statistics cross-section maximum-likelihood factor-analysis likert r multiple-imputation propensity-scores distributions t-test logit probit z-test confidence-interval poisson-distribution deep-learning conv-neural-network residual-networks r survey wilcoxon-mann-whitney ranking kruskal-wallis bias loss-functions frequentist decision-theory risk machine-learning distributions normal-distribution multivariate-analysis inference dataset factor-analysis survey multilevel-analysis clinical-trials

1

Що таке "ефект підкови" та / або "ефект дуги" в аналізі PCA / листування?

Існує багато методик екологічної статистики для розвідувального аналізу даних багатовимірних даних. Вони називаються методами «висвячення». Багато хто однаковий або тісно пов'язаний із поширеними методами в статистиці. Можливо, прототипним прикладом буде аналіз основних компонентів (PCA). Екологи можуть використовувати PCA та пов'язані з ними методи для дослідження «градієнтів» (мені не зовсім зрозуміло, …

20 pca eda ecology correspondence-analysis

2

Питання про логістичну регресію

Я хочу запустити бінарну логістичну регресію для моделювання наявності чи відсутності конфлікту (залежної змінної) з набору незалежних змінних протягом 10-річного періоду (1997-2006), причому кожен рік мав 107 спостережень. Мої незалежні: деградація земель (категорична для 2 видів деградації); приріст населення (0- ні; 1-так); тип існування (0 - тип один; 1 - …

14 regression time-series logistic spatial ecology

4

Інтерпретація дисперсії випадкових ефектів у glmer

Я переглядаю статтю про запилення, де дані розподілені біноміально (фрукти дозрівають чи ні). Тому я використовував glmerодин випадковий ефект (окрема рослина) та один фіксований ефект (лікування). Рецензент хоче дізнатися, чи вплинула рослина на набір фруктів - але у мене виникають проблеми з інтерпретацією glmerрезультатів. Я читав в Інтернеті, і, здається, …

13 r generalized-linear-model variance lme4-nlme ecology

2

Який розподіл похибки навколо даних логістичного зростання?

В екології ми часто використовуємо логістичне рівняння зростання: Nt=KN0ertK+N0ert−1Nt=KN0ertK+N0ert−1 N_t = \frac{ K N_0 e^{rt} }{K + N_0 e^{rt-1}} або Nt=KN0N0+(K−N0)e−rtNt=KN0N0+(K−N0)e−rt N_t = \frac{ K N_0}{N_0 + (K -N_0)e^{-rt}} де KKK - вантажопідйомність (досягнута максимальна щільність), N0N0N_0 - початкова щільність, rrr - темп зростання, ttt час від початкового. Значення NtNtN_t …

10 r distributions pdf ecology

1

Яка модель глибокого навчання може класифікувати категорії, які не є взаємовиключними

Приклади: у мене є речення в описі посади: "Старший інженер Java у Великобританії". Я хочу використовувати модель глибокого навчання, щоб передбачити її як 2 категорії: English і IT jobs. Якщо я використовую традиційну модель класифікації, вона може передбачити лише 1 мітку з softmaxфункцією на останньому шарі. Таким чином, я можу …

9 machine-learning deep-learning natural-language tensorflow sampling distance non-independent application regression machine-learning logistic mixed-model control-group crossover r multivariate-analysis ecology procrustes-analysis vegan regression hypothesis-testing interpretation chi-squared bootstrap r bioinformatics bayesian exponential beta-distribution bernoulli-distribution conjugate-prior distributions bayesian prior beta-distribution covariance naive-bayes smoothing laplace-smoothing distributions data-visualization regression probit penalized estimation unbiased-estimator fisher-information unbalanced-classes bayesian model-selection aic multiple-regression cross-validation regression-coefficients nonlinear-regression standardization naive-bayes trend machine-learning clustering unsupervised-learning wilcoxon-mann-whitney z-score econometrics generalized-moments method-of-moments machine-learning conv-neural-network image-processing ocr machine-learning neural-networks conv-neural-network tensorflow r logistic scoring-rules probability self-study pdf cdf classification svm resampling forecasting rms volatility-forecasting diebold-mariano neural-networks prediction-interval uncertainty

1

Які критерії використовувати для поділу змінних на пояснювальні змінні та відповіді для методів ординації в екології?

У мене різні змінні, які взаємодіють у межах популяції. В основному я робив інвентаризацію міліпед і вимірював деякі інші значення місцевості, наприклад: Вид і кількість зібраних особин Різне середовище, де знаходяться тварини рН Відсоток органічного матеріалу кількість P, K, Mg, Ca, Mn, Fe, Zn, Cu Відношення Ca + Mg / …

9 pca multivariate-analysis ecology correspondence-analysis

3

Книги зі статистичної екології?

Я знаю, що це питання було задано раніше: Довідник з екологічних досліджень, але це не те, що я шукаю. Що я шукаю, якщо хтось може порекомендувати гарну книгу (або канонічну довідку) про статистичну екологію? Я дуже добре розумію статистику, щоб книга могла бути справді на будь-якому рівні. Я б використовував …

9 self-study references ecology

1

Як побудувати квадрати для точкових процесів, які сильно відрізняються за частотою?

Я хочу здійснити аналіз лічильника квадрата на декількох точкових процесах (або одному позначеному точковому процесі), щоб потім застосувати деякі методи зменшення розмірності. Мітки не однаково розподілені, тобто деякі знаки з’являються досить часто, а деякі досить рідко. Таким чином, я не можу просто розділити 2D-простір на звичайній сітці, тому що більш …

9 multivariate-analysis normalization ecology point-process

Запитання з тегом «ecology»