Статистика та великі дані r

2

Як інтерпретувати параметри в GLM з сім'єю = Gamma

Це запитання було перенесено із переповнення стека, оскільки на нього можна відповісти на перехресному підтвердженні. Мігрували 5 років тому . У мене є питання щодо інтерпретації параметрів для GLM з розподіленою залежною змінною гамми. Це те, що R повертається для мого GLM за допомогою посилання: Call: glm(formula = income ~ …

21 r generalized-linear-model interpretation gamma-distribution

2

Як застосувати біноміальний GLMM (glmer) до відсотків, а не так-ні?

У мене є експеримент повторного вимірювання, де залежна змінна є відсотком, і я маю кілька факторів як незалежних змінних. Я хотів би використати glmerз пакету R lme4трактувати це як проблему логістичної регресії (шляхом уточнення family=binomial), оскільки, здається, це вміщення безпосередньо відповідає. Мої дані виглядають так: > head(data.xvsy) foldnum featureset noisered …

21 r logistic mixed-model glmm lme4-nlme

5

Випадковий ліс проти регресії

Я запустив регресійну модель OLS на наборі даних з 5 незалежними змінними. Незалежні змінні та залежні змінні є одночасно безперервними та лінійно пов'язаними. Площа R становить близько 99,3%. Але коли я запускаю те саме, використовуючи випадковий ліс у R, то мій результат '% Варіант пояснив: 88.42'. Чому випадковий лісовий результат …

21 r regression random-forest

5

Як контролювати витрати на помилкову класифікацію у випадкових лісах?

Чи можна контролювати вартість помилкової класифікації в пакеті R randomForest ? У моїй власній роботі хибні негативи (наприклад, помилки, що у людини може бути захворювання) набагато дорожчі, ніж помилкові позитиви. Пакет rpart дозволяє користувачеві контролювати витрати на помилкову класифікацію, визначаючи матрицю втрат, щоб по-різному визначити неправильні класифікації. Чи існує щось …

21 r classification random-forest loss-functions metric

5

Джерела для вивчення (а не просто ведення) статистики / математики через R

Мене цікавлять приклади джерел (код R, пакети R, книги, розділи книг, статті, посилання тощо) для вивчення статистичних та математичних понять через R (це може бути і через інші мови, але R - мій улюблений аромат). Завдання полягає в тому, що вивчення матеріалу спирається на програмування, а не лише на те, …

21 r references mathematical-statistics

4

Важливість предикторів у множинній регресії: Часткова проти стандартизованих коефіцієнтів

Мені цікаво, яка точна залежність між частковим та коефіцієнтами у лінійній моделі та чи слід використовувати лише один чи обидва для ілюстрації важливості та впливу факторів.R2R2R^2 Наскільки я знаю, summaryя отримую оцінки коефіцієнтів, а із anovaсумою квадратів для кожного фактора - частка суми квадратів одного множника, поділена на суму суми …

21 r regression multiple-regression regression-coefficients r-squared

1

Залишкова діагностика в регресійних моделях на основі МСМС

Нещодавно я взявся за пристосування регресійних змішаних моделей у байєсівській основі, використовуючи алгоритм MCMC (фактично функція MCMCglmm в R). Я вважаю, що я зрозумів, як діагностувати конвергенцію процесу оцінки (слід, графік гевеке, автокореляція, задній розподіл ...). Одне з того, що мене вражає в байєсівських рамках, - це те, що, здається, …

21 r bayesian mixed-model mcmc residuals

1

Як я можу вирівняти / синхронізувати два сигнали?

Я займаюся деякими дослідженнями, але застряг на етапі аналізу (варто було б приділити більше уваги моїм лекціям із статистики). Я зібрав два одночасні сигнали: витрата інтегрований для гучності і зміни розширення грудної клітки. Я хотів би порівняти сигнали і, зрештою, сподіваюся отримати гучність від сигналу розширення грудної клітки. Але спочатку …

21 r time-series signal-processing measurement

3

Укладання / складання моделей з каре

Я часто ловлю себе на навчання кілька різних моделей прогнозування з використанням caretв Р. я буду навчати їх все на один і ту ж поперечних складках перевірки, з допомогою caret::: createFolds, а потім вибрати кращу модель , засновану на перехресній перевірці помилок. Однак середній прогноз декількох моделей часто перевершує найкращу …

21 r caret ensemble

3

Перший крок для великих даних (

Припустимо, ви аналізуєте величезний набір даних у розмірі мільярдів спостережень на день, де кожне спостереження має кілька тисяч розріджених та, можливо, зайвих числових та категоріальних змінних. Скажімо, є одна проблема регресії, одна незбалансована проблема бінарної класифікації та одне завдання "з'ясувати, які прогнози є найважливішими". Моя думка, як підійти до проблеми: …

21 r machine-learning data-mining large-data

3

Невідповідність регресії проти ANOVA (aov vs lm в R)

У мене завжди було враження, що регресія - це просто більш загальна форма ANOVA і що результати були б ідентичними. Однак останнім часом у мене були такі ж дані, як регресія та ANOVA, і результати суттєво відрізняються. Тобто, в регресійній моделі важливі як основні ефекти, так і взаємодія, тоді як …

21 r regression anova

1

Як я можу передбачити значення з нових входів лінійної моделі в R?

Заблокований . Це запитання та його відповіді заблоковано, оскільки це питання поза темою, але має історичне значення. Наразі він не приймає нових відповідей чи взаємодій. Я створив лінійну модель в R : mod = lm(train_y ~ train_x). Я хочу передати йому список X і отримати його передбачуване / оцінене / …

21 r forecasting linear-model

5

Приклад сильного коефіцієнта кореляції з високим значенням р

Мені було цікаво, чи можна мати дуже сильний коефіцієнт кореляції (скажімо, 9 або вище), з високим значенням p (скажімо, .25 або вище)? Ось приклад низького коефіцієнта кореляції з високим значенням p: set.seed(10) y <- rnorm(100) x <- rnorm(100)+.1*y cor.test(x,y) cor = 0,03908927, p = 0,6994 Високий коефіцієнт кореляції, низьке значення …

21 r hypothesis-testing correlation

1

Ефективний розрахунок оберненої матриці в R

Мені потрібно обчислити матрицю оберненою і використовую solveфункцію. Хоча це добре працює на малих матрицях, на великих матрицях, solveяк правило, дуже повільно. Мені було цікаво, чи є якась інша функція або комбінація функцій (через SVD, QR, LU чи інші функції розкладання), які можуть дати мені швидші результати.

21 r matrix-decomposition matrix-inverse

1

Логістична регресія для часових рядів

Я хотів би використовувати модель бінарної логістичної регресії в контексті потокової передачі даних (багатовимірний часовий ряд), щоб передбачити значення залежної змінної даних (тобто рядка), що щойно надійшла, враховуючи минулі спостереження. Наскільки я знаю, логістичну регресію традиційно застосовують для післясмертного аналізу, де кожна залежна змінна вже встановлена (або шляхом інспекції, або …

21 r time-series logistic

Запитання з тегом «r»