Запитання з тегом «r»

Використовуйте цей тег для будь-якого питання * на тему *, який (a) включає `R` як критичну частину запитання або очікувану відповідь, а (b) - не * просто * про те, як використовувати` R`.

2
Як інтерпретувати параметри в GLM з сім'єю = Gamma
Це запитання було перенесено із переповнення стека, оскільки на нього можна відповісти на перехресному підтвердженні. Мігрували 5 років тому . У мене є питання щодо інтерпретації параметрів для GLM з розподіленою залежною змінною гамми. Це те, що R повертається для мого GLM за допомогою посилання: Call: glm(formula = income ~ …

2
Як застосувати біноміальний GLMM (glmer) до відсотків, а не так-ні?
У мене є експеримент повторного вимірювання, де залежна змінна є відсотком, і я маю кілька факторів як незалежних змінних. Я хотів би використати glmerз пакету R lme4трактувати це як проблему логістичної регресії (шляхом уточнення family=binomial), оскільки, здається, це вміщення безпосередньо відповідає. Мої дані виглядають так: > head(data.xvsy) foldnum featureset noisered …

5
Випадковий ліс проти регресії
Я запустив регресійну модель OLS на наборі даних з 5 незалежними змінними. Незалежні змінні та залежні змінні є одночасно безперервними та лінійно пов'язаними. Площа R становить близько 99,3%. Але коли я запускаю те саме, використовуючи випадковий ліс у R, то мій результат '% Варіант пояснив: 88.42'. Чому випадковий лісовий результат …

5
Як контролювати витрати на помилкову класифікацію у випадкових лісах?
Чи можна контролювати вартість помилкової класифікації в пакеті R randomForest ? У моїй власній роботі хибні негативи (наприклад, помилки, що у людини може бути захворювання) набагато дорожчі, ніж помилкові позитиви. Пакет rpart дозволяє користувачеві контролювати витрати на помилкову класифікацію, визначаючи матрицю втрат, щоб по-різному визначити неправильні класифікації. Чи існує щось …

5
Джерела для вивчення (а не просто ведення) статистики / математики через R
Мене цікавлять приклади джерел (код R, пакети R, книги, розділи книг, статті, посилання тощо) для вивчення статистичних та математичних понять через R (це може бути і через інші мови, але R - мій улюблений аромат). Завдання полягає в тому, що вивчення матеріалу спирається на програмування, а не лише на те, …

4
Важливість предикторів у множинній регресії: Часткова проти стандартизованих коефіцієнтів
Мені цікаво, яка точна залежність між частковим та коефіцієнтами у лінійній моделі та чи слід використовувати лише один чи обидва для ілюстрації важливості та впливу факторів.R2R2R^2 Наскільки я знаю, summaryя отримую оцінки коефіцієнтів, а із anovaсумою квадратів для кожного фактора - частка суми квадратів одного множника, поділена на суму суми …

1
Залишкова діагностика в регресійних моделях на основі МСМС
Нещодавно я взявся за пристосування регресійних змішаних моделей у байєсівській основі, використовуючи алгоритм MCMC (фактично функція MCMCglmm в R). Я вважаю, що я зрозумів, як діагностувати конвергенцію процесу оцінки (слід, графік гевеке, автокореляція, задній розподіл ...). Одне з того, що мене вражає в байєсівських рамках, - це те, що, здається, …

1
Як я можу вирівняти / синхронізувати два сигнали?
Я займаюся деякими дослідженнями, але застряг на етапі аналізу (варто було б приділити більше уваги моїм лекціям із статистики). Я зібрав два одночасні сигнали: витрата інтегрований для гучності і зміни розширення грудної клітки. Я хотів би порівняти сигнали і, зрештою, сподіваюся отримати гучність від сигналу розширення грудної клітки. Але спочатку …

3
Укладання / складання моделей з каре
Я часто ловлю себе на навчання кілька різних моделей прогнозування з використанням caretв Р. я буду навчати їх все на один і ту ж поперечних складках перевірки, з допомогою caret::: createFolds, а потім вибрати кращу модель , засновану на перехресній перевірці помилок. Однак середній прогноз декількох моделей часто перевершує найкращу …
21 r  caret  ensemble 

3
Перший крок для великих даних (
Припустимо, ви аналізуєте величезний набір даних у розмірі мільярдів спостережень на день, де кожне спостереження має кілька тисяч розріджених та, можливо, зайвих числових та категоріальних змінних. Скажімо, є одна проблема регресії, одна незбалансована проблема бінарної класифікації та одне завдання "з'ясувати, які прогнози є найважливішими". Моя думка, як підійти до проблеми: …

3
Невідповідність регресії проти ANOVA (aov vs lm в R)
У мене завжди було враження, що регресія - це просто більш загальна форма ANOVA і що результати були б ідентичними. Однак останнім часом у мене були такі ж дані, як регресія та ANOVA, і результати суттєво відрізняються. Тобто, в регресійній моделі важливі як основні ефекти, так і взаємодія, тоді як …
21 r  regression  anova 

1
Як я можу передбачити значення з нових входів лінійної моделі в R?
Заблокований . Це запитання та його відповіді заблоковано, оскільки це питання поза темою, але має історичне значення. Наразі він не приймає нових відповідей чи взаємодій. Я створив лінійну модель в R : mod = lm(train_y ~ train_x). Я хочу передати йому список X і отримати його передбачуване / оцінене / …

5
Приклад сильного коефіцієнта кореляції з високим значенням р
Мені було цікаво, чи можна мати дуже сильний коефіцієнт кореляції (скажімо, 9 або вище), з високим значенням p (скажімо, .25 або вище)? Ось приклад низького коефіцієнта кореляції з високим значенням p: set.seed(10) y <- rnorm(100) x <- rnorm(100)+.1*y cor.test(x,y) cor = 0,03908927, p = 0,6994 Високий коефіцієнт кореляції, низьке значення …

1
Ефективний розрахунок оберненої матриці в R
Мені потрібно обчислити матрицю оберненою і використовую solveфункцію. Хоча це добре працює на малих матрицях, на великих матрицях, solveяк правило, дуже повільно. Мені було цікаво, чи є якась інша функція або комбінація функцій (через SVD, QR, LU чи інші функції розкладання), які можуть дати мені швидші результати.

1
Логістична регресія для часових рядів
Я хотів би використовувати модель бінарної логістичної регресії в контексті потокової передачі даних (багатовимірний часовий ряд), щоб передбачити значення залежної змінної даних (тобто рядка), що щойно надійшла, враховуючи минулі спостереження. Наскільки я знаю, логістичну регресію традиційно застосовують для післясмертного аналізу, де кожна залежна змінна вже встановлена ​​(або шляхом інспекції, або …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.