Запитання з тегом «importance»

Важливість незалежної змінної чи прогноктора для пояснення чи прогнозування результату, що цікавить.

2
Заходи змінного значення у випадкових лісах
Я граю з випадковими лісами за регресом і мені важко розібратися, що саме означають два важливі заходи, і як їх слід тлумачити. importance()Функція дає два значення для кожної змінної: %IncMSEі IncNodePurity. Чи є прості тлумачення цих двох значень? Бо, IncNodePurityзокрема, це просто сума збільшення RSS після видалення цієї змінної?

4
Для чого корисні рейтинги змінної важливості?
Я став чимось нігілістом, коли справа стосується рейтингів різної важливості (в контексті багатоваріантних моделей усіх видів). Часто в процесі роботи мене просять або допомогти іншій команді створити рейтинг змінної важливості, або створити змінний рейтинг важливості з моєї власної роботи. У відповідь на ці запити я задаю наступні запитання Для чого …

4
Максимальна кількість незалежних змінних, які можна ввести в рівняння множинної регресії
Яка межа обмеження кількості незалежних змінних, яку можна ввести в рівняння множинної регресії? У мене є 10 прогнозів, які я хотів би вивчити з точки зору їх відносного внеску в змінну результатів. Чи слід використовувати корекцію бонферроні для коригування кількох аналізів?


2
Змінна важливість від GLMNET
Я розглядаю використання ласо як методу вибору функцій та підгонки прогнозної моделі з бінарною ціллю. Нижче наведено якийсь код, з яким я грав, щоб спробувати метод з регульованою логістичною регресією. Моє запитання: я отримую групу "значущих" змінних, але чи можу я класифікувати їх для оцінки відносної важливості кожної? Чи можна …

2
Важливе значення має фіктивні змінні
Я намагаюся зрозуміти, як я можу отримати важливість функції категоричної змінної, яка була розбита на фіктивні змінні. Я використовую scikit-learn, який не обробляє для вас категоричні змінні, як це роблять R або h2o. Якщо я розбиваю категоричну змінну вниз на манекенні змінні, я отримую окремі імпорти функцій для класу в …

5
Розуміння, які особливості були найважливішими для логістичної регресії
Я створив класифікатор логістичної регресії, який є дуже точним для моїх даних. Тепер я хочу краще зрозуміти, чому це так добре працює. Зокрема, я хотів би оцінити, які функції роблять найбільший внесок (які функції є найважливішими) і, в ідеалі, кількісно оцінити, наскільки кожна функція сприяє точності загальної моделі (або чогось …

3
Як розділити r-квадрат між змінними предиктора в множинній регресії?
Я щойно прочитав статтю, в якій автори провели багаторазову регресію з двома прогнозами. Загальне значення r-квадрата становило 0,65. Вони надали таблицю, яка розділила r-квадрат між двома прогнозами. Таблиця виглядала так: rsquared beta df pvalue whole model 0.65 NA 2, 9 0.008 predictor 1 0.38 1.01 1, 10 0.002 predictor 2 …

4
Порівняння важливості різних наборів предикторів
Я радив студенту-досліднику з певною проблемою, і я хотів отримати інформацію про інших на цьому сайті. Контекст: У дослідника було три типи змінних предиктора. Кожен тип містив різну кількість змінних предиктора. Кожен предиктор був суцільною змінною: Соціальні: S1, S2, S3, S4 (тобто чотири прогнози) Пізнавальний: C1, C2 (тобто два предиктори) …

1
Чому у випадковому лісі чомусь випадковий підмножина функцій вибирається на рівні вузла, а не на рівні дерева?
Моє запитання: Чому випадковий ліс розглядає випадкові підмножини ознак для розщеплення на рівні вузла в межах кожного дерева, а не на рівні дерева ? Передумови: Це щось із питань історії. Тін Кам Хо опублікував цю статтю про будівництво «рішення лісу» шляхом випадкового вибору підмножини функцій для використання для вирощування кожного …

2
Як кількісно оцінити відносну змінну важливість логістичної регресії з точки зору p?
Припустимо, модель логістичної регресії використовується для прогнозування того, чи придбає інтернет-покупець товар (результат: покупка), після того, як він натиснув набір рекламних оголошень в Інтернеті (предиктори: Ad1, Ad2 та Ad3). Результатом є двійкова змінна: 1 (придбана) або 0 (не придбана на замовлення). Провісниками є також двійкові змінні: 1 (натиснуто) або 0 …

1
randomForest та змінна важлива помилка?
Я не отримую різниці між rfobject$importanceі importance(rfobject)в стовпці MeanDecreaseAccuracy. Приклад: > data("iris") > fit <- randomForest(Species~., data=iris, importance=TRUE) > fit$importance setosa versicolor virginica MeanDecreaseAccuracy MeanDecreaseGini Sepal.Length 0.027078501 0.019418330 0.040497602 0.02898837 9.173648 Sepal.Width 0.008553449 0.001962036 0.006951771 0.00575489 2.472105 Petal.Length 0.313303381 0.291818815 0.280981959 0.29216790 41.284869 Petal.Width 0.349686983 0.318527008 0.270975757 0.31054451 46.323415 > …


1
Як порівняти спостережувані та очікувані події?
Припустимо, у мене є один зразок частоти 4 можливих подій: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 і я маю очікувані ймовірності моїх подій: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 За допомогою суми спостережуваних частот моїх чотирьох подій (18) …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.