Запитання з тегом «linear-model»

Посилається на будь-яку модель, де випадкова змінна пов'язана з однією або кількома випадковими змінними функцією, лінійною у кінцевій кількості параметрів.


9
Коли нормально зняти перехоплення в лінійній регресійній моделі?
Я запускаю лінійні регресійні моделі і цікавлюсь, які умови для зняття терміна перехоплення. Порівнюючи результати двох різних регресій, де одна має перехоплення, а інша ні, я помічаю, що функції без перехоплення набагато вище. Чи є певні умови чи припущення, яких я повинен дотримуватися, щоб переконатися, що вилучення терміну перехоплення є …

2
Видалення статистично значущого перехоплюючого терміну збільшує у лінійній моделі
У простій лінійній моделі з єдиною пояснювальною змінною, αi=β0+β1δi+ϵiαi=β0+β1δi+ϵi\alpha_i = \beta_0 + \beta_1 \delta_i + \epsilon_i Я вважаю, що видалення терміна перехоплення значно покращує придатність (значення йде від 0,3 до 0,9). Однак термін перехоплення виявляється статистично значущим.R2R2R^2 З перехопленням: Call: lm(formula = alpha ~ delta, data = cf) Residuals: Min …

9
Яка різниця між лінійною регресією на y з x і x з y?
Коефіцієнт кореляції Пірсона x і y є однаковим, незалежно від того, чи обчислюєте ви грушу (x, y) або pearson (y, x). Це говорить про те, що робити лінійну регресію y, заданої x або x, заданої y, слід однаково, але я не думаю, що це так. Чи може хтось пролити світло, …

4
PCA і пропорція дисперсії пояснюється
Загалом, що мається на увазі під тим, що частка дисперсії в аналізі на зразок PCA пояснюється першою основною складовою? Чи може хтось пояснити це інтуїтивно, але також дати точне математичне визначення того, що означає "роз’яснення дисперсії" з точки зору аналізу основних компонентів (PCA)?хxx Для простої лінійної регресії r-квадрат найкращої підходящої …

2
Форма довірчого інтервалу для прогнозованих значень при лінійній регресії
Я помітив, що довірчий інтервал для прогнозованих значень в лінійній регресії має тенденцію бути вузьким навколо середнього значення прогноктора і жиру навколо мінімальних і максимальних значень прогноктора. Це можна побачити на графіках цих 4 лінійних регресій: Я спочатку думав, що це тому, що більшість значень предикторів були сконцентровані навколо середнього …

4
Вибір між LM та GLM для змінної відповіді, перетвореної журналом
Я намагаюся зрозуміти філософію, що використовується за допомогою узагальненої лінійної моделі (GLM) проти лінійної моделі (LM). Я створив приклад набору даних нижче, де: log(y)=x+εlog⁡(y)=x+ε\log(y) = x + \varepsilon У прикладі немає помилки як функції величини y , тому я вважаю, що лінійна модель перетвореного y журналу y була б найкращою. …

4
Швидка лінійна регресія, міцна для людей, що втратили лих
Я маю справу з лінійними даними з випереджаючими людьми, деякі з яких мають більше 5 стандартних відхилень від розрахункової лінії регресії. Я шукаю техніку лінійної регресії, яка зменшує вплив цих точок. Поки що я зробив, це оцінити лінію регресії з усіма даними, потім відкинути точку даних з дуже великими залишками …

3
Інтерпретація прогнозованого прогнозу та / або відповіді перетвореного журналом
Мені цікаво, чи має значення інтерпретація, чи трансформуються лише залежні, і залежні, і незалежні, або лише незалежні змінні. Розглянемо випадок log(DV) = Intercept + B1*IV + Error Я можу трактувати ІV як збільшення відсотка, але як це змінюється, коли я маю log(DV) = Intercept + B1*log(IV) + Error або коли …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

3
Звідки походить помилкове уявлення про те, що Y повинен бути нормально розподілений?
Начебто авторитетні джерела стверджують, що залежна змінна повинна бути нормально розподілена: Модельні припущення: YYY зазвичай розподіляється, помилки нормально розподіляються, ei∼N(0,σ2)ei∼N(0,σ2)e_i \sim N(0,\sigma^2) , і незалежні, і XXX є фіксованим, а постійна дисперсія σ2σ2\sigma^2 . Penn State, STAT 504 Аналіз дискретних даних По-друге, аналіз лінійної регресії вимагає, щоб усі змінні були …

3
Який ефект має співвіднесення предикторів у моделі множинної регресії?
У моєму класі лінійних моделей я дізнався, що якщо два предиктори співвідносяться і обидва будуть включені в модель, один буде незначним. Наприклад, припустимо, що розмір будинку та кількість спалень співвідносяться. При прогнозуванні вартості будинку з використанням цих двох прогнозів один з них може бути відхилений, оскільки вони обидва надають багато …

3
Чому поліноміальна регресія вважається особливим випадком множинної лінійної регресії?
Якщо поліноміальна регресія моделює нелінійні зв’язки, як це можна вважати особливим випадком множинної лінійної регресії? У Вікіпедії зазначається, що «Хоча поліноміальна регресія відповідає нелінійній моделі даним, однак проблема статистичного оцінювання є лінійною, в тому сенсі, що функція регресії лінійна в невідомих параметрах, що оцінюються з даних ".Е (у| х)E(y|x)\mathbb{E}(y | …

3
Виведення варіації коефіцієнта регресії в простій лінійній регресії
У простій лінійній регресії маємо y=β0+β1x+uy=β0+β1x+uy = \beta_0 + \beta_1 x + u , де u∼iidN(0,σ2)u∼iidN(0,σ2)u \sim iid\;\mathcal N(0,\sigma^2) . Я отримав оцінювач: β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 ,β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 , \hat{\beta_1} = \frac{\sum_i (x_i - \bar{x})(y_i - \bar{y})}{\sum_i (x_i - \bar{x})^2}\ , деx¯x¯\bar{x} іy¯y¯\bar{y} - вибіркові засобиxxxіyyy. Тепер я хочу , щоб знайти дисперсію …

2
Як я можу знати, який метод перехресної перевірки найкращий?
Я намагаюся розібратися, який метод перехресної перевірки найкращий для моєї ситуації. Наступні дані - лише приклад для роботи над проблемою (в R), але мої реальні Xдані ( xmat) співвідносяться між собою і співвідносяться в різній мірі зі yзмінною ( ymat). Я надав код R, але моє питання не про R, …

5
Що робити, якщо дані моєї лінійної регресії містять кілька сумісних лінійних зв’язків?
Скажімо, я вивчаю, як нарциси реагують на різні ґрунтові умови. Я зібрав дані про рН ґрунту проти зрілої висоти нарциса. Я очікую лінійних відносин, тому я берусь за лінійною регресією. Однак я не усвідомив, коли розпочав своє дослідження, що популяція насправді містить два різновиди нарцисів, кожен з яких реагує дуже …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.