Запитання з тегом «regression»

Методи аналізу взаємозв'язку між однією (або більше) змінними "залежними" та "незалежними" змінними.

2
ККТ проти необмеженої постановки регресії ласо
L1 пеналізована регресія (aka lasso) представлена ​​у двох складах. Нехай обидві цілі функції Q1=12||Y−Xβ||22Q2=12||Y−Xβ||22+λ||β||1.Q1=12||Y−Xβ||22Q2=12||Y−Xβ||22+λ||β||1. Q_1 = \frac{1}{2}||Y - X\beta||_2^2 \\ Q_2 =\frac{1}{2}||Y - X\beta||_2^2 + \lambda ||\beta||_1. Тоді два різних рецептури - argminβQ1argminβQ1 \text{argmin}_\beta \; Q_1 умови ||β||1≤t,||β||1≤t, ||\beta||_1 \leq t, і, що еквівалентно argminβQ2.argminβQ2. \text{argmin}_\beta \; Q_2. Використовуючи умови …

2
Кастинг багатоваріантної лінійної моделі у вигляді множинної регресії
Чи переробка багатовимірної лінійної регресійної моделі як множинної лінійної регресії цілком еквівалентна? Я не маю на увазі просто запуск ttt окремих регресій. Я читав це в декількох місцях (Байєсівський аналіз даних - Гельман та ін., І багатоваріантна стара школа - Марден), що багатоваріантну лінійну модель можна легко перемацати як багаторазову …

3
Як інтерпретувати коефіцієнти регресії, коли реакція трансформувалася 4-м коренем?
Я використовую четверту кореневу ( 1/4) потужність перетворення на моїй змінній реакції, як результат гетероскедастичності. Але зараз я не впевнений, як інтерпретувати свої коефіцієнти регресії. Я припускаю, що мені потрібно взяти коефіцієнти до четвертої потужності при зворотній трансформації (див. Нижче вихід регресії). Усі змінні є в одиницях долара в мільйонах, …

4
Справа з 0,1 значенням у бета-регресії
У мене є деякі дані в [0,1], які я хотів би проаналізувати за допомогою бета-регресії. Звичайно, щось потрібно зробити, щоб вмістити 0,1 значення. Мені не подобається змінювати дані, щоб відповідати моделі. також я не вірю, що інфляція нуля і 1 - це гарна ідея, тому що я вважаю, що в …

1
Обчислювальні інтервали прогнозування для логістичної регресії
Я хотів би зрозуміти, як генерувати інтервали прогнозування для логістичних регресійних оцінок. Мені порадили дотримуватися процедур у моделюванні бінарних даних Коллета, 2-е видання, с.98-99. Після впровадження цієї процедури та порівняння її з R predict.glm, я фактично думаю, що ця книга показує процедуру обчислення довірчих інтервалів , а не інтервалів прогнозування. …

4
Короткий підсумок результатів “Великого p, малого n”
Чи може хтось вказати мені на опитувальний документ на тему "Великі , малі n " результати? Мене цікавить, як ця проблема проявляється в різних контекстах дослідження, наприклад, регресія, класифікація, тест Готелінга тощо .pppннn

6
Коли випадати термін з регресійної моделі?
Чи може хтось порадити, якщо таке має сенс: Я маю справу зі звичайною лінійною моделлю з 4-ма предикторами. Я замислююся над тим, чи відмовитись від найменш значущого терміна. Це -значення трохи більше 0,05. Я стверджував на користь відмови від цього шляхом: Помноження оцінки цього терміна на (наприклад) міжквартирний діапазон вибіркових …

2
Чим відрізняється біноміальна регресія від логістичної регресії?
Я завжди розглядав логістичну регресію як просто особливий випадок біноміальної регресії, де функцією зв'язку є логістична функція (замість, скажімо, пробіт-функції). Однак, якщо я прочитав відповіді на інше запитання , то, схоже, я може бути переплутаний, і між логістичною регресією та біноміальною регресією є логічна ланка. Яка різниця?

6
Проста інтерпретація лінійної регресії
Я провів просту лінійну регресію природного журналу з двох змінних, щоб визначити, чи співвідносяться вони. Мій вихід такий: R^2 = 0.0893 slope = 0.851 p < 0.001 Я збентежений. Дивлячись на значення , я б сказав, що дві змінні не співвідносяться, оскільки це так близько до . Однак нахил лінії …

4
Усереднення значень кореляції
Скажімо, я перевіряю, наскільки змінна Yзалежить від змінної Xв різних експериментальних умовах і отримую такий графік: Штрихові лінії на графіку вище представляють лінійну регресію для кожної серії даних (експериментальна установка), а цифри в легенді позначають співвідношення Пірсона кожного ряду даних. Я хотів би обчислити "середню кореляцію" (або "середню кореляцію") між …

2
Оцінка R-квадратної та статистичної значущості за допомогою пеналізованої регресійної моделі
Я використовую пакет R штрафується отримати зморщені оцінки коефіцієнтів для набору даних , де у мене є багато провісників і мало знань, які з них мають важливе значення. Після того, як я вибрав параметри настройки L1 і L2, і я задоволений своїми коефіцієнтами, чи є статистично обгрунтований спосіб узагальнити підхід …

4
Які правильні значення для точності та відкликання у кращих випадках?
Точність визначається як: p = true positives / (true positives + false positives) Чи правильно, що як true positivesі false positivesпідхід 0, точність наближається до 1? Те саме запитання для відкликання: r = true positives / (true positives + false negatives) Зараз я впроваджую статистичний тест, де мені потрібно обчислити …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

5
Коли можна використовувати критерії, засновані на даних, для визначення моделі регресії?
Я чув, що коли багато специфікацій регресійної моделі (скажімо, в OLS) розглядаються як можливості для набору даних, це спричиняє багаторазові проблеми порівняння, а значення p та значення інтервалів вже не є надійними. Одним з крайніх прикладів цього є покрокова регресія. Коли я можу використовувати самі дані для уточнення моделі, а …

2
Як має сенс робити OLS після вибору змінної LASSO?
Нещодавно я виявив, що в літературі з прикладної економетрики, коли вирішуються проблеми вибору особливостей, не рідкість виконувати LASSO з наступною регресією OLS з використанням вибраних змінних. Мені було цікаво, як можна визначити обгрунтованість такої процедури. Чи це спричинить неприємності, такі як опущені змінні? Будь-які докази, що показують, що це ефективніше, …

2
Залишкові графіки: чому графік проти встановлених значень, а не спостережуваних значень
У контексті регресії OLS я розумію, що залишковий графік (проти встановлених значень) умовно розглядається для перевірки на постійну дисперсію та оцінки специфікації моделі. Чому залишки побудовані проти пристосувань, а не значень ? Чим інформація відрізняється від цих двох сюжетів?YYY Я працюю над моделлю, яка створила такі залишкові ділянки: Таким чином, …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.