Статистика та великі дані regression

2

ККТ проти необмеженої постановки регресії ласо

L1 пеналізована регресія (aka lasso) представлена у двох складах. Нехай обидві цілі функції Q1=12||Y−Xβ||22Q2=12||Y−Xβ||22+λ||β||1.Q1=12||Y−Xβ||22Q2=12||Y−Xβ||22+λ||β||1. Q_1 = \frac{1}{2}||Y - X\beta||_2^2 \\ Q_2 =\frac{1}{2}||Y - X\beta||_2^2 + \lambda ||\beta||_1. Тоді два різних рецептури - argminβQ1argminβQ1 \text{argmin}_\beta \; Q_1 умови ||β||1≤t,||β||1≤t, ||\beta||_1 \leq t, і, що еквівалентно argminβQ2.argminβQ2. \text{argmin}_\beta \; Q_2. Використовуючи умови …

20 regression lasso penalized

2

Кастинг багатоваріантної лінійної моделі у вигляді множинної регресії

Чи переробка багатовимірної лінійної регресійної моделі як множинної лінійної регресії цілком еквівалентна? Я не маю на увазі просто запуск ttt окремих регресій. Я читав це в декількох місцях (Байєсівський аналіз даних - Гельман та ін., І багатоваріантна стара школа - Марден), що багатоваріантну лінійну модель можна легко перемацати як багаторазову …

20 regression multiple-regression linear-model multivariate-regression

3

Як інтерпретувати коефіцієнти регресії, коли реакція трансформувалася 4-м коренем?

Я використовую четверту кореневу ( 1/4) потужність перетворення на моїй змінній реакції, як результат гетероскедастичності. Але зараз я не впевнений, як інтерпретувати свої коефіцієнти регресії. Я припускаю, що мені потрібно взяти коефіцієнти до четвертої потужності при зворотній трансформації (див. Нижче вихід регресії). Усі змінні є в одиницях долара в мільйонах, …

20 regression data-transformation

4

Справа з 0,1 значенням у бета-регресії

У мене є деякі дані в [0,1], які я хотів би проаналізувати за допомогою бета-регресії. Звичайно, щось потрібно зробити, щоб вмістити 0,1 значення. Мені не подобається змінювати дані, щоб відповідати моделі. також я не вірю, що інфляція нуля і 1 - це гарна ідея, тому що я вважаю, що в …

20 regression generalized-linear-model beta-distribution zero-inflation beta-regression

1

Обчислювальні інтервали прогнозування для логістичної регресії

Я хотів би зрозуміти, як генерувати інтервали прогнозування для логістичних регресійних оцінок. Мені порадили дотримуватися процедур у моделюванні бінарних даних Коллета, 2-е видання, с.98-99. Після впровадження цієї процедури та порівняння її з R predict.glm, я фактично думаю, що ця книга показує процедуру обчислення довірчих інтервалів , а не інтервалів прогнозування. …

20 r regression confidence-interval logistic prediction-interval

4

Короткий підсумок результатів “Великого p, малого n”

Чи може хтось вказати мені на опитувальний документ на тему "Великі , малі n " результати? Мене цікавить, як ця проблема проявляється в різних контекстах дослідження, наприклад, регресія, класифікація, тест Готелінга тощо .pppннn

20 regression classification multivariate-analysis

6

Коли випадати термін з регресійної моделі?

Чи може хтось порадити, якщо таке має сенс: Я маю справу зі звичайною лінійною моделлю з 4-ма предикторами. Я замислююся над тим, чи відмовитись від найменш значущого терміна. Це -значення трохи більше 0,05. Я стверджував на користь відмови від цього шляхом: Помноження оцінки цього терміна на (наприклад) міжквартирний діапазон вибіркових …

20 regression model-selection

2

Чим відрізняється біноміальна регресія від логістичної регресії?

Я завжди розглядав логістичну регресію як просто особливий випадок біноміальної регресії, де функцією зв'язку є логістична функція (замість, скажімо, пробіт-функції). Однак, якщо я прочитав відповіді на інше запитання , то, схоже, я може бути переплутаний, і між логістичною регресією та біноміальною регресією є логічна ланка. Яка різниця?

20 regression logistic binomial

6

Проста інтерпретація лінійної регресії

Я провів просту лінійну регресію природного журналу з двох змінних, щоб визначити, чи співвідносяться вони. Мій вихід такий: R^2 = 0.0893 slope = 0.851 p < 0.001 Я збентежений. Дивлячись на значення , я б сказав, що дві змінні не співвідносяться, оскільки це так близько до . Однак нахил лінії …

20 regression r-squared

4

Усереднення значень кореляції

Скажімо, я перевіряю, наскільки змінна Yзалежить від змінної Xв різних експериментальних умовах і отримую такий графік: Штрихові лінії на графіку вище представляють лінійну регресію для кожної серії даних (експериментальна установка), а цифри в легенді позначають співвідношення Пірсона кожного ряду даних. Я хотів би обчислити "середню кореляцію" (або "середню кореляцію") між …

20 regression correlation mean average

2

Оцінка R-квадратної та статистичної значущості за допомогою пеналізованої регресійної моделі

Я використовую пакет R штрафується отримати зморщені оцінки коефіцієнтів для набору даних , де у мене є багато провісників і мало знань, які з них мають важливе значення. Після того, як я вибрав параметри настройки L1 і L2, і я задоволений своїми коефіцієнтами, чи є статистично обгрунтований спосіб узагальнити підхід …

20 regression lasso stepwise-regression ridge-regression

4

Які правильні значення для точності та відкликання у кращих випадках?

Точність визначається як: p = true positives / (true positives + false positives) Чи правильно, що як true positivesі false positivesпідхід 0, точність наближається до 1? Те саме запитання для відкликання: r = true positives / (true positives + false negatives) Зараз я впроваджую статистичний тест, де мені потрібно обчислити …

20 precision-recall data-visualization logarithm references r networks data-visualization standard-deviation probability binomial negative-binomial r categorical-data aggregation plyr survival python regression r t-test bayesian logistic data-transformation confidence-interval t-test interpretation distributions data-visualization pca genetics r finance maximum probability standard-deviation probability r information-theory references computational-statistics computing references engineering-statistics t-test hypothesis-testing independence definition r censoring negative-binomial poisson-distribution variance mixed-model correlation intraclass-correlation aggregation interpretation effect-size hypothesis-testing goodness-of-fit normality-assumption small-sample distributions regression normality-assumption t-test anova confidence-interval z-statistic finance hypothesis-testing mean model-selection information-geometry bayesian frequentist terminology type-i-and-ii-errors cross-validation smoothing splines data-transformation normality-assumption variance-stabilizing r spss stata python correlation logistic logit link-function regression predictor pca factor-analysis r bayesian maximum-likelihood mcmc conditional-probability statistical-significance chi-squared proportion estimation error shrinkage application steins-phenomenon

5

Коли можна використовувати критерії, засновані на даних, для визначення моделі регресії?

Я чув, що коли багато специфікацій регресійної моделі (скажімо, в OLS) розглядаються як можливості для набору даних, це спричиняє багаторазові проблеми порівняння, а значення p та значення інтервалів вже не є надійними. Одним з крайніх прикладів цього є покрокова регресія. Коли я можу використовувати самі дані для уточнення моделі, а …

20 regression frequentist multiple-comparisons

2

Як має сенс робити OLS після вибору змінної LASSO?

Нещодавно я виявив, що в літературі з прикладної економетрики, коли вирішуються проблеми вибору особливостей, не рідкість виконувати LASSO з наступною регресією OLS з використанням вибраних змінних. Мені було цікаво, як можна визначити обгрунтованість такої процедури. Чи це спричинить неприємності, такі як опущені змінні? Будь-які докази, що показують, що це ефективніше, …

20 regression feature-selection econometrics least-squares lasso

2

Залишкові графіки: чому графік проти встановлених значень, а не спостережуваних значень

У контексті регресії OLS я розумію, що залишковий графік (проти встановлених значень) умовно розглядається для перевірки на постійну дисперсію та оцінки специфікації моделі. Чому залишки побудовані проти пристосувань, а не значень ? Чим інформація відрізняється від цих двох сюжетів?YYY Я працюю над моделлю, яка створила такі залишкові ділянки: Таким чином, …

20 regression residuals

Запитання з тегом «regression»