Запитання з тегом «model»

Формалізація зв'язків між стохастично (випадковим чином) пов'язаними змінними у вигляді математичних рівнянь. НЕ ВИКОРИСТОВУЙТЕ ЦІЙ МЕТИ САМО: завжди включайте більш конкретний.

1
Різниця між моделлю перехоплення або без неї в логістичній регресії
Мені подобається розуміти різницю між моделлю перехоплення або без неї в логістичній регресії Чи є різниця між ними, за винятком того, що коефіцієнти перехоплення відносять до журналу (коефіцієнта шансів) відносно базової групи і без перехоплення вони розглядають журнал (шанси)? з того, що я бачив, коефіцієнти однакові в обох випадках, але …

3
Як я можу прилаштувати сплайн до даних, що містять значення та 1/2 похідні?
У мене є набір даних, який містить, скажімо, деякі вимірювання положення, швидкості та прискорення. Усі походять із одного і того ж «бігу». Я міг би побудувати лінійну систему і помістити поліном на всі ці вимірювання. Але чи можу я те ж саме зробити зі сплайнами? Який "R" спосіб зробити це? …

3
Визначення та розмежування регресійної моделі
Збентежуюче просте запитання - але, схоже, його раніше не було поставлено на перехресну перевірку: Що таке визначення регресійної моделі? Також питання підтримки, Що не є регресійною моделлю? Що стосується останнього, мене цікавлять хитрі приклади, коли відповідь не відразу очевидна, наприклад, ARIMA або GARCH.

1
Аддитивна помилка або мультиплікативна помилка?
Я порівняно новачок у статистиці і буду вдячний допомогти зрозуміти це краще. У моєму полі є поширена модель форми: Pt=Po(Vt)αPt=Po(Vt)αP_t = P_o(V_t)^\alpha Коли люди підходять моделі до даних, вони зазвичай лінеаризують її та відповідають наступному log(Pt)=log(Po)+αlog(Vt)+ϵlog⁡(Pt)=log⁡(Po)+αlog⁡(Vt)+ϵ\log(P_t) = \log(P_o) + \alpha \log(V_t) + \epsilon Чи це добре? Я десь читав, що …

1
Геометрична інтерпретація узагальненої лінійної моделі
Для лінійної моделі , ми можемо мати хорошу геометричну інтерпретацію розрахункової моделі з допомогою МНК: у = х & beta ; + е . У є проекцією у на простір , натягнуте на х і залишкової е перпендикулярна це простір , натягнуте на х.у= x β+ еy=xβ+ey=x\beta+eу^= x β^+ е^y^=xβ^+e^\hat{y}=x\hat{\beta}+\hat{e}у^y^\hat{y}е^e^\hat{e} …

1
Чи є норма MLE асимптотично нормальною та ефективною, навіть якщо модель не відповідає дійсності?
Приміщення: це може бути дурним питанням. Я знаю лише твердження про асимптотичні властивості MLE, але я ніколи не вивчав докази. Якби я це зробив, можливо, я б не задавав цих питань, або, можливо, я зрозумів би, що ці питання не мають сенсу ... тому, будь ласка, просто на мене :) …

4
Зрозуміло, що проблема добре підходить для лінійної регресії
Я вивчаю лінійну регресію, використовуючи Вступ до лінійного регресійного аналізу Монтгомері, Пека та Вінінга . Я хотів би вибрати проект аналізу даних. Я наївно вважаю, що лінійна регресія підходить лише тоді, коли можна підозрювати, що між пояснювальними змінними та змінною відповіді існують лінійні функціональні зв'язки. Але, здається, не багато додатків …

5
Як виконати імпутацію значень у дуже великій кількості точок даних?
У мене дуже великий набір даних, і близько 5% випадкових значень відсутні. Ці змінні співвідносяться між собою. Наступний приклад набору даних R - це лише іграшковий приклад з манекено-корельованими даними. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

3
Які приклади реального життя "непараметричних статистичних моделей"?
Я читаю тут статтю Вікіпедії про статистичні моделі , і я дещо здивований щодо значення "непараметричних статистичних моделей", зокрема: Статистична модель є непараметричною, якщо набір параметрів нескінченно розмірний. Статистична модель є напівпараметричною, якщо вона має як кінцеві, так і нескінченномірні параметри. Формально, якщо - розмірність а - кількість зразків, і …

2
Оцініть швидкість, за якою важить стандартне відхилення за допомогою незалежної змінної
У мене є експеримент, в якому я здійснюю вимірювання нормально розподіленої змінної ,YYY Y∼N(μ,σ)Y∼N(μ,σ)Y \sim N(\mu,\sigma) Однак попередні експерименти дали деякі докази того, що стандартне відхиленняσσ\sigma є афінною функцією незалежної змінної XXX , тобто σ=a|X|+bσ=a|X|+b\sigma = a|X| + b Y∼N(μ,a|X|+b)Y∼N(μ,a|X|+b)Y \sim N(\mu,a|X| + b) Я хотів би оцінити параметри і …

7
Уникнення соціальної дискримінації в побудові моделей
У мене є запитання, натхнені нещодавним скандалом з призовом на роботу в Амазонії, де їх звинувачували в дискримінації жінок у процесі прийняття на роботу. Більше інформації тут : Фахівці з машинного навчання Amazon.com Inc виявили велику проблему: їх новий рекрутинг не сподобався жінкам. Команда будувала комп’ютерні програми з 2014 року …

1
Чи є якийсь "стандарт" для позначення статистичної моделі?
Наприклад, у посібнику про BUGS або в майбутній книзі Лі та Вагенмакерс ( pdf ) та в багатьох інших місцях використовується тип позначень, що мені здається дуже гнучким, оскільки він може бути використаний для короткого опису більшості статистичних моделей. Прикладом цього позначення є наступне: уi∼ Двозначні ( сi, нi)журнал( сi1 …

6
Гнучкі та негнучкі моделі в машинному навчанні
Я зіткнувся з простим питанням щодо порівняння гнучких моделей (тобто сплайнів) та негнучких моделей (наприклад, лінійної регресії) за різних сценаріїв. Питання: Загалом, чи очікуємо, чи ефективність гнучких методів статистичного навчання може бути кращою чи гіршою, ніж негнучка методика, коли: Кількість предикторів надзвичайно велика, а кількість спостережень невелика? нpppнnn Дисперсія термінів …

3
Як отримати інтервал довіри щодо зміни r-квадрата населення
Для простого прикладу припустимо, що існує дві моделі лінійної регресії Модель 1 має три провісники, x1a, x2b, іx2c Модель 2 має три предиктори з моделі 1 та два додаткові прогнози x2aтаx2b Існує рівняння регресії чисельності населення, де пояснюється дисперсія популяції для Моделі 1 та для Моделі 2. Інкрементальна дисперсія, пояснена …

3
Звідки взявся термін «вивчити модель»
Часто я чув, як шахтарі даних тут використовують цей термін. Як статистик, який працював над проблемами класифікації, я знайомий з терміном "навчити класифікатора", і я припускаю, що "вивчити модель" означає те саме. Я не проти терміна "тренуйте класифікатора". Це, здається, відображає ідею підгонки моделі, оскільки навчальні дані використовуються для отримання …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.