Запитання з тегом «fitting»

Процес прив’язки якоїсь статистичної моделі до певного набору даних. Здебільшого робиться на комп’ютері, використовуючи різні чисельні методи, такі як оптимізація чи числова інтеграція чи моделювання.

3
R: Випадковий ліс, який кидає NaN / Inf у помилці "виклику іноземної функції", незважаючи на відсутність набору даних NaN [закритий]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закрито 2 роки тому . Я використовую caret, щоб запустити перехрещений випадковий ліс над набором даних. Змінна Y - фактор. У моєму наборі даних немає NaN, Inf …

6
Встановити синусоїдальний термін до даних
Хоча я читаю цю публікацію, я все ще не маю уявлення, як застосувати це до власних даних і сподіваюся, що хтось може мені допомогти. У мене є такі дані: y <- c(11.622967, 12.006081, 11.760928, 12.246830, 12.052126, 12.346154, 12.039262, 12.362163, 12.009269, 11.260743, 10.950483, 10.522091, 9.346292, 7.014578, 6.981853, 7.197708, 7.035624, 6.785289, 7.134426, …
26 r  regression  fitting 

1
Виявлення залишків у даних підрахунку
У мене є те, що я наївно вважав проблемою досить прямої, яка передбачає виявлення зовнішньої кількості для багатьох різних наборів даних про підрахунок. Зокрема, я хочу визначити, чи одне або більше значень у ряді даних підрахунку є вищими чи нижчими, ніж очікувалося, щодо решти підрахунків у розподілі. Помилковий фактор полягає …

1
Коли доступний аналітичний якобіанець, чи краще наблизити гессея до , або по кінцевих відмінностях якобійців?
Скажімо, я обчислюю деякі параметри моделі, мінімізуючи суму залишків у квадраті, і я припускаю, що мої помилки є гауссовими. Моя модель виробляє аналітичні похідні, тому оптимізатору не потрібно використовувати кінцеві відмінності. Після завершення придатності я хочу обчислити стандартні похибки встановлених параметрів. Як правило, у цій ситуації гессіана функції помилки вважається …

1
MLE проти найменших квадратів у примірному розподілі ймовірностей
Враження, яке я склав, грунтуючись на кількох прочитаних нами працях, книгах та статтях, полягає в тому, що рекомендований спосіб встановлення розподілу ймовірностей на набір даних - це використання максимальної оцінки ймовірності (MLE). Однак, як фізик, більш інтуїтивно зрозумілим способом є просто пристосування pdf моделі до емпіричного pdf даних, використовуючи найменші …

2
Різниця між регресійним аналізом та підгоном кривої
Чи може хто-небудь, будь ласка, пояснити мені реальну різницю між регресійним аналізом та приміркою кривої (лінійною та нелінійною), якщо це можливо? Схоже, що обидва намагаються знайти залежність між двома змінними (залежною від незалежної), а потім визначити параметр (або коефіцієнт), пов'язаний із запропонованими моделями. Наприклад, якщо у мене є набір даних, …

3
Підгонка t-розподілу в R: параметр масштабування
Як мені підходять параметри t-розподілу, тобто параметри, що відповідають "середньому" та "стандартному відхиленню" нормального розподілу. Я припускаю, що їх називають "середніми" та "масштабуючими / ступенями свободи" для розподілу t? Наступний код часто призводить до помилок "оптимізації оптимізації". library(MASS) fitdistr(x, "t") Чи потрібно спочатку масштабувати х чи перетворювати на ймовірності? Як …

4
Точність машини для підвищення градієнта зменшується зі збільшенням кількості ітерацій
Я експериментую з алгоритмом машини для підвищення градієнта через caretпакет в Р. Використовуючи невеликий набір даних про вступ до коледжу, я застосував такий код: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

5
Чому лінійна регресія використовує функцію витрат, засновану на вертикальній відстані між гіпотезою та точкою вхідних даних?
Скажімо, у нас є вхідні (прогнозові) та вихідні (відгукові) точки даних A, B, C, D, E, і ми хочемо встановити рядок через точки. Це проста проблема, щоб проілюструвати це питання, але може бути поширена і на більш високі розміри. Постановка проблеми Поточна найкраща відповідність або гіпотеза представлена чорною лінією вище. …

3
Як я можу програмно виявити сегменти серії даних, щоб вони відповідали різним кривим?
Чи існують якісь задокументовані алгоритми для розділення розділів даного набору даних на різні криві, що найкраще підходять? Наприклад, більшість людей, які дивляться на цю діаграму даних, легко поділяють її на 3 частини: синусоїдальний сегмент, лінійний сегмент і зворотний експоненціальний сегмент. Насправді я зробив саме це з синусоїдою, лінією та простою …

3
Чи можна використовувати тест Колмогорова-Смірнова та оцінити параметри розподілу?
Я читав, що тест Колмогорова-Смірнова не слід використовувати для перевірки правильності придатності розподілу, параметри якого були оцінені зразком. Чи є сенс розділити мою вибірку надвоє і використовувати першу половину для оцінки параметрів, а другу для KS-тесту? Спасибі заздалегідь

1
Як мінімізувати залишкову суму квадратів експоненціальної підгонки?
У мене є такі дані, і я хотів би до неї вкласти модель негативного експоненціального зростання: Days <- c( 1,5,12,16,22,27,36,43) Emissions <- c( 936.76, 1458.68, 1787.23, 1840.04, 1928.97, 1963.63, 1965.37, 1985.71) plot(Days, Emissions) fit <- nls(Emissions ~ a* (1-exp(-b*Days)), start = list(a = 2000, b = 0.55)) curve((y = 1882 …

3
Як я можу прилаштувати сплайн до даних, що містять значення та 1/2 похідні?
У мене є набір даних, який містить, скажімо, деякі вимірювання положення, швидкості та прискорення. Усі походять із одного і того ж «бігу». Я міг би побудувати лінійну систему і помістити поліном на всі ці вимірювання. Але чи можу я те ж саме зробити зі сплайнами? Який "R" спосіб зробити це? …

1
Чому середнє арифметичне менше, ніж середнє значення розподілу, у звичайному нормальному розподілі?
Отже, у мене є випадковий процес генерування лог-нормально розподілених випадкових величин . Ось відповідна функція щільності ймовірності:XXX Я хотів оцінити розподіл на кілька моментів того початкового розподілу, скажімо, 1-й момент: середнє арифметичне. Для цього я намалював 10000 випадкових змінних 10000 разів, щоб я міг обчислити 10000 оцінку середнього арифметичного. Є …

2
ARIMA проти ARMA на різницевій серії
У R (2.15.2) я встановив один раз ARIMA (3,1,3) на часовій серії та один раз ARMA (3,3) на колись різнилися часові серії. Встановлені параметри відрізняються, що я відніс до методу підгонки в ARIMA. Крім того, встановлення ARIMA (3,0,3) на ті ж дані, що й ARMA (3,3), не призведе до однакових …
13 r  time-series  arima  fitting  arma 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.