Чи може хто-небудь, будь ласка, пояснити мені реальну різницю між регресійним аналізом та приміркою кривої (лінійною та нелінійною), якщо це можливо?
Схоже, що обидва намагаються знайти залежність між двома змінними (залежною від незалежної), а потім визначити параметр (або коефіцієнт), пов'язаний із запропонованими моделями. Наприклад, якщо у мене є набір даних, таких як:
Y = [1.000 1.000 1.000 0.961 0.884 0.000]
X = [1.000 0.063 0.031 0.012 0.005 0.000]
Чи може хтось запропонувати формулу кореляції між цими двома змінними? У мене виникають труднощі в розумінні різниці між цими двома підходами. Якщо ви віддаєте перевагу підтримувати свою відповідь іншими наборами даних, це нормально, оскільки це здається важким (можливо, лише для мене).
Вищенаведений набір даних представляє осі і y кривої робочої характеристики приймача (ROC), де y - справжня позитивна швидкість (TPR), а x - хибнопозитивна швидкість (FPR).
Я намагаюся підходити до кривої або роблю регресійний аналіз, згідно з моїм оригінальним запитанням, ще не впевнений, серед цих пунктів можна оцінити TPR для будь-якого конкретного FPR (або навпаки).
По-перше, чи є науково прийнятним знайти таку функцію прилягання кривої між двома незалежними змінними (TPR та FPR)?
По-друге, чи є науково прийнятним знайти таку функцію, якщо я знаю, що розподіли фактичних негативних та фактичних позитивних випадків не є нормальними?