статистичний тест, щоб перевірити, чи відносини лінійні чи нелінійні


9

У мене є приклад набору даних таким чином:

Volume <- seq(1,20,0.1)
var1 <- 100 
x2 <- 1000000
x3 <- 30

x4 = sqrt(x2/pi)
H = x3 - Volume
r = (x4*H)/(H + Volume)

Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r))

Power <- jitter(Power, factor = 1, amount = 0.1)
plot(Volume,Power)

введіть тут опис зображення

З рисунка можна припустити, що між певним діапазоном "Гучність" та "Потужність" співвідношення є лінійним, тоді, коли "Об'єм" стає відносно малим, відношення стає нелінійним. Чи є статистичний тест для ілюстрації цього?

Що стосується деяких рекомендацій, наведених у відповідях на ОП:

Приклад, показаний тут, є просто прикладом, набір даних у мене схожий на взаємозв'язок, що бачиться тут, хоча галасливіше. Проведений нами аналіз показує, що коли я аналізую об'єм конкретної рідини, потужність сигналу різко зростає при низькому гучності. Так, скажімо, у мене було лише середовище, де обсяг був між 15 і 20, це мало б виглядати як лінійне співвідношення. Однак, збільшуючи діапазон точок, тобто маючи менші обсяги, ми бачимо, що взаємозв'язок взагалі не є лінійним. Зараз я шукаю статистичні поради щодо того, як це статистично показати. Сподіваюся, це має сенс.


5
Тут відбувається кілька речей. По-перше, звичайно зв'язок буде виглядати лінійно за умови відповідного обмеження діапазонів змінних. По-друге, гетероседастичність даних є майже такою ж характерною рисою, як і нелінійне співвідношення: розсіювання більший при великих обсягах і малих потужностях, ніж при малих обсягах і великих потужностях. Незалежно від того, що саме ви хочете протестувати? Лінійність відносин у всьому діапазоні?
whuber

4
Власне, я хотів би повернути зауваження про гетероседастичність: сюжет надає вигляду таких, але це ілюзія, спричинена відносно крутими схилами при менших обсягах. (Однак, об'єм з точки зору потужності має надзвичайно гетероскедастичний зв'язок.) Як тільки ми визначимо, що зміна потужності не є гетероседастичною, це виключає деякі види аналізів (ми б не хотіли застосовувати нелінійні перетворення сили) і пропонує надаючи перевагу іншим (наприклад, нелінійні найменші квадрати або узагальнена лінійна модель), як тільки нелінійність буде чітко встановлена.
whuber

Зараз я додав короткий опис проблеми, що знаходиться в нашій країні. Дякуємо за ваші коментарі до цих пір, вони дуже вдячні і допомагають мені розглянути проблему.
KatyB

Чому б не перевірити на квадратичний ефект?
AdamO

2
@Simon Я не використовував жодного тесту, але все-таки ви можете побачити, що це гомосептично, побудувавши типовий розмір залишків проти гучності. Ось деякий Rкод: plot(s <- by(cbind(Power, Volume), groups <- cut(Volume, 10), function(d) summary(lm(Power ~ Volume, data=d))$sigma), xlab="Volume range", ylab="Residual SD", ylim=c(0, max(s))); abline(h=mean(s), lty=2, col="Blue"). Він показує майже постійний залишковий розмір у всьому діапазоні.
whuber

Відповіді:


4

Це в основному проблема вибору моделі. Я закликаю вас обрати набір фізично правдоподібних моделей (лінійних, експоненціальних, можливо, розривних лінійних відносин) і використовувати інформаційний критерій Akaike або Баєсовий інформаційний критерій для вибору найкращого - маючи на увазі питання гетероседастичності, на яке вказує @whuber.


2

Ви спробували це гуглити !? Один із способів зробити це - встановити більшу потужність або інші нелінійні умови до вашої моделі та перевірити, чи їх коефіцієнти значно відрізняються від 0.

Тут є кілька прикладів http://www.albany.edu/~po467/EPI553/Fall_2006/regression_assumptions.pdf

У вашому випадку ви, можливо, захочете розділити набір даних на два розділи, щоб перевірити нелінійність для обсягу <5 та лінійності для гучності> 5.

Іншою проблемою є те, що ваші дані гетерокедастичні, що порушує припущення щодо нормальності регресійних даних. Надане посилання також дає приклади тестування на це.


Посилання розірвано.
Ятин

2

Я пропоную використовувати нелінійну регресію, щоб відповідати одній моделі всім вашим даним. Який сенс підбирати довільний об'єм і пристосовувати одну модель до об'ємів менше, а іншу модель для більших обсягів? Чи є якась причина, поза зовнішнім виглядом фігури, використання 5 як різкого порогу? Ви справді вірите, що ідеальний кривий після конкретного порогу гучності лінійний? Чи не є більшою ймовірністю, що вона наближається до горизонталі зі збільшенням гучності, але ніколи не буває досить лінійною?

Звичайно, вибір інструмента аналізу повинен залежати від того, на які наукові питання ви намагаєтесь відповісти, та від ваших попередніх знань про систему.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.