Порівняння коефіцієнтів регресії однієї моделі в різних наборах даних


12

Я оцінюю два (2) холодоагенти (гази), які використовувалися в одній і тій же системі охолодження. Я маю дані про насичену температуру всмоктування ( ), температуру конденсації ( ) та ампераж ( ) для оцінки. Є два (2) набори даних; 1-й холодоагент ( ) та 2-й холодоагент ( ). Я використовую лінійну, багатоваріантну ( & ) поліноміальну модель 3-го порядку для регресійних аналізів. Я хотів би визначити, наскільки менше / більше амперажу (або, якийсь подібний показник як порівняння продуктивності) у середньому, у відсотках, черпає другий холодоагент.D Y R 1 R 2 S DSDYR1R2SD

Перша моя думка:

  1. Визначте модель для використання:Y=b0+b1S+b2D+b3SD+b4S2+b5D2+b6S2D+b7D2S+b8D3+b9S3
  2. Вивести коефіцієнти ( ) з базових даних ( ).R 1biR1
  3. Використовуючи ці коефіцієнти, для кожного & у наборі даних обчислюють кожен очікуваний розігрів підсилювача ( ), а потім середнє значення.D R 2 YSDR2Y^
  4. Порівняйте середню фактичну середню жеребкування підсилювача ( ) з даних. Y2R2Y^Y2R2
  5. percent (%) change=(Y2Y^)/Y^

Однак, оскільки другий холодоагент має незначні теплові властивості і в систему охолодження були внесені невеликі зміни (регулювання TXV та перегріву), я не вважаю, що цей «метод порівняння базової лінії» є точним.

Наступною моєю думкою було зробити два (2) окремих регресійних аналізу:

Y1=a0+a1S1+a2D1+a3S1D1+a4S12+a5D12+a6S12D1+a7D12S1+a8D13+a9S13Y2=b0+b1S2+b2D2+b3S2D2+b4S22+b5D22+b6S22D2+b7D22S2+b8D23+b9S23

а потім для насиченої температури всмоктування ( ) порівняйте коефіцієнти ( проти ) так: a 1 b 1 % зміна = b 1 - a 1Sa1b1

% change=b1a1a1

Однак, знову ж таки, ці коефіцієнти слід зважувати по-різному. Тому результати будуть перекошені.

Я вважаю, що міг би використати z-тест, щоб визначити, наскільки по-різному зважені коефіцієнти, але я не впевнений, що я повністю розумію значення результату: . Але це все одно не дасть мені показників ефективності, що є загальною метою.z=(a1b1)/SEa12+SEb12)


1
1. Поліноміальна модель - лінійна модель, оскільки вона є лінійною в коефіцієнті. 2. Я намагаюся зрозуміти ваше запитання. Якщо холодильна система була змінена між часом R1 і R2, то вони насправді не є "тією ж системою охолодження" (рядок 1), правда? 3. Чому саме у вашому другому підході ви почали порівнювати коефіцієнти S? 4. Чи плануєте ви ввести в поліноміальну форму приладу коваріантні «холодоагенти» з рівнями R1 і R2 (можливо, при взаємодії)? Його коефіцієнт може відповісти на питання.
qoheleth

@qoheleth 1. Не впевнений, що я дотримуюся твоєї думки ... Коефіцієнт завжди лінійний - це число. Коли коефіцієнт тоді не був лінійним? 2. Правильно, охолоджувальна система була ПОЛУЧЕНО змінена, але лише для того, щоб забезпечити однакову температуру на виході для обох холодоагентів - "яблука до яблук". 3. 'S' є єдиною змінною, яка становить інтерес для цього конкретного порівняння. 4. Я читав про метод змінної коефіцієнта / взаємодію, але не розумію значення коефіцієнтів, використовуючи такий метод. Чи можете ви детальніше розтлумачити вихід? Дякую.
gth826a

1. Зі статистичної точки зору, лінійність у оцінках, що ви оцінюєте, - це те, що рахується, тому поліноміальна модель є лінійною. Прикладом нелінійної моделі може бути функція mitscherlich y = alpha (1-exp (beta-lambda * X)), де альфа / бета / лямбда - те, що ми оцінюємо. 3. Що ти насправді намагаєшся перевірити? це коефіцієнт S? або Y? Якщо це S, чому ваша перша спроба порівняння в \ hat {Y}?
qoheleth

Y-hat буде: фактична НДД з 2-го набору даних, що використовується з коефіцієнтами, отриманими з 1-го набору даних. Цей метод є загальним для аналізу енергії "Договір про ефективність", коли порівнюється витрата енергії попереднього обладнання з витратою енергії після вдосконалення / реконструкції / оновлення / тощо. Рівнянням буде: споживання енергії = y-hat = базове навантаження + енергія / градус-день * градус-дні ... де енергія / градус-день є коефіцієнтом, отриманим з базового регресійного аналізу, а градусні дні - після оновлення . "Що б ти спожив", якби ти не робив цей сценарій проекту ...
gth826a

1
Отже, здається, що в кінцевому рахунку ви хочете порівняти Y. Я б сказав, забудьте про обчислення% зміни коефіцієнтів, за наявності вищих строків порядку (S ^ 2, S ^ 3 тощо), коефіцієнти - це не те, що ви думаєте вони є. Зосередьтеся на Y. Питання, що для мене залишається незрозумілим, - ви говорите, що S&D в R2 означає різні речі для S&D в R1? Якщо ні, то ви можете просто приставити одну модель до комбінованого набору даних із додатковим коваріатом (змінна X), який називається холодоагентом (r1 або r2), і подивитися на його коефіцієнт, щоб зробити висновок, вважаючи, що ваша модель є адекватною.
qoheleth

Відповіді:


2

Із закону ідеального газу тут , , припускаючи пропорційну модель. Переконайтесь, що у ваших одиницях абсолютна температура. Прохання про пропорційний результат означало б модель пропорційної помилки. Розглянемо, можливо, , тоді для множинної лінійної регресії можна використовувати , приймаючи логарифми значень Y, D і S, так що це виглядає як , де підписки означають "логарифм". Тепер це може працювати краще, ніж використовувана лінійна модель, і відповіді мають відносний тип помилки.PV=nRTY=aDbScln(Y)=ln(a)+bln(D)+cln(S)Yl=al+bDl+cSll

Щоб перевірити, який тип моделі використовувати, спробуйте використати та перевірити, чи є залишки однорідними. Якщо їх немає, то у вас є упереджена модель , тоді зробіть щось інше, як моделювати логарифми, як вище, один або кілька зворотних даних даних x або y, квадратні корені, квадрати, експоненцію тощо, поки залишки не стануть однорідними. Якщо модель не може отримати гомосептичні залишки, тоді використовуйте багатолінійну лінійну регресію Тейла, при необхідності цензуру.

Наскільки нормально розподіляються дані по осі y, не потрібно, однак, люди, що переживають, часто і часто можуть спотворювати результати параметрів регресії. Якщо гомоскедастичності неможливо знайти, тоді не слід застосовувати звичайні найменші квадрати, і потрібно виконувати якийсь інший тип регресії, наприклад, зважена регресія, регресія Теля, найменші квадрати в x, регресія Демінга тощо. Також помилки не слід послідовно корелювати.

Значення виводу: , може бути, а може і не бути відповідні. Це передбачає, що загальна дисперсія є сумою двох незалежних дисперсій. Іншим чином, незалежність - це ортогональність (перпендикулярність) на ділянці. Тобто, повна мінливість (дисперсія) потім слідує теоремі Піфагора, , що може бути, а може і не бути випадком для ваших даних. Якщо це так, то -статистика - відносна відстань, тобто різниця засобів (відстань), поділена на піфагорійський, вектор AKA, додавання стандартної помилки (SE), на яку поділяються стандартні відхилення (SD) відz=(a1b1)/SEa12+SEb12)x,yH=+A2+O2zN, де СЕ - самі відстані. Розділення однієї відстані на інше потім нормалізує їх, тобто різницю засобів, розділену на загальну (стандартну) похибку, яка потім знаходиться у формі, щоб можна було застосувати ND (0,1), щоб знайти ймовірність.

Тепер, що станеться, якщо заходи не є незалежними, і як можна перевірити їх? Ви можете пам’ятати з геометрії, що трикутники, які не мають прямого кута, додають їх сторони як , якщо ні оновити пам’ять тут . Тобто, коли між осями є щось інше, ніж кут 90 градусів, ми повинні включати, який саме кут при обчисленні загальної відстані. Спочатку пригадайте, що таке кореляція, стандартизована коваріація. Це для загальної відстані та кореляції стаєσ T ρ A , B σ 2 T = σ 2 A + σ 2 B - 2 σ A σ B ρ A , БC2=A2+B22ABcos(θ),θ=(A,B)σTρA,BσT2=σA2+σB22σAσBρA,B. Іншими словами, якщо ваші стандартні відхилення співвідносяться (наприклад, попарно), вони не є незалежними.


"Щоб перевірити, який тип моделі використовувати, спробуйте використати та перевірити, чи є залишки гомосептичними", так, впевнено ... за винятком того, що ви взагалі не робите цього припущення, і навіть якщо воно дійсне - це жодним чином не гарантує, що у вас є "хороша" модель.
Репмат

Якщо використовується OLS, а залишки є гетероскедастичними, то, безумовно, є упереджена модель. Гомоседастичність - це вимога OLS, показана тут . Щоб мати хорошу модель, потрібні інші умови, наприклад, уникнення упущених змінних зміщення , але наявність послідовних некорельованих помилок та лінійність моделі проти залежної змінної.
Карл

Ви можете мати об'єктивну та / або послідовну модель (оцінки), де залишки гетеросклестичні. Це означає лише, що звичайні умовиводи не працюють
Repmat

Гетероседастичність згладжує схил, навіть якщо сторонній виправити це, штраф буде великими довірчими інтервалами і невдалою моделлю. Не використовували б таку модель, але, так, можна зробити в'ялі моделі. Медична література їх рясніє.
Карл

Перша частина вашого коментаря - це просто неправильно. Я навіть не впевнений, що це означає.
Репмат
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.