Один із пов’язаних публікацій вище натякає на використання тесту на коефіцієнт ймовірності, хоча ваші моделі повинні бути вкладені одна в одну, щоб це працювало (тобто всі параметри в одній із моделей повинні бути присутніми в тій моделі, на яку ви її тестуєте) .
RMSE - це явно міра того, наскільки добре модель відповідає даних. Однак таке співвідношення ймовірності. Ймовірність для даної людини, кажуть місіс Чен, - це ймовірність того, що людина з усіма її параметрами мала результат. Спільна ймовірність набору даних - це ймовірність місіс Чен * ймовірність місіс Гундерсен * ймовірність місіс Джонсон * ... і т.д.
Додавання коваріату або будь-якої кількості коваріатів насправді не може погіршити коефіцієнт ймовірності, я не думаю. Але це може покращити коефіцієнт ймовірності на незначну суму. Моделі, які краще підходять, матимуть більшу ймовірність. Ви можете офіційно перевірити, чи краще модель A підходить до моделі B. Ви повинні мати якусь функцію тестування LR, доступну для будь-якого програмного забезпечення, яке ви використовуєте, але в основному статистика тесту LR становить -2 * різниця журналів ймовірностей, і він розподіляється chi-square з df = різниця в кількості параметрів.
Крім того, можна порівняти AIC або BIC двох моделей та знайти найнижчу. AIC і BIC - це, по суті, ймовірність журналу, що накладається на певні параметри.
Я не впевнений у використанні t-тесту для RMSE, і я б насправді схилявся до нього, якщо ви не зможете знайти якусь теоретичну роботу, яка була зроблена в цьому районі. В основному, чи знаєте ви, як значення RMSE розподіляються асимптотично? Я не впевнений. Деякі подальші дискусії тут:
http://www.stata.com/statalist/archive/2012-11/index.html#01017