whuber сказав вам у коментарях, що кодування 0-3 або 1-4 кодування замість створення фіктивних змінних - це не те, що ви хочете. Це спробу - я сподіваюся пояснити, що ви зробили б із цією моделлю і чому це неправильно.
Якщо ви кодуєте змінну X таким, що якщо A, то X = 1, якщо B, то X = 2, якщо C, то X = 3, якщо D, то X = 4, тоді, коли ви робите регресію, ви отримаєте лише один параметр. Скажімо, що в кінцевому підсумку було так, що розрахунковий параметр, пов'язаний з X, був 2. Це дозволить вам сказати, що очікувана різниця між середнім значенням B і середнім значенням A дорівнює 2. Це також говорить вам, що очікувана різниця між середнім значенням C а середнє значення B - 2. Деякі для D і C. Ви б змусили різниці в засобах для цих груп слідувати цій дуже суворій схемі. Цей один параметр вказує вам, як усі засоби вашої групи відносяться один до одного.
Отже, якщо ви робили такий вид кодування, вам потрібно буде припустити, що ви не лише отримали правильне впорядкування (адже в цьому випадку, якщо ви очікуєте збільшення від A до B, тоді вам слід очікувати збільшення від B до C і від C до D), але ви також повинні припустити, що ця різниця однакова!
Якщо замість цього ви робите фіктивне кодування, яке було запропоновано, ви дозволяєте кожній групі мати власне значення - ніяких обмежень. Ця модель набагато розумніша і відповідає на потрібні питання.