У мене є чотири числові змінні. Усі вони є мірами якості ґрунту. Чим вище змінна, тим вище якість. Діапазон для всіх них різний:
Var1 від 1 до 10
Var2 від 1000 до 2000
Var3 від 150 до 300
Var4 від 0 до 5
Мені потрібно поєднати чотири змінні в єдиний показник якості ґрунту, який буде успішно класифікувати порядок.
Моя ідея дуже проста. Стандартизуйте всі чотири змінні, підсумуйте їх, і все, що ви отримаєте, - це оцінка, яка повинна бути упорядкована. Чи бачите ви якусь проблему із застосуванням цього підходу. Чи є якийсь інший (кращий) підхід, який ви б рекомендували?
Спасибі
Редагувати:
Дякую, хлопці. Багато дискусій пішло у "доменну експертизу" ... Сільське господарство ... Тоді як я очікував більше статистичних розмов. З точки зору техніки, яку я буду використовувати ... Це, мабуть, буде просте підсумовування z-балів + логістична регресія як експеримент. Оскільки переважна більшість зразків має низьку якість 90%, я збираюся об'єднати 3 категорії якості в одну і в основному маю бінарну проблему (деяка якість та відсутність якості). Я убиваю двох птахів одним каменем. Я збільшую вибірку з точки зору частоти подій і використовую експертів, отримуючи їх для класифікації моїх зразків. Експертні класифіковані зразки будуть потім використані для підгонки моделі журналу reg, щоб максимально збільшити рівень узгодження / розбіжності з експертами .... Як це звучить для вас?