Проблема стосується побудови дерев рішень. Згідно з Вікіпедією, « коефіцієнт Джіні » не слід плутати з « домішкою Джині ». Однак обидва заходи можуть бути використані при складанні дерева рішень - вони можуть підтримувати наш вибір при розділенні набору елементів.
1) "домішка Джині" - це стандартна метрика поділу дерева рішень (див. За посиланням вище);
2) "Коефіцієнт Джині" - кожне розщеплення може бути оцінене на основі критерію AUC. Для кожного сценарію розщеплення ми можемо побудувати криву ROC та обчислити показник AUC. За Вікіпедією AUC = (GiniCoeff + 1) / 2;
Питання: чи обидва ці заходи рівнозначні? З одного боку, мені відомо, що коефіцієнт Джіні не слід плутати з домішкою Джині. З іншого боку, обидва ці заходи можуть бути використані, якщо робити одне і те ж - оцінювати якість розбиття дерева рішень.