Відповіді:
Як я виявив у Вступі до обміну даними від Tan et. al:
Дослідження показали, що вибір міри домішки мало впливає на продуктивність алгоритмів індукції дерева рішень. Це тому, що багато заходів з домішками цілком відповідають один одному [...]. Дійсно, стратегія, що використовується для обрізки дерева, має більший вплив на остаточне дерево, ніж вибір міри домішки.
Тому ви можете використовувати індекс Джині, наприклад, CART або Entropy, як C4.5.
Я б використав Entropy, точніше коефіцієнт коефіцієнта посилення C4.5, оскільки ви можете легко дотримуватися добре написаної книги Quinlan: Програми C4.5 для машинного навчання.