Бінарну змінну зі значеннями 0, 1 можна (як правило) масштабувати до (значення - середнє значення) / SD, що, імовірно, є вашим z-балом.
Найбільш очевидне обмеження в цьому полягає в тому, що якщо у вас трапляються всі нулі або всі, то підключення до SD сліпо означатиме, що z-оцінка невизначена. Існує випадок присвоєння нулю також у тій мірі, коли значення - середнє значення є однаково нулем. Але багато статистичних речей не матиме особливого сенсу, якщо змінна дійсно є постійною. Однак у більш загальному випадку, якщо рівень SD невеликий, існує більший ризик того, що бали нестабільні та / або недостатньо визначені.
Проблема в тому, щоб дати кращу відповідь на ваше запитання, полягає саме в тому, який «алгоритм машинного навчання» ви розглядаєте. Це здається, що це алгоритм, який поєднує дані для декількох змінних, і тому зазвичай має сенс подавати їх у подібних масштабах.
(ПІСНЕ) Оскільки оригінальний плакат додає коментарі по черзі, їх питання стає перетворюючим. Я все ще вважаю, що (значення - середнє значення) / SD має сенс (тобто не є безглуздим) для бінарних змінних до тих пір, поки SD є позитивним. Однак пізніше логістична регресія була названа як додаток, і для цього немає ніякого теоретичного або практичного прибутку (і справді певної втрати простоти) нічого, крім подачі у бінарні змінні, як 0, 1. Ваше програмне забезпечення повинно бути в змозі добре впоратися з що; якщо ні, відмовтесь від цього програмного забезпечення на користь програми, яка може. З точки зору заголовкового питання: може, так; повинен, ні.