Поперечна ентропія ідентична дивергенції KL плюс ентропії розподілу цілі. KL дорівнює нулю, коли два розподіли однакові, що здається мені більш інтуїтивним, ніж ентропія цільового розподілу, що є перехресною ентропією на збігу.
Я не кажу, що в одній іншій інформації більше, за винятком того, що людський погляд може виявити нуль більш інтуїтивним, ніж позитивний. Звичайно, зазвичай використовується метод оцінювання, щоб реально побачити, наскільки добре відбувається класифікація. Але чи є вибір перехресної ентропії над KL історичним?