Коротка відповідь на ваше запитання полягає в тому, що "більшість часу ми не знаємо, що таке Р (сир), і його часто (відносно) важко обчислити".
Більш довга відповідь, чому правило / теорема Байєса, як правило, викладено так, як ви написали, тому що в байесівських проблемах у нас - сидячи на колінах - попередній розподіл (P (B) вище) та ймовірність (P (A | B), P (A | notB) вище), і обчислити задню (P (B | A)) порівняно просто. Проблема з повторним вираженням P (A) в узагальненому вигляді - це зусилля, які можна витратити в іншому місці.
Це може здатися не таким складним у контексті електронного листа, оскільки, як ви правильно зазначали, це просто P (сир), правда? Проблема полягає в тому, що при більш задіяних байєсівських проблемах на полі бою знаменник є непривабливим інтегралом, який може мати або не мати рішення закритої форми. Насправді іноді нам потрібні складні методи Монте-Карло лише для наближення інтеграл, а числення чисел може бути справжнім болем у тилу.
Але до речі, нас зазвичай навіть не хвилює, що таке P (сир). Майте на увазі, ми намагаємося відточити нашу думку щодо того, чи є електронний лист спамом чи ні , і ми не можемо менше дбати про граничний розподіл даних (P (A) вище). Це все одно лише константа нормалізації, яка не залежить від параметра; акт підсумовування вимиває будь-яку інформацію, яку ми мали про параметр. Константа - це неприємність для обчислення, і в кінцевому рахунку не має значення, коли мова йде про занулення наших переконань щодо того, спам електронної пошти чи ні. Іноді ми зобов’язані його обчислити, і в цьому випадку найшвидший спосіб це зробити з інформацією, яку ми вже маємо: попередньою та ймовірною.