У PRML-книзі Бішопа він говорить, що надмірне оснащення - це проблема з максимальною оцінкою ймовірності (MLE), і Байєсій може цього уникнути.
Але я думаю, що перевиконання - це проблема більше не щодо вибору моделі, а не щодо методу оцінки параметрів. Тобто, припустимо, у мене є набір даних , який генерується через , тепер я можу вибрати різні моделі щоб відповідати даним та дізнатися який із них найкращий. А розглянуті моделі - це многочлени з різними порядками, - це порядок 1, - порядок 2, - це порядок 9.f ( x ) = s i n ( x ) ,H i H 1 H 2 H 3
Зараз я намагаюся підходити до даних до кожної з 3-х моделей, кожна модель має свої параметри, позначені як для .w i H i
Використовуючи ML, я буду бально оцінювати параметри моделі , а занадто простий і завжди буде недостатнім для даних, тоді як занадто складний і він буде перевантажувати дані, тільки буде добре відповідати даним.H 1 H 3 H 2
Мої запитання:
1) Модель перевищить дані, але я не думаю, що це проблема ML, а проблема моделі сама по собі. Тому що, використовуючи ML для не призводить до перевитрати. Я правий?H 1 , H 2
2) Порівняно з байєсівською, ML має деякі недоліки, оскільки вона лише дає точну оцінку параметрів моделі , і це переконання. Тоді як Баєсіан не покладається тільки на найбільш вірогідне значення параметра, але на всі можливі значення параметрів з урахуванням спостережуваних даних , правда?D
3) Чому Байєсий може уникнути або зменшити наряд? Як я це розумію, ми можемо використовувати Баєсіан для порівняння моделей, тобто за даними ми могли б дізнатися граничну ймовірність (або модельні докази) для кожної розглянутої моделі, а потім вибрати ту, яка має найбільшу граничну ймовірність, правильно ? Якщо так, то чому це?