В основному моє вивчення полягає в машинному навчанні, і я намагався дізнатися, що означає тестування Байєсової гіпотези. Я добре з байєсівською інтерпретацією ймовірності, і мені це добре знайоме в контексті імовірнісних графічних моделей. Однак мене бентежить те, що означає слово "Гіпотеза" в контексті статистичного висновку.
Я думаю, що в основному я плутаю лексику, до якої я звик у машинному навчанні, а також про те, що зазвичай використовується у статистиці та умовиводі.
В контексті контрольованого навчання , я зазвичай думаю , що гіпотези в якості прогностичної функції, що відображає приклади його етикетки тобто . Однак мені здається, що термін гіпотеза, в читаннях, які я роблю, не має однакового значення. Дозвольте вставити уривок прочитаних прочитаних:
Якщо ви уважно читаєте, це також говорить:
існує інша модель спостережуваних даних ...
чи вони вживали слово модель. Для мене слово модель змушує мене думати про набір функцій, якщо ми вибирали конкретну функцію прогнозування. тобто клас функції гіпотези. Наприклад, може бути класом гіпотез квадратичних функцій (поліном ступеня 2). Однак мені здається, що вони використовують словомодель та гіпотезу як синоніми у цьому витязі (де для мене вони зовсім інші слова).
Далі йдеться про те, що ми можемо поставити пріори до гіпотези (цілком розумна річ, що потрібно робити в байєсівській обстановці):
також ми можемо охарактеризувати дані за допомогою поточної гіпотези:
і оновіть нашу теперішню думку, враховуючи деякі дані (та правило Бає):
Однак, я думаю, я більше звик ставити байєсівську оцінку до певного параметра (скажімо, ) з класу гіпотез, а не до всього класу гіпотез. В основному, оскільки здається, що ці "гіпотези" не є тими ж гіпотезами з контексту машинного навчання, до яких я звик, мені здається, що ці гіпотези більше схожі на конкретний параметр θ, ніж на клас гіпотези.
У цей момент я переконався, що "гіпотеза" означала те саме, що і в функції прогнозування (параметризована, наприклад, параметром , наприклад), але я думаю, що я помилився ...
Щоб зробити мою плутанину ще гіршою, пізніше ці ж читання продовжували конкретизувати певну "гіпотезу" для кожного прикладу тренінгу, який вони спостерігали. Дозвольте вставити витяжку з того, що я маю на увазі:
Причина, яка мене бентежить, полягає в тому, що якщо я інтерпретую гіпотезу як параметр, то для мене немає сенсу вказувати конкретний параметр для кожного значення вибірки, яке ми бачимо. У цей момент я зробив висновок, що я дійсно не знаю, що вони розуміють під гіпотезою, тому я поставив це питання.
Однак я не повністю здався, я дослідив, що означає гіпотеза в статистиці частотистів, і знайшов наступне відео про академію хана . Це відео насправді має для мене дуже багато сенсу (можливо, ти частолюбиця! :) . Однак, схоже, що вони отримують купу даних (як-от «набір зразків») і, виходячи з властивостей набору вибірки, вони вирішують, приймати чи відхиляти нульову гіпотезу щодо даних. Однак у байєсівському контексті, який я читаю, мені здається, що для кожного вектора [точки] даних, який спостерігається, вони "позначають його" гіпотезою з "тестом коефіцієнта ймовірності":
Те, як вони привласнюють гіпотези до кожного зразка даних, навіть виглядає як контрольоване навчальне завдання, якщо ми прикріплюємо етикетку до кожного навчального набору. Однак я не думаю, що це роблять у цьому контексті. Що вони роблять? Що означає присвоювати гіпотезу кожній вибірці даних? У чому сенс гіпотези? Що означає слово модель?
По суті, після цього довгого пояснення моєї плутанини хтось знає, що означає тестування гіпотези байесів у цьому контексті?
Якщо вам потрібні роз'яснення чи що-небудь, щоб покращити моє запитання чи так, щоб питання мало сенс, я з радістю допоможу :)
У пошуках відповіді я знайшов кілька корисних речей, пов’язаних із тестуванням статистичної гіпотези:
Це стосується гарного вступу до теми, якщо ви перебуваєте з фонового режиму CS (як я):
Що є хорошим вступом до тестування статистичної гіпотези для вчених-комп'ютерів?
У якийсь момент я запитав про "параметри за замовчуванням" (які я мав би визначити, що я маю на увазі. Я думав, що це стандартний термін, але це не так, ось тут я його вирішу), і я думаю, що я справді мав на увазі, як це зробити ви вказуєте параметри для кожної гіпотези, яку ви маєте. Наприклад, як ви вирішите, яка ваша нульова гіпотеза та її параметри. Є питання, пов’язане з цим: