Байесян: "Привіт, машинознавець!"
Частота: "Привіт, машинознавець!"
Машинне навчання: "Я чую, ви, хлопці, хороші в роботі. Ось деякі дані".
F: "Так, давайте запишемо модель, а потім обчислимо MLE."
n−1n
F: "Ага, дякую, що нагадали. Я часто думаю, що я повинен використовувати MLE для всього, але мене цікавлять неупереджені оцінки тощо".
М.Л .: "Е, про що це філософствує? Чи допоможе це мені?"
÷(n−1)
М.Л .: "Отже, що тебе хвилює?"
F: "Оцінка".
М.Л .: "Мені подобається звук цього".
θθθ
М.Л .: "Звучить чудово! Здається, що лікарі-ветеринари - прагматичні люди. Ви оцінюєте кожну чорну скриньку за її результатами. Оцінка є ключовою".
F: "Дійсно! Я розумію, ви, хлопці, використовуєте подібний підхід. Перехресне підтвердження, чи щось таке? Але це для мене звучить безладно".
ML: "Брудний?"
F: "Ідея перевірити ваш оцінювач на реальних даних мені здається небезпечною. Емпіричні дані, які ви використовуєте, можуть мати з цим всілякі проблеми і можуть не вести себе за моделлю, про яку ми домовились для оцінки".
θ
F: "Так. Хоча ваш метод, можливо, працював на одному наборі даних (набір даних із даними поїздів і випробувань), який ви використовували при оцінці, я можу довести, що моя завжди буде працювати".
ML: "Для всіх наборів даних?"
F: "Ні"
ML: "Значить, мій метод був перевірений на одному наборі даних. Ви не перевіряли свій реальний набір даних?"
F: "Правильно".
М.Л .: "Тож мене випереджають! Мій метод кращий, ніж ваш. Він прогнозує рак у 90% часу. Ваше" доказ "справедливе лише в тому випадку, якщо весь набір даних поводиться за моделлю, яку ви припускали."
F: "Емм, так, гадаю."
θ
F: "Це правильно. Якщо дані справді не є нормальними (або будь-якими іншими), моє доказ марно".
М.Л .: "Тож моя оцінка більш достовірна та всебічна? Вона працює лише на наборах даних, які я пробувала до цих пір, але принаймні вони справжні набори даних, бородавки і все. Там ви були, намагаючись стверджувати, що ви більш" консервативні " "і" ретельно ", і щоб вас цікавили перевірки моделей та ін."
Б: (заперечує) "Ей, хлопці, вибачте, що перебиваю. Я б хотів вступити в рівновагу і, можливо, продемонструвавши якісь інші проблеми, але мені дуже подобається спостерігати за тим, як мої колеги-чатники примружуються".
F: "Вау!"
М.Л .: "Добре, діти. Це стосувалося оцінювання. Оцінювач - це чорне поле. Дані надходять, дані виходять. Ми затверджуємо або не схвалюємо оцінювач на основі того, як він працює під час оцінки. Нас не хвилює. про "рецепт" або "принципи дизайну", які використовуються ".
F: "Так. Але у нас є дуже різні уявлення про те, які оцінки важливі. ML буде робити тренінги та тестування на реальних даних. Тоді як я буду робити більш загальну оцінку (тому що вона передбачає широко застосовне підтвердження) та також більш обмеженим (тому що я не знаю, чи фактично ваш набір даних складається з припущень моделювання, які я використовую під час проектування своєї оцінки.) "
ML: "Яку оцінку ви використовуєте, B?"
F: (заперечує) "Гей. Не смій мене. Він нічого не оцінює. Він просто використовує свої суб'єктивні переконання і біжить з цим. Або щось".
Б: "Це загальна інтерпретація. Але також можна визначити байєсіанство за допомогою переважних оцінок. Тоді ми можемо використовувати ідею, що ніхто з нас не цікавиться тим, що знаходиться в чорному полі, ми дбаємо лише про різні способи оцінки".
Б продовжує: "Класичний приклад: Медичний тест. Результат аналізу крові є або позитивним, або негативним. Частиця буде цікавити здорових людей, яка частка отримує негативний результат". Аналогічно, яка частка хворих людей отримайте позитивний результат. Частіст буде обчислювати їх для кожного методу аналізу крові, який розглядається, а потім рекомендує використовувати тест, який отримав найкращу пару балів ".
F: "Саме так. Що ще ви могли б хотіти?"
Б: "А як щодо тих людей, які отримали позитивний результат тесту? Вони захочуть знати" тих, хто отримає позитивний результат, скільки отримає хворий? " і "тих, хто отримує негативний результат, скільки здорових?" "
М.Л .: "Так, це здається кращою парою питань".
F: "ГЕРЕСІ!"
Б: "Ось ми знову йдемо. Йому не подобається, куди це йде".
ML: "Мова йде про" пріори ", чи не так?"
F: "ЗЛИЙ".
B: "Так чи інакше, ти маєш рацію в ML. Для того, щоб підрахувати частку людей, що мають позитивний результат, які є хворими, ти повинен зробити одну з двох речей. Один з варіантів - запустити тести на багатьох людей і просто дотримуватися відповідна пропорція. Скільки людей, наприклад, помирають від цієї хвороби, наприклад ".
ML: "Це звучить як те, що я роблю. Використовуйте поїзд і тест".
Б: "Але ви можете заздалегідь обчислити ці цифри, якщо ви готові зробити припущення щодо рівня захворюваності на населення. Частоцист також робить свої розрахунки заздалегідь, але не використовуючи цей показник рівня захворюваності на рівні населення".
F: "БІЛЬШЕ НЕЗНАЧЕННІ ПРИМІТКИ".
Б: "О, заткнись. Раніше вас дізналися. ML виявив, що ви так само любите необгрунтовані припущення, як і будь-хто. Ваші" перевірені "ймовірності покриття не збігаються в реальному світі, якщо всі ваші припущення не виправдаються. Чому моє попереднє припущення настільки різне? Ви називаєте мене божевільним, але ви робите вигляд, що ваші припущення - це робота консервативного, ґрунтовного аналізу, що не передбачає припущень ".
Б (продовжує): "У будь-якому випадку, ML, як я вже говорив. Байєзці люблять різний вид оцінювання. Нас більше цікавить кондиціонування спостережуваних даних і відповідно обчислення точності нашого оцінювача. Ми не можемо виконати цю оцінку без використання Цікавим є те, що як тільки ми приймаємо рішення про цю форму оцінювання, і як тільки ми вибираємо нашу попередню, у нас є автоматичний "рецепт", щоб створити відповідний оцінювач. У частофіліста немає такого рецепта. Якщо він хоче неупереджений оцінювач для складної моделі, у нього немає автоматизованого способу побудови відповідного оцінювача. "
ML: "А ви це робите? Ви можете автоматично створити оцінювач?"
B: "Так. У мене немає автоматичного способу створення об'єктивного оцінювача, тому що я вважаю, що упередження - це поганий спосіб оцінити оцінювач. Але з огляду на умовне оцінювання даних, яке мені подобається, і попереднє, я може підключити попереднє і ймовірність дати мені оцінку ".
М.Л .: "Так чи інакше, давайте резюмуємо. У всіх нас є різні способи оцінити наші методи, і ми, мабуть, ніколи не погодимося, які методи найкращі".
Б: "Ну, це нечесно. Ми могли б їх змішувати і співставляти. Якщо хтось із нас має хороші дані про тренування, ми, мабуть, повинні перевірити їх. І взагалі ми всі повинні перевірити якомога більше припущень. "Докази теж можуть бути цікавими, прогнозуючи ефективність за певною припущеною моделлю генерування даних."
F: "Ага, хлопці. Давайте будемо прагматично оцінювати. І насправді я перестану нав'язуватись властивостями нескінченного зразка. Я просив учених дати мені нескінченний зразок, але вони все ще не робили цього. Це час мені знову зосередитись на кінцевих зразках ".
М.Л .: "Отже, у нас є лише останнє питання. Ми багато сперечалися про те, як оцінити наші методи, але як ми створюємо наші методи".
Б: "Ах. Як я вже запускав раніше, у нас, байєсів, є більш потужний загальний метод. Це може бути складним, але ми завжди можемо написати якийсь алгоритм (можливо, наївна форма MCMC), який буде вибіркою з нашої задньої частини. "
F (заперечує): "Але це може мати упередженість".
Б: "Так, можливо, ваші методи. Потрібно нагадати вам, що MLE часто є необ'єктивним? Іноді у вас виникають великі труднощі з пошуку неупереджених оцінювачів, і навіть коли у вас є дурний оцінювач (для якоїсь дійсно складної моделі), який скаже" дисперсія негативна. І ви називаєте це неупередженим. Незаангажованим, так. Але корисним, ні! "
М.Л .: "Гаразд, хлопці. Ви знову проїжджаєте. Дозвольте поставити вам запитання, Ф. Чи ви коли-небудь порівнювали упередженість свого методу з ухилом методу В., коли ви обидва працювали над однією проблемою?"
F: "Так. Насправді, я ненавиджу це визнавати, але підхід Б. іноді має менший ухил та MSE, ніж мій оцінювач!"
М.Л .: "Урок тут полягає в тому, що, хоча ми трохи не погоджуємось з оцінкою, ніхто з нас не має монополії на те, як створити оцінювач, який має властивості, які ми хочемо".
Б: "Так, ми повинні прочитати твір один одного трохи більше. Ми можемо дати іншим натхнення для оцінювачів. Ми можемо виявити, що інші оцінки добре працюють, не в першу чергу, над нашими проблемами".
F: "І я повинен перестати нав'язливо ставитися до упередженості. Незаангажований оцінювач може мати смішні розбіжності. Я думаю, що всі ми повинні" брати на себе відповідальність "за вибір, який ми робимо, як ми оцінюємо, і властивості, які ми хочемо бачити в наших оцінювачах. Ми не можемо перешкоджати філософії. Спробуйте всі оцінки, які ви можете. І я продовжую придивлятися до байєсівської літератури, щоб отримати нові ідеї для оцінювачів! "
B: "Насправді, багато людей насправді не знають, що таке їх власна філософія. Я навіть не впевнений у собі. Якщо я скористаюся байєсівським рецептом, а потім підтверджую приємний теоретичний результат, це не означає, що я Частиця турбується про вищезазначені докази продуктивності, він не дбає про рецепти. І якщо я замість цього (або добре) роблю тест-поїзд, чи це означає, що я машинолог? "
М.Л .: "Здається, ми всі тоді дуже схожі".