Я намагаюся зрозуміти деякі статті Марка ван дер Лаана. Він теоретичний статистик в Берклі, який працює над проблемами, які суттєво перегукуються з машинним навчанням. Одна з проблем для мене (крім глибокої математики) полягає в тому, що він часто закінчує опис звичних підходів до машинного навчання, використовуючи зовсім іншу термінологію. Одне з його головних понять - «Цільова максимальна ймовірність очікування».
TMLE використовується для аналізу цензурованих даних спостережень з некерованого експерименту таким чином, що дозволяє оцінити ефект навіть за наявності заплутаних факторів. Я сильно підозрюю, що багато одних і тих же понять існують під іншими іменами в інших галузях, але я ще не розумію його досить добре, щоб відповідати йому прямо ні до чого.
Спроба усунути прогалину до "Аналіз обчислювальних даних" тут:
І вступ для статистиків тут:
Причинно-наслідкові умовиводи, орієнтовані на максимальну ймовірність: частина I
З другого:
У цій статті ми розробляємо конкретний цільовий максимальний показник ймовірності причинних наслідків багаторазових втручань. Це передбачає використання супернавчання на основі втрат, щоб отримати початкову оцінку невідомих факторів формули G-обчислень, а згодом, застосувати оптимальну функцію коливання, орієнтовану на цільовий параметр (найменш сприятливу параметричну підмодель), до кожного оціненого коефіцієнта, оцінка параметрів (-ів) коливання з максимальною оцінкою ймовірності та повторення цього етапу оновлення початкового коефіцієнта до конвергенції. Цей ітеративний цільовий максимальний ймовірний етап оновлення робить результуючу оцінку причинного ефекту подвійною стійкою в тому сенсі, що вона є послідовною, якщо або початковий оцінювач є послідовним, або оцінювач оптимальної флуктуаційної функції є послідовним. Оптимальна флуктуаційна функція задана правильно, якщо умовно розподілені вузли в причинному графіку, на який втручається один, правильно вказані.
У його термінології "супернавчання" - це ансамблеве навчання за теоретично обгрунтованою схемою негативного зважування. Але що він має на увазі під „застосуванням оптимальної флуктуаційної функції, орієнтованої на цільовий параметр (найменш сприятливий параметричний підмодель) до кожного оціненого коефіцієнта”.
Або, розбиваючи його на три різні питання, чи має TMLE паралель у машинному навчанні, що таке "найменш сприятливий параметричний підмодель" та що таке "функція коливання" в інших сферах?