Який взаємозв'язок між кореляцією та причинно-наслідковою причиною в машинному навчанні?


13

Загальновідомий факт, що "Кореляція не дорівнює причинно-наслідковій причині", але машинне навчання майже повністю базується на кореляції. Я працюю над системою оцінювання результативності студентів з питань, виходячи з їх минулих виступів. На відміну від інших завдань, як-от пошук у Google, це не схоже на систему, з якою легко грати в ігри, тому причинно-наслідковий зв’язок не дуже актуальний у цьому плані.

Зрозуміло, що якщо ми хочемо провести експерименти для оптимізації системи, нам доведеться подбати про співвідношення / розрізнення причинності. Але, з точки зору просто побудови системи для вибору питань, які, ймовірно, будуть відповідного рівня складності, чи має це розрізнення важливе значення?


Будь-ласка, визначте або принаймні зверніться до того, що ви маєте на увазі під кореляційною причинною причиною у "Кореляція не дорівнює причинно-наслідковій
причині

Відповіді:


11

Не всі AI працюють на кореляції, Bayesian Belief Networks побудовані на основі ймовірності того, що A викликає B.

Я працюю над системою оцінювання результативності студентів з питань, виходячи з їх минулих виступів.

Я не думаю, що вам для цього не потрібна причина. Минуле виконання не викликає поточного виконання. Відповідь на раннє запитання не викликає відповіді на більш пізнє запитання.

Але з точки зору просто побудови системи для вибору питань, які, ймовірно, будуть відповідного рівня складності - чи має це розрізнення важливе значення?

Ні, не для вашого прикладу. Я думаю, що кореляція (або навіть проста екстраполяція) дуже добре вирішить вашу проблему. Призначте оцінку складності кожному із запитань, а потім подайте студентам запитання на дедалі складніших рівнях (саме так працює більшість іспитів), і тоді, коли студент почне їх неправильно, ви зможете повернути цю складність. Це алгоритм зворотного зв'язку, подібний до мінімізації помилок, здійсненого на нейроні в багатошаровому перцептроні. Нетривіальний фрагмент вхідних просторів, як це, вирішує, яке складне питання!

Кращим прикладом причинно-наслідкової хвороби у ШІ буде:

Моя машина сповільнюється. Мій прискорювач лежить на підлозі. Шуму не так багато. На приладовій панелі є світло. Яка ймовірність того, що у мене закінчилося пальне?

У цьому випадку нестача пального призвела до того, що машина сповільнилася. Це саме та проблема, яку вирішує Байєсівська мережа віросповідання.


"Я не думаю, що для цього вам не потрібна причина. Минулий виступ не викликає поточного виступу. Відповідь на раннє запитання не викликає відповіді на наступне запитання." - Добре той факт, що студент, який виконав вправу, може змусити їх краще виконати іншу вправу (ми надаємо їм, підказки, дії).
Casebash

Але я вважаю, що ти маєш рацію, йдеться не стільки про співвідношення проти причинно-наслідкових зв’язків, скільки про кореляцію з причинно-наслідковим зв’язком (тобто студенти в певному класі добре справляються з геометричними темами, тому що вчитель висвітлював це більш докладно, проти учнів, які завершив найскладніші теми, які прагнуть до високих виступів, оскільки вони єдині, хто до цього
звертається

Ах! Це цікаво: виконання вправи та знання її результату є причиною того, щоб краще ставитись до питань. Але це не помітно тут. Єдине, за чим ви спостерігаєте - це екзаменаційні питання, які співвідносяться. Кореляція не брудна, добре сказати, що два статистичні процеси мають відношення.
Д-р Роб Ланг

Причиною B є одна інтерпретація мережі вірувань.
сетеропередач

6

Мабуть, машинне навчання майже повністю базується на кореляції

Я так не думаю, принаймні, взагалі. Наприклад, основне припущення для алгоритмів ML з точки зору аналізу PAC та аналізу розмірності VC полягає в тому, що дані тренінгу / тестування надходять із того ж розподілу, що і майбутні дані.

Отже, у вашій системі, ви повинні припустити, що кожен студент накладає певний умовний розподіл ймовірностей, який генерує відповіді на конкретні типи питань на певні теми. Ще одне і більш проблемне припущення, яке ви повинні зробити, - це те, що цей розподіл не змінюється (або не змінюється швидко).


2

Я згоден з попередніми відповідями.

Якщо, однак, вам цікаво переглянути співвідношення / причинно-наслідкові зв’язки взагалі, два пункти, які ви можете переглянути, це:


2

Окрім інших відповідей, є цікава тема - якщо ви вибираєте функції вручну, ви можете подумати про «випадкову кореляцію», щоб зменшити перевиконання, тобто уникати функцій, які так чи інакше співвідносяться у ваших навчальних даних, але не хочу 't / не слід співвідносити в загальному випадку - що немає ніякого причинного зв'язку.

Як приклад грубий приклад, припустимо, що ви берете таблицю даних з результатами історичних іспитів і намагаєтеся передбачити критерії провалу / проходження; ви просто включаєте всі наявні поля даних як функції, а також, щоб таблиця мала день народження студентів. Зараз, можливо, існує коректне співвідношення в даних про навчання, що студенти, народжені 12 лютого, майже завжди проходять, а студенти, народжені 13 лютого, майже завжди провалюються ... але оскільки немає причинного зв'язку, це слід виключити.

У реальному житті це дещо тонкіше, але це допомагає розрізнити кореляції, які відповідають вашим даним до дійсних сигналів, які слід засвоїти; і кореляції, які є просто моделями, викликаними випадковим шумом у вашому навчальному наборі.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.