Bootstrap vs Monte Carlo, оцінка помилок

12

Я читаю статтю Поширення помилок методом Монте-Карло в геохімічних розрахунках, Андерсон (1976), і є щось, що я не зовсім розумію.

Розглянемо деякі вимірювані дані та програму, яка їх обробляє та повертає задане значення. У статті ця програма використовується для того, щоб спочатку отримати найкраще значення за допомогою даних даних (тобто: ). $\{A\pm\sigma_A, B\pm\sigma_B, C\pm\sigma_C\}$ $\{A, B, C\}$

Потім автор використовує метод Монте-Карло, щоб призначити невизначеність цього найкращого значення, змінюючи вхідні параметри в межах їх меж невизначеності (заданих гауссовим розподілом із засобами та стандартними відхиленнями ) перед подачею їх програмі. Це проілюстровано на малюнку нижче: $\{A, B, C\}$ $\{\sigma_A, \sigma_B, \sigma_C\}$

( Авторські права: ScienceDirect )

де невизначеність може бути отримана з остаточного розподілу $Z$

Що буде, якби замість цього методу Монте-Карло я застосував метод завантаження? Щось на зразок цього:

Це: замість того, щоб змінювати дані в межах їх невизначеності перед тим, як подавати їх програмі, я здійснюю вибірку із заміною на них.

Які відмінності між цими двома методами в цьому випадку? Які застереження я повинен знати, перш ніж застосовувати будь-яке з них?

Мені відомо це питання Bootstrap, Монте-Карло , але це не зовсім вирішує мої сумніви, оскільки в цьому випадку дані містять задані невизначеності.

bootstrap monte-carlo error

— Габріель
джерело

Просто для уточнення: «випадкова зміна» методу МС випадково породжується дослідником? Тобто шум / помилки штучно додаються до вхідних даних?

— shadowtalker

Він "генерований випадковим чином", заснований на невизначеності вимірюваних даних (тобто: s) та припускаючи певний розподіл для цих помилок (як правило, Гаусса). Тож ні, помилки штучно не додаються. Вхідні дані мають пов'язану помилку, задану процесом вимірювання.

σ

$\sigma$

— Габріель

Я не думаю, що я розумію. Це штучний шум, але зі стандартним відхиленням, оціненим за даними

— shadowtalker

Тоді я, мабуть, не розумію, що таке "штучний шум" (і що буде "штучним шумом"). Ви бачили статтю? Це, безумовно, пояснює речі набагато краще, ніж я.

— Габріель

Природний шум: випадкові зміни в моїх даних. Штучний шум: використання генератора випадкових чисел для отримання чисел із розподілу ймовірностей, і додавання цих чисел до моїх даних

— shadowtalker

7

Наскільки я розумію ваше запитання, різниця між підходом "Монте-Карло" і підходом "завантажувальний тренд" по суті є різницею між параметричною та непараметричною статистикою.

У параметричній рамці точно відомо, як генеруються дані , тобто, враховуючи параметри моделі ( , , & tc. У вашому описі), ви можете виробляти нові реалізації таких наборів даних , а з них нові реалізації вашої статистичної процедури (або "результату"). Таким чином, можна повністю і точно описати розподіл ймовірностей виходу , або математичними виведеннями, або експериментом Монте-Карло, повертаючи зразок довільної величини з цього розподілу. $x_1,\ldots,x_N$ $A$ $\sigma_A$ $Z$

У непараметрических рамках, один не бажають , щоб зробити такі припущення щодо даних і , таким чином , використовує дані і дані тільки для оцінки її розподілу, . Запуск завантажувального пристрою є таким підходом, що невідомий розподіл оцінюється емпіричним розподілом зробленим шляхом встановлення ваги ймовірності у кожній точці вибірки (у найпростішому випадку, коли дані є ідентичними). Використовуючи це емпіричне розподіл в якості заміни для істинного розподілу , можна отримати з допомогою Монте - Карло оціненого розподілу вихідного . $F$ $\hat F$ $1/n$ $\hat F$ $F$ $Z$

Таким чином, основна відмінність обох підходів полягає в тому, чи робить цей параметричний припущення про розподіл даних.

— Сіань
джерело

2

Майже через два роки я знаю, що вважаю це найкращою відповіддю, оскільки в ній чітко згадується різниця між параметричним та непараметричним підходами (про які я тоді не знав). Таким чином, я змінюю прийняту відповідь на цей .

— Габріель

але для парамтричного підходу також можна використовувати параметричний завантажувальний ряд?

— Tom Wenseleers

12

Випадкова зміна вашої моделі Монте-Карло представлена кривою дзвіночка, і обчислення, ймовірно, передбачає звичайно розподілену "помилку" або "Зміна". Принаймні, вашому комп’ютеру потрібне певне припущення щодо розподілу, з якого можна зробити "зміну". Запуск завантаження не обов'язково робить такі припущення. Він сприймає спостереження як спостереження, і якщо їх помилка асиметрично розподілена, то таким чином вона переходить у модель.

Вимикання завантаження витягується із спостереження і тому потребує низки справжніх спостережень. Якщо ви читаєте в книзі, цей показник C в середньому становить 5 при стандартному відхиленні 1, ніж тоді ви можете встановити Монте-Карло Модель, навіть якщо у вас немає спостережень. Якщо ваше спостереження мало (подумайте: астрономія), ви можете створити Монте-Карло Модель з 6 спостереженнями та деякими припущеннями щодо їх розповсюдження, але з 6 спостережень ви не будете завантажуватися.

Можливі змішані моделі з деяким входом, отриманим із спостережуваних даних, а деякі із змодельованих (скажімо, гіпотетичних) даних.

Редагувати: У наступній дискусії в коментарях оригінальний плакат знайшов наступну допомогу:

"Оригінальна програма" не байдуже, чи отримує вона значення, яке ви обчислили від середнього та відхилення, або це справжня реалізація середнього та відхилення в природному процесі.

— Бернар
джерело

1

Дякую за вашу відповідь, Бернхард! Кілька питань, які виникають у мене на думці. 1. Чи правильно я розумію, що єдиною (основною?) Різницею між цими двома методами є те, що МС потрібно взяти на себе розподіл за невизначеностями, поки завантажувальний пристрій не робить? 2. Якби у мене був достатньо великий набір даних і я повторював ітерацію неодноразово ( ), чи би ці два способи на оціночну невизначеність, присвоєну найкращому значенню ? 3. Чи я не відкидаю цінні дані, не використовуючи невизначеності, присвоєні вхідним даним у методі завантаження?

N \to \infty

$N\to\infty$

— Габріель

1

Я статистично / машинобудівний самоучка, тому не буду стверджувати, що будь-яка з відмінностей, про які я згадувала, є єдиними. Я навіть не впевнений, чи вважається Bootstrapping самим методом Монте-Карло. Обидва алгоритми імітують велику кількість реалістичних сценаріїв. Ви можете зробити висновок із припущень або зі спостережень. Моє поле - це медицина, і припущення, як відомо, помиляються в цій галузі. Тому я б намагався вести спостереження, коли вони доступні у достатній кількості. Цілком може бути, що у галузі, ближчій до фізики чи хімії, ...

— Бернхард

1

... що в галузях, ближчих до фізики чи хімії, припущення є більш надійними. Щодо пункту 2: Якщо ви припускаєте досить великі зразки та ітерації, я припускаю, ви виявите, що реальні дані ніколи не поширюються правдою і що ваші припущення завжди трохи неправильні, але я не можу претендувати на будь-які знання. Щодо пункту 3: Я не впевнений, що я зрозумів, що ви маєте на увазі, відкинувши цінні дані у методі завантаження. "Призначення невизначеності" техногенне, Дані походять з реальності. Знову ж таки, це моя віра, заснована на моєму полі. Насправді ви рідко матимете хорошу теорію та великі дані

— Бернхард

1

За відкидаючи цінні дані я маю в виду , що метод початкового завантаження не використовують невизначеності , привласнених дані (тобто: ) Це «інформація» про те , що метод МК враховує але бутстраповскій викид.

σ_{A}, σ_{B}, σ_{C}

$\sigma_A, \sigma_B, \sigma_C$

— Габріель

1

Кожне спостереження є вимірюваною величиною, тому вже містить власну похибку вимірювання та невизначеність. "Оригінальна програма" не байдуже, чи отримує вона значення, яке ви обчислили від середнього та відхилення, або це справжня реалізація середнього та відхилення в природному процесі. Але, звичайно, всі методи перекомпонування визначаються на основі великих даних, і ви можете обчислити довільні числа або випадкові числа, але зазвичай не робити довільних чисел спостережень. Тож у випадках, коли у вас є велика кількість спостережень, я не бачу, де дані відкидаються.

— Бернхард

1

Якщо функція, що стосується виходу Z до входів, є досить лінійною (тобто в межах варіаційного діапазону входів), дисперсія Z є комбінацією дисперсій та коваріацій входів. Деталі розподілу не мають великого значення ... Отже, обидва методи повинні повернути схожі результати.

Див. Додаток 1 до ГУМу

— Паскаль
джерело

Що відбувається, коли функція недостатньо лінійна? Чим відрізнятимуться ці два методи?

— Габріель

У такому випадку слід звернутися до відповіді, викладеної Бернардом. Тобто, щоб вони збігалися, ви повинні мати вірний опис pdf даних для Монте-Карло.

— Паскаль

0

Запуск програми означає, що дані можуть говорити самі за себе. Методом Монте-Карло ви вибираєте безліч випадкових малюнків із накладеного CDF (нормальне; гамма; бета ...) шляхом рівномірного розподілу та створюєте емпіричний PDF (за умови, що CDF є безперервним та отриманим). Про цікаве пояснення всього процесу в Монте-Карло повідомляється в: Бріггс А, Шульпер М, Клакстон К. Моделювання рішення для економічної оцінки здоров'я. Oxford: Oxford University Press, 2006: 93-95.

— Карло Лаццаро
джерело