Я намагаюся навчитися вивченню підкріплення, і ця тема мене дуже бентежить. Я взяв вступ до статистики, але я просто не міг зрозуміти цю тему інтуїтивно.
Я намагаюся навчитися вивченню підкріплення, і ця тема мене дуже бентежить. Я взяв вступ до статистики, але я просто не міг зрозуміти цю тему інтуїтивно.
Відповіді:
Вибірка важливості - це форма вибірки від розподілу, що відрізняється від розподілу відсотків , щоб легше отримати кращі оцінки параметра від розподілу інтересів. Зазвичай це забезпечить оцінки параметру з меншою дисперсією, ніж це було б отримано шляхом вибірки безпосередньо з вихідного розподілу з тим самим розміром вибірки.
Він застосовується в різних контекстах. Загалом вибірка з різного розподілу дозволяє взяти більше зразків у тій частині розподілу інтересів, яка продиктована заявкою (важливий регіон).
Одним із прикладів може бути те, що ви хочете мати вибірку, яка включає більше вибірок з хвостів розподілу, ніж чиста випадкова вибірка з розподілу інтересів.
Стаття у вікіпедії, яку я бачив на цю тему, занадто абстрактна. Краще подивитись на різні конкретні приклади. Однак він включає посилання на цікаві додатки, такі як Bayesian Networks.
Одним із прикладів вибірки важливості у 40-х та 1950-х роках є техніка зменшення дисперсії (форма методу Монте-Карло). Дивіться, наприклад, книгу «Методи Монте-Карло» Хаммерслі та Гандеркомб, опубліковану як монографію Метюена / Чапмана і Холла в 1964 році та перевидану в 1966 році та пізніше іншими видавцями. Розділ 5.4 книги охоплює вибірку важливості.
Вибірка важливості - це моделювання або метод Монте-Карло, призначений для наближення інтегралів. Термін "вибірка" дещо заплутаний тим, що він не має наміру надавати вибірки із заданого розподілу.
Інтуїція за вибіркою важливості полягає в тому, що чітко визначений інтеграл, як можна виразити як очікування для широкого діапазону розподілів ймовірностей: I = E f [ H ( X ) ] = ∫ X H ( x ) f ( x )
Як тільки ця елементарна властивість буде зрозумілою, реалізація ідеї полягає в тому, щоб спиратися на Закон великих чисел, як в інших методах Монте-Карло, тобто моделювати [через псевдовипадковий генератор] зразок iid поширений від F і використовувати наближення I = 1який
В залежності від вибору розподілу , вище оцінки I може або не може мати кінцеву дисперсію. Однак завжди існують варіанти f, які дозволяють мати кінцеву дисперсію і навіть довільно невелику дисперсію (хоча ці варіанти можуть бути недоступними на практиці). І існують також вибір F , які роблять важливість вибірки оцінювання I дуже поганий апроксимації I . Сюди входять всі варіанти, коли дисперсія стає нескінченною, навіть якщо нещодавній документ Чаттерджи та Діаконіса вивчає, як порівняти пробовідборники важливості з нескінченною дисперсією. Зображення нижче взято змій блог обговорення з паперу та показує погану збіжність нескінченних дисперсії оцінок.
Вибірка важливості з розподілом важливості Розподіл Exp (1) розподілу та розподіл Exp (1/10) та цікаві функції . Справжнє значення інтеграла дорівнює 10 .
[Далі подано з нашої книги " Статистичні методи Монте-Карло" .]
інтеграл вище можна вважати очікуванням h ( X ) = 2 / π ( 1 + X 2 ) , де