Оцініть ентропію інформації за допомогою вибірки в Монте-Карло


10

Я шукаю методи, які дозволяють оцінити інформаційну ентропію розподілу, коли єдиними практичними способами вибірки з цього розподілу є методи Монте-Карло.

Моя проблема не на відміну від стандартної моделі Ізінга, яка зазвичай використовується як вступний приклад для вибірки Metropolis – Гастінгса. У мене є розподіл ймовірностей безлічі , тобто у мене є для кожного . Елементи мають комбінаторний характер, як і штати Ізінг, і їх дуже велика кількість. Це означає, що на практиці я ніколи не отримую один і той же зразок двічі під час вибірки з цього розподілу на комп'ютері. не можна безпосередньо обчислити (через незнання коефіцієнта нормалізації), але відношення легко обчислити.p ( a ) a A a A p ( a ) p ( a 1 ) / p ( a 2 )Ap(a)aAaAp(a)p(a1)/p(a2)

Я хочу оцінити інформаційну ентропію цього розподілу,

S=aAp(a)lnp(a).

Крім того, я хочу оцінити різницю ентропії між цим розподілом та отриманим, обмеживши його підмножиною (і, звичайно, повторно нормалізуючи).aA1A

Відповіді:


3

Якщо я розумію, яку інформацію у вас є, то, що ви хочете, неможливо: наявної у вас інформації недостатньо для визначення ентропії. Навіть недостатньо для наближення ентропії.

Здається, у вас є спосіб вибірки з розподілу , і у вас є спосіб обчислити співвідношення для будь-якої пари елементів яке ви отримали за допомогою вибірки, але у вас немає іншої інформації. Якщо так, то ваша проблема не вирішена.p ( a 1 ) / p ( a 2 ) a 1 , a 2p()p(a1)/p(a2)a1,a2

Зокрема, ми можемо знайти пару дистрибутивів, які мають різні ентропії, але їх неможливо розрізнити, використовуючи доступну вам інформацію. Розглянемо спочатку рівномірний розподіл на (випадковий) набір розміром . Далі розглянемо рівномірний розподіл на (випадковий) набір розміром . Вони мають різні ентропії (200 біт проти 300 біт). Однак, з огляду на доступну вам інформацію, ви не можете знати, з яким із цих двох дистрибутивів ви працюєте. Зокрема, в обох випадках співвідношення 2 300 p ( a 1 ) / p ( a 2 )22002300p(a1)/p(a2)завжди буде рівно 1, тому співвідношення не допоможуть вам розрізнити два розподіли. І завдяки парадоксу дня народження, ви можете взяти вибірку скільки завгодно, але ви ніколи не отримаєте одне і те ж значення двічі (не протягом життя, за винятком експоненціально малої ймовірності), тому значення, отримані від вибірки, будуть виглядати як раз випадкові точки і не містять корисної інформації.

Отже, щоб вирішити свою проблему, вам потрібно знати щось більше. Наприклад, якщо ви знаєте щось про структуру розподілу , це може дати можливість вирішити вашу проблему.p()


p(a)p(a)exp(θE(a))Eaθ

1
p(a)

2

F=ETS,
ETθpeθES

ΔFΔSΔFΔEA1AEA1

Ось дві додаткові посилання на алгоритми обчислення вільної енергії:

Lelièvre, T., Rousset, M., & Stoltz, G. (2010). Безкоштовні обчислення енергії. Imperial College Press. http://doi.org/10.1142/9781848162488

Chipot, C., & Pohorille, A. (2007). Безкоштовні розрахунки енергії. (C. Chipot & A. Pohorille, ред.) (Т. 86). Берлін, Гейдельберг: Спрингер Берлін Гейдельберг. http://doi.org/10.1007/978-3-540-38448-9


Чи можете ви надати більше практичних посилань для обчислення вільних різниць енергії? Цей вікі не надто далеко
Чарльз Уеллс

Зроблено. Я додав ще два посилання та вказав на посилання на бічній панелі вікі.
Хуан М. Белло-Рівас
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.