Отже, це питання дещо пов'язане, але я наполегливо намагався зробити це максимально відвертим.
Мета: Коротше кажучи, існує виведення негентропії, яка не передбачає кумулянтів вищого порядку, і я намагаюся зрозуміти, як це було отримано.
Довідка: (я все це розумію)
Я самостійно вивчаю книгу «Незалежний аналіз компонентів» , яку знайшов тут. (Це питання знаходиться у розділі 5.6, якщо у вас є книга - «Наближення ентропії за допомогою неполіноміальних функцій»).
Ми маємо , яка є випадковою величиною, і чия негентропії ми хочемо оцінити, з деяких спостережень ми маємо. PDF з x задається p x ( ζ ) . Негентропія - це просто різниця між диференційною ентропією стандартизованої гауссової випадкової величини та диференціальною ентропією x . Диференціальна ентропія тут задана Н таким, що:
і так, негентропія задана
де - стандартизований гауссовий rv, з PDF, заданим ϕ ( ζ ) .
Тепер, як частина цього нового методу, моя книга отримала оцінку PDF-файлу , задану:
(Де . До речі, i - це не потужність, а натомість індекс).
Наразі я “приймаю” цю нову формулу PDF і попрошу про неї ще день. Це не моє головне питання. Що він зараз робить, - це вставити цю версію PDF-файлу назад в рівняння negentropy і закінчується наступним:
Майте на увазі, сигма (тут і для решти посади) просто петлі навколо індексу . Наприклад, якби ми мали лише дві функції, сигнал би циклічно для i = 2 і i = 2 . Звичайно, я повинен розповісти вам про ті функції, якими він користується. Отже, мабуть, ці функції F i визначаються таким чином:
Функції не є поліноміальними функціями в цьому випадку. (Будемо вважати, що rv x - нульове середнє значення та дисперсія одиниці). Тепер зробимо деякі обмеження та надамо властивості цих функцій:
Для спрощення розрахунків, давайте зробимо ще один, чисто технічне припущення: Функції , сформуйте ортонормальну систему як таку:
і
Майже там! Гаразд, так що все було на заднім плані, а тепер до питання. Завдання полягає в тому, щоб просто розмістити цей новий PDF у формулу диференціальної ентропії, . Якщо я це зрозумію, я зрозумію решту. Тепер книга дає виведення (і я з цим погоджуюся), але я застряг до кінця, бо не знаю / не бачу, як це скасовується. Крім того, я не знаю, як інтерпретувати малі позначення від розширення Тейлора.
Це результат:
Використовуючи розширення Тейлора , для H ( x ) отримуємо:
і так
Питання: (я цього не розумію)
Отже, моя проблема: За винятком , я не розумію, як він отримав останні 4 умови в останньому рівнянні. (тобто 0, 0 і останні два доданки). Я все розумію до цього. Він каже, що він використав відносини ортогональності, наведені у властивостях вище, але я не розумію, як. (Я також не розумію тут малого позначення, в сенсі того, як воно використовується?)
СПАСИБІ!!!!
Редагувати:
Я пішов вперед і додав образи з книги, яку я читаю, вона в значній мірі говорить те, що я говорив вище, але на всякий випадок, коли комусь потрібен додатковий контекст.
І тут, позначений червоним кольором, є саме та частина, яка мене бентежить. Як він використовує властивості ортогональності, щоб отримати останню частину, де речі скасовуються, і остаточні підсумки, що включають