Ось моя спроба.
Фон
Розглянемо наступні два випадки.
- Ви приватні очі на вечірці. Раптом ви бачите одного зі своїх старих клієнтів, що розмовляють з кимось, і ви можете почути деякі слова, але не зовсім, тому що ви також чуєте ще когось, хто поруч, беручи участь у незв’язаній дискусії про спорт. Ви не хочете ближче - він помітить вас. Ви вирішили взяти телефон свого партнера (хто зайнятий, щоб переконати барменське безалкогольне пиво чудово) і посадити його приблизно в 10 метрах поруч. Телефон записує, а телефон також записує розмови старого клієнта, а також заважаючий хлопець із спорту. Береш власний телефон і починаєш також записувати з того місця, де ти стоїш. Приблизно через 15 хвилин ви їдете додому з двома записами: один зі свого місця, а другий приблизно з 10 метрів. Обидва записи містять вашого старого клієнта та містера Спорті,
- Ви сфотографуєте милу собаку лабрадора ретривера, яку бачите за вікном. Ви перевіряєте зображення, і, на жаль, ви бачите відображення у вікні, яке знаходиться між вами та собакою. Ви не можете відкрити вікно (так, так) і не можете вийти на вулицю, бо боїтесь, що він втече. Тож ви приймаєте (з незрозумілої причини) інше зображення, з дещо іншого положення. Ви все ще бачите віддзеркалення та собаку, але вони зараз перебувають у різних положеннях, оскільки ви фотографуєте з іншого місця. Також зауважте, що положення змінювалося рівномірно для кожного пікселя на зображенні, оскільки вікно плоске, а не увігнуте / опукло.
В обох випадках питання полягає в тому, як відновити розмову (в 1.) або образ собаки (в 2.), враховуючи два зображення, які містять однакові два "джерела", але з дещо різними відносними внесками від кожного . Звичайно, мій освічений онук може це зрозуміти!
Інтуїтивне рішення
Як ми можемо, принаймні в принципі, повернути образ собаки із суміші? Кожен піксель містить значення, які є сумою двох значень! Ну, якби кожен піксель був наданий без будь-яких інших пікселів, наша інтуїція була б правильною - ми б не змогли здогадатися про точний відносний внесок кожного з пікселів.
Однак нам дають набір пікселів (або моменти часу у випадку запису), які, як ми знаємо, мають однакові відносини. Наприклад, якщо на першому зображенні собака завжди вдвічі сильніше відбиття, а на другому зображенні - це якраз навпаки, то ми, можливо, зможемо отримати правильний внесок зрештою. І тоді ми можемо придумати правильний спосіб відняти два зображення під рукою, щоб відображення точно скасувалося! [Математично це означає знайти матрицю зворотної суміші.]
Занурившись у деталі
Y1=a11S1+a12S2Y2=a21S1+a22S2
S1Y1,Y2S1=b11Y1+b12Y2(b11,b12)S2(b21,b22)
Але як це знайти для загальних сигналів? вони можуть виглядати подібними, мати схожу статистику тощо. Отже, припустимо, вони незалежні. Це розумно, якщо у вас є заважаючий сигнал, наприклад, шум, або якщо два сигнали є зображеннями, сигнал, що перешкоджає, може бути відображенням чогось іншого (і ви зробили два зображення з різних ракурсів).
Y1Y2S1,S2X1,X2
X1,X2S1,S2X1,X2bij{aij}{bij}Si
{bij}X1,X2
Тому спочатку врахуйте це: якщо ми підсумуємо кілька незалежних, неауссівських сигналів, ми зробимо суму "більш гауссовою", ніж компоненти. Чому? завдяки центральній граничній теоремі, і ви також можете думати про щільність суми двох indep. змінні, що є згортанням густин. Якщо підсумувати кілька indep. Змінні Бернуллі, емпіричний розподіл буде все більше нагадувати форму Гаусса. Чи буде це справжнім гауссом? напевно, немає (каламбур не призначений), але ми можемо виміряти гауссова сигнал на величину, що нагадує розподіл Гаусса. Наприклад, ми можемо виміряти його надлишковий куртоз. Якщо він дійсно високий, він, ймовірно, менш гауссовий, ніж один із такою ж дисперсією, але із зайвим куртозом, близьким до нуля.
{bij}X1,X2{bij}
Звичайно, це додає ще одного припущення - для початку два сигнали повинні бути не гауссовими.