Основні переваги моделей Гаусса


11

Гаусський процес широко використовувався, особливо в емуляції. Відомо, що обчислювальний попит високий ( ).0(n3)

  1. Що робить їх популярними?
  2. Які їх основні та приховані переваги?
  3. Чому вони використовуються замість параметричних моделей (під параметричною моделлю я маю на увазі типову лінійну регресію, в якій різні параметричні форми можуть бути використані для опису вхідних та вихідних тенденцій; наприклад, qaudratic)?

Я б дуже вдячний за технічну відповідь, що пояснює притаманні властивості, які роблять процес Гаусса унікальним та вигідним


Чи можете ви уточнити, що ви маєте на увазі під параметричними моделями?
Олексій Зайцев

@ Алекс Я уточнив, що я маю на увазі під параметричною моделлю вище. Дякую
Wis

З того, що я припускаю щодо параметричних моделей, потрібно вказати модель вручну для кожної проблеми. Це не завжди можливо, оскільки справжня природа не завжди відома. Крім того, можуть бути складнощі з пристосуванням цих моделей, хоча для Гауссових процесів оцінка параметрів працює добре щоразу.
Олексій Зайцев

4
Шпонки та лінійна регресія еквівалентні регресії процесів Гаусса з обраною правильною функцією коваріації. Але гауссові процеси забезпечують зручну ймовірнісну рамку, добре підходить для багатьох завдань.
Олексій Зайцев

1
Коли б ви не використовували Гауссовий процес?
Альбі

Відповіді:


6

Основні переваги - з інженерної точки зору (як згадував @Alexey). У широко використовуваній процедурі Кріґінга ви можете інтерпретувати власний "простір", надаючи модель "кореляції" (або коваріації) (як правило, називається еліпсоїдом варіограми ) для відносин залежно від відстані та орієнтації.

Немає нічого, що не заважає іншим методологіям мати такі самі особливості, просто трапилось, що спосіб сформування кригінгу вперше був сприйнятий доброзичливим підходом до людей, які не були статистиками.

У наш час із зростанням стохастичних методологій, заснованих на геостатистиці, як-от Послідовне моделювання Гаусса серед інших , ці процедури застосовуються в галузях, де важливо визначити простір невизначеності (який може займати тисячі-мільйони вимірів). Знову ж таки, з інженерної точки зору, алгоритми на основі геостатистики дуже легко включати в генетичне програмування . Тому, коли у вас є зворотні проблеми, вам потрібно мати можливість протестувати декілька сценаріїв і перевірити їх пристосованість до вашої функції оптимізації.

Залишимо на мить чисту аргументацію констатувати факти сучасного реального прикладу такого використання. Можна або відібрати підземні зразки безпосередньо (жорсткі дані), або зробити сейсмічну карту надповерхівки (м'які дані).

У жорстких даних ви можете вимірювати властивість (скажімо, акустичний опір) безпосередньо без (ish) помилки. Проблема в тому, що це мало (і дорого). З іншого боку, у вас сейсмічне відображення - це буквально об'ємна, піксельна, карта підповерхні, але не дає акустичного опору. Скажімо, для простоти це дає співвідношення між двома значеннями акустичного опору (верхній і нижній). Таким чином, співвідношення 0,5 може бути поділом на 1000/2000 або 10 000/20 000. Це є простір з декількома рішеннями і кілька комбінацій будуть робити, але лише одна точно представляє реальність. Як ти це вирішуєш?

Те, як працює сейсмічна інверсія (стохастичні процедури), створюючи правдоподібні (і це вже інша історія разом) сценарії акустичного опору (або інших властивостей), перетворюють ці сценарії в синтетичну сейсмічну (як співвідношення в попередньому прикладі) та порівняйте синтетичну сейсміку з реальною (кореляція). Найкращі сценарії будуть використані для створення ще більше сценаріїв, перетворення їх у рішення (це не так просто, як здається).

Враховуючи це і кажучи з точки зору зручності використання, я відповів би на ваші запитання наступним чином:

1) Те, що робить їх популярними, - це зручність, гнучкість у впровадженні, велика кількість науково-дослідних центрів та установ, які продовжують робити новіші та більш пристосовані процедури, засновані на гауссі, для декількох різних областей (зокрема, в галузі геологічних наук, включаючи ГІС).

2) Основними перевагами , як було сказано раніше, зручність та гнучкість з моєї точки зору. Якщо вам легко маніпулювати, а користуватися просто, просто зробіть це. У гаусових процесах немає жодних особливостей, які не можна відтворити в інших методологіях (статистичних чи інших).

3) Вони використовуються, коли вам потрібно включити у вашу модель більше інформації, ніж просто дані (така інформація має просторові відносини, статистичні розподіли тощо). Я можу запевнити, що якщо у вас є багато даних із ізотропною поведінкою за допомогою крігінгу, це марна трата часу. Ви можете отримати ті ж результати, використовуючи будь-який інший метод, який, вимагаючи менше інформації, швидше працює.


І коли інша модель - кращий вибір?
Бен-

1
@Ben Це завжди залежатиме від тематичного дослідження. Крігінг або методи, що базуються на Кригінгу, мають високу вартість обчислень (так, не швидко). Наприклад, сучасні телевізори 4 к (або більше) використовують методи інтерполяції, щоб спробувати покращити вміст, який було зроблено для меншої роздільної здатності. Це означає, що їй потрібно виконувати цю операцію швидко і без втручання користувача (що вимагатиме коваріаційної моделі). Якби я вирішив цю конкретну проблему, я б взагалі уникав Кригінга. Більше того, деякі явища базуються на шаблоні, або мають дискретну змінну, або можуть бути зведені до формули (наприклад, FEM) тощо.
armatita

А коли швидкість не важлива?
Бен

@Ben Швидкість менш важлива, якщо ваш результат не потребує негайної дії. Моделювання надземних поверхонь, прогнозування погоди та купа операцій в науках про ГІС - лише кілька прикладів. Інший - той, який представлений у відповіді (сейсмічна інверсія).
арматита

Вибачте, цього не зрозумів. Ні обчислювальна, ні швидкість результатів не мають значення, які недоліки загальної практики? Або іншими словами: чи не слід його використовувати набагато частіше?
Ben

7

Для інженерів важливо:

  • мати довірчі інтервали для прогнозів
  • інтерполювати дані про навчання
  • мати плавні та нелінійні моделі
  • використовувати отримані регресійні моделі для адаптивного проектування експериментів та оптимізації

Гауссові процеси відповідають усім цим вимогам.

Більше того, часто інженерні та геостатистичні набори даних не такі великі або мають специфічну структуру сітки, що дозволяє швидко робити висновки.


1
Дякую за Ваш коментар Мабуть, завдяки їхній байєсівській інтерпретації моделі гаусових процесів можуть мати хорошу кількісну оцінку невизначеності, однак це також можливо при параметричній регресії. Я шукаю технічний підхід, який може пояснити набір статистичних переваг
Wis

3

Переваги моделі Гаусса.

Гауссовий PDF залежить лише від моменту його першого та другого порядку. Стаціонарний процес Гаусса широкого сенсу також є стаціонарним процесом суворого сенсу і навпаки.

Гауссові PDF-файли можуть моделювати розподіл багатьох процесів, включаючи деякі важливі класи сигналів та шуму. Сума багатьох незалежних випадкових процесів має розподіл Гаусса (центральна гранична теорема).

Негауссові процеси можна наблизити зваженою комбінацією (тобто сумішшю) ряду гауссових pdfs відповідних засобів та варіацій.

Оптимальні методи оцінки на основі Гауссових моделей часто призводять до лінійних та математично простежуваних рішень.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.