Ти запитав:
у випадку, коли 𝑛 - 10 мільйонів, чи все ще працює гауссова процесова регресія?
Не в стандартному розумінні побудови та перетворення великої матриці. У вас є два варіанти: 1) вибрати іншу модель або 2) зробити наближення.
1) Деякі моделі на основі GP можна масштабувати до дуже великих наборів даних, наприклад, машина Байєсівського комітету, пов'язана у відповіді вище. Я вважаю цей підхід досить незадовільним: є вагомі причини для вибору моделі GP, і якщо ми переходимо до більш обчислюваної моделі, ми можемо не зберегти властивості вихідної моделі. Прогнозні дисперсії BCM сильно залежать, наприклад, від розбиття даних.
2) "Класичний" підхід до наближення в GP - це наближення матриці ядра. Тут є хороший огляд таких методів: http://www.jmlr.org/papers/volume6/quinonero-candela05a/quinonero-candela05a.pdf . Насправді ми зазвичай можемо бачити ці матричні наближення як наближення до моделей, а також зводити їх за допомогою апарату Байєсівського комітету: вони змінюють модель, і важко зрозуміти, коли ці зміни можуть бути патологічними. Ось чудовий огляд: https://papers.nips.cc/paper/6477-understanding-probabilistic-sparse-gaussian-process-approximations.pdf
Те, як я виступаю за те, щоб зробити наближення для великих GP, - це уникати наближення матриці ядра чи моделі та апроксимувати задній розподіл, використовуючи варіаційні умовиводи. Велика частина обчислень схожа на наближення матриці "низького рангу", але є одна дуже бажана властивість: чим більше ви використовуєте обчислень (тим більше "рангів"), тим наближення ближче до справжнього заднього, виміряне KL розбіжність.
Ці статті є гарною відправною точкою: http://proceedings.mlr.press/v5/titsias09a/titsias09a.pdf
https://arxiv.org/pdf/1309.6835
Я написав довшу статтю про той же аргумент тут: https://www.prowler.io/blog/sparse-gps-approximate-the-posterior-not-the-model
На практиці варіаційне наближення працює дуже добре у багатьох випадках. Я широко його використовував у реальних програмах. І останнім часом існує чудова теорія, яка підтверджує, чому це має працювати ( https://arxiv.org/abs/1903.03571 ).
Заключний модуль: варіаційний висновок в GP-програмах реалізований у gpflow ( https://github.com/GPflow/GPflow )