Основні статті про матричні декомпозиції


18

Нещодавно я прочитав книгу Skillicorn про матричні розклади та був трохи розчарований, оскільки був орієнтований на студентську аудиторію. Я хотів би скласти (для себе та інших) коротку бібліографію істотних статей (опитування, але також проривні статті) про матричні розклади. Я маю на увазі насамперед щось на SVD / PCA (і надійні / розріджені варіанти) та NNMF, оскільки вони, безумовно, найбільш використовувані. У вас є якісь рекомендації / пропозиції? Я тримаю своє, щоб не упереджувати відповіді. Я б просив обмежити кожну відповідь 2-3 статтями.

PS: Ці два розклади я називаю найбільш використовуваними в аналізі даних . Звичайно, QR, Холеський, LU і полярний дуже важливі в числовому аналізі. Але це не в центрі уваги мого питання.

Відповіді:


16

Звідки ви знаєте, що SVD та NMF на сьогодні є найбільш часто використовуваними матричними декомпозиціями, а не LU, Cholesky та QR? Мій особистий улюблений "прорив" повинен бути гарантованим QR-алгоритмом, що розкриває рейтинг,

  • Чан, Тоні Ф. "Ранг, що виявляє QR-фактори". Лінійна алгебра та її застосування Томи 88-89, квітень 1987, Сторінки 67-82. DOI: 10.1016 / 0024-3795 (87) 90103-0

... розробка попередньої ідеї QR з обертанням стовпців:

  • Бусінгер, Пітер; Голуб, Джин Х. (1965). Лінійні розв'язки найменших квадратів шляхом перетворень домочадців. Numerische Mathematik том 7, номер 3, 269-276, DOI: 10.1007 / BF01436084

A ( ?) Класичний підручник:

  • Голуб, Гена Н .; Ван Кредит, Чарльз Ф. (1996). Матричні обчислення (3-е видання), Джон Хопкінс, ISBN 978-0-8018-5414-9 .

(я знаю, що ви не просили підручників, але я не можу чинити опір)

Редагувати: Трохи більше гуглінг знаходить папір, анотація дозволяє припустити, що ми можемо трохи перехреститися. Мій вище текст надходив з точки зору "числової лінійної алгебри" (NLA); можливо, ви більше стурбовані перспективою "прикладної статистики / психометрії" (AS / P)? Не могли б ви уточнити?


2
Я б сказав "підручник" сам, з близькими секундами " Матричні алгоритми" Стюарта ( обидві частини ). Я б сам подав список першопрохідних паперів, але ОП дійсно повинен пояснити, чи хоче він точки зору чисельності чи точки зору статистики (я можу допомогти з першою, але не стільки з останньою).
JM не є статистиком

1
+1 для Голуба та Ван Позики. І так, остаточна стаття доречна.
shabbychef

2
Я редагував своє запитання, щоб уточнити, що я зосереджуюсь на частині статистики. Я погоджуюся з усіма, що Голуб та Ван Кредит - це стандартне посилання на матричні декомпозиції. Але це тема про дуже масштабне розкладання через випадкові прогнози. Документ для опитування, який я помістив би у свій список, - «Пошук структури з випадковістю: стохастичні алгоритми побудови наближених матричних декомпозицій» Халько та ін.
гаппі

4

Для NNMF Лі та Seung описують ітеративний алгоритм, який дуже просто здійснити. Насправді вони дають два аналогічних алгоритми, один для мінімізації норми Фробеніуса залишкового, інший для мінімізації дивергенції Кулбека-Лейблера наближення та оригінальної матриці.


3

Можливо, ви можете знайти цікаве

  1. [Навчання за допомогою матричних чинників] Кандидатська дисертація Натана Сребро,
  2. [Дослідження різних методів факторизації матриць для великих систем рекомендування] , Gábor Takács et.al. і майже та сама техніка, описана тут

Останні два посилання показують, як розріджені матричні факторизації використовуються при спільній фільтрації. Однак я вважаю, що алгоритми факторизації, подібні до SGD, можуть бути корисні ще десь (принаймні, їх надзвичайно просто кодувати)


2

Віттен, Тібшірані - Розкладання матричної матриці

http://www.biostat.washington.edu/~dwitten/Papers/pmd.pdf

http://cran.r-project.org/web/packages/PMA/index.html

Martinsson, Rokhlin, Szlam, Tygert - Randomized SVD

http://cims.nyu.edu/~tygert/software.html

http://cims.nyu.edu/~tygert/blanczos.pdf


5
Спасибі. Я знаю обидва документи. Я не є великим прихильником Віттена [не Уіттена] та ін., Оскільки, на мою думку, є більш важливі статті про рідкісні розклади. У рандомізованому SVD мені особливо подобається оглядовий документ "Пошук структури з випадковістю: стохастичні алгоритми побудови наближених матричних декомпозицій" ( arxiv.org/abs/0909.4061 ), співавтором якого є Martinsson.
гаппі

я згоден. Я просто викладав там 2 документи, про яких ніхто не згадав.
pslice

2

Цьогоріч у NIPS з'явився короткий документ про розподілений, дуже масштабний SVD, який працює за один прохід над потоковою вхідною матрицею .

Стаття більш орієнтована на реалізацію, але вона ставить перспективу в реальному часі настінних годин. Таблиця на початку також є хорошим опитуванням.


Що означає NIPS?
onestop

Додано посилання @onestop. NIPS = Нейронні системи обробки інформації. Це спільнота (а не система :)). Але піск говорить про конференцію NIPS 2010.
Робін Жирард
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.