У мене є досвід в галузі комп’ютерного програмування та теорії елементарних чисел, але немає реального навчання статистиці, і нещодавно "виявив", що дивовижний світ цілого спектру методів - це насправді статистичний світ. Здається, що матричні факторизації, заповнення матриці, високі розмірні тензори, вбудовування, оцінка щільності, байесівські умовиводи, розділи Маркова, обчислення власного вектора, PageRank - все це високостатистичні методи, і що алгоритми машинного навчання, які використовують такі речі, використовують багато статистики .
Моя мета - вміти читати статті, які обговорюють подібні речі, та впроваджувати або створювати алгоритми, розуміючи при цьому позначення, "докази" та використовувані статистичні аргументи. Я думаю, що найважче - дотримуватися всіх доказів, які стосуються матриць.
Які основні документи можуть мене почати? Або хороший підручник з вправами, над якими варто опрацювати?
Зокрема, я хотів би повністю зрозуміти деякі документи:
- Точне завершення матриці за допомогою опуклої оптимізації, Candes, Recht, 2008
- Швидка трансформація Коші та швидша міцна лінійна регресія, Clarkson et al, 2013
- Випадкові прогнози для супровідних векторних машин, Paul et al, 2013
- Високомірна оцінка ймовірності з моделями глибокої щільності, Ріппель, Адамс, 2013
- Отримання оцінок з мінімізацією помилок та універсальних меж помилок при вступі для заповнення матриці низького рангу, Кіралі, Теран, 2013