Довідковий запит: Класична статистика для працюючих науковців


10

Я працюючий науковець з великим досвідом регресії, інших алгоритмів машинного навчання та програмування (як для аналізу даних, так і для загальної розробки програмного забезпечення). Більшу частину мого трудового життя було зосереджено на побудові моделей для прогнозування точності (робота в різних бізнес-обмеженнях) та побудові трубопроводів даних для підтримки моєї власної (та інших) роботи.

У мене немає офіційної підготовки зі статистики, моя університетська освіта зосереджена на чистій математиці. Як таке, ми пропустили вивчення багатьох класичних тем, особливо різних популярних тестів на гіпотези та інфекційних методів.

Чи є посилання на ці теми, які б підходили для когось із мого досвіду та рівня досвіду? Я можу впоратися (і оцінити) математичну суворість, а також насолоджуватися алгоритмічними перспективами. Я, як правило, люблю посилання, які пропонують читачеві керуватися вправами, з обома (або будь-якими) математичними та (або) фокусами програмування.


2
Як ще один Метт з математики, зі знанням статистики, заповнений пробілами, я можу співвіднести! Чи є якісь сфери / програми, які вас цікавлять? Одне, на що слід стежити за класичною статистикою, - які припущення використовуються.
GeoMatt22

5
Тут є кілька хороших посилань: mathoverflow.net/questions/31655/statistics-for-mathematicians
Алекс Р.

Відповіді:


3

« Вся статистика» Ларрі Вассермана - це приємна книга для того, щоб отримати екскурсію з математичної статистики. Це була перша книга з математичної статистики, якою я користувався сам. Він включає класику, як тестування гіпотез і максимальну оцінку ймовірності, але також має достатньо висвітлення останніх розроблених, але не менш важливих тем, таких як завантаження. Васерман завжди має одну ногу в статистиці, а іншу - в машинному навчанні, що, на мою думку, повинні робити всі сучасні аналітики даних; якщо ви знайомі лише з одним із двох полів, ви будете багато бракувати. Також у книзі багато хороших вправ.

Якщо у вас є досвід роботи в реальному аналізі , і ви хочете , сировина, режисерський матеріал, з допомогою якого я маю в виду заходи теоретико-обробку ймовірності і статистики, спробуйте Марк Дж Schervish по теорії статистики . Schervish - це половина DeGroot та Schervish, чия менш технічна книга " Імовірність і статистика" - чи не найпопулярніша книга з математичної статистики сьогодні. Теорія статистики - корисна розмовна книга на тему, яка зазвичай зарезервована для аспірантів, які повинні виконати всю роботу самостійно. Якщо чесно сказати, мені ця книга виявилася дуже важкою (хоча не такою важкою, як математична статистика Джуна Шао) і, врешті-решт, відчули величезні зусилля, необхідні для освоєння, це не вдало використало мій час як прикладного аналітика даних. Але я все-таки багато чого навчився і пішов з хорошим розумінням того, що таке теорія мір і як її можна використовувати для очищення волохатих теоретичних труднощів, які виникають при більш наївному традиційному підході до теорії ймовірностей. Я також став краще оцінювати схожість та відмінності обмінності та незалежності.


2

Окрім дуже хороших пропозицій Кодіолога (+1) я також рекомендував би переглянути предмет спостережних досліджень . Я думаю, що це дуже неприйнятне поле між науковцями даних, незважаючи на те, що у багатьох випадках аналізовані дані мають спостережний характер. Я думаю, це тому, що основна частина бібліографії (особливо в біостатистиці) передбачає, що хоча б якась квазіекспериментальна конструкція вже існує. Книги Пола Розенбаума « Спостережні дослідження та дизайн обсерваційних досліджень» - одні з найпоширеніших посилань.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.