(Дуже) новела
Коротка довга історія, в деякому сенсі, статистика подібна до будь-якої іншої технічної галузі: Швидкої траси немає .
Довга історія
Програми ступінь бакалавра зі статистики порівняно рідкісні в США Однією з причин, на яку я вважаю, що це правда, є те, що досить важко упакувати все необхідне, щоб добре вивчити статистику в бакалавратську програму. Особливо це стосується університетів, які мають значні загальноосвітні вимоги.
Розвиток необхідних навичок (математичних, обчислювальних та інтуїтивних) вимагає чимало зусиль та часу. Статистику можна почати розуміти на досить гідному "операційному" рівні, як тільки студент засвоїв обчислення і пристойну кількість лінійної та матричної алгебри. Однак будь-який прикладний статистик знає, що знайти себе на території, яка не відповідає печиво для вирішення файлів cookie чи підходу до статистики, є досить просто. Щоб реально зрозуміти, що відбувається під поверхнею, потрібно як необхідна умоваматематичної та, в сучасному світі, обчислювальної зрілості, які реально досягти лише в наступні роки навчання в бакалавраті. Це одна з причин того, що справжня статистична підготовка здебільшого розпочинається на рівні МС у США (Індія, присвячений ISI - дещо інша історія. Аналогічний аргумент може бути зроблений і для канадської освіти на базі Канади. Я недостатньо знайомий з цим Бакалаврська статистика на базі європейських чи російських мов, щоб мати усвідомлену думку.)
Практично будь-яка (цікава) робота вимагатиме освіти на рівні MS, а справді цікаві (на мою думку) роботи по суті потребують освіти на рівні доктора.
Бачачи, як ви маєте докторський ступінь з математики, хоча ми не знаємо в якій галузі, ось мої пропозиції щодо чогось ближчого до рівня освіти на рівні MS. Я включаю кілька думок із зауваженнями, щоб пояснити вибір.
- Д. Хафф, як брехати зі статистикою . (Дуже швидко, легко читається. Показує багато концептуальних ідей та підводних каменів, зокрема, в представленні статистики для мирян.)
- Mood, Graybill and Boes, Вступ до теорії статистики , 3-е видання, 1974 р. (Вступ на рівні MS до теоретичної статистики. Ви дізнаєтесь про розподіл вибірки, оцінку точок та тестування гіпотез у класичному, частоватистському рамках. Мій Думка полягає в тому, що це, як правило, краще і трохи просунутіше, ніж сучасні аналоги, такі як Casella & Berger або Rice.)
- Себер і Лі, лінійний регресійний аналіз , 2-е видання. (Викладає теорію за оцінкою точок та тестуванням гіпотез для лінійних моделей, що, мабуть, найважливіша тема, яку слід зрозуміти у прикладній статистиці. Оскільки ви, мабуть, маєте хороший фон лінійної алгебри, вам слід негайно зрозуміти, що відбувається геометрично , що забезпечує багато інтуїції. Також є хороша інформація, що стосується питань оцінки при виборі моделі, відхилень від припущень, прогнозування та надійних версій лінійних моделей.)
- Хасті, Тібшірані та Фрідман, Елементи статистичного навчання , 2-е видання, 2009. (Ця книга має набагато більше прикладних відчуттів, ніж остання, і широко охоплює безліч сучасних тем машинного навчання. Основний внесок тут - надання статистичних інтерпретацій багатьох машин навчання ідей, які окупаються в зокрема , в кількісної невизначеності в таких моделях. Це те , що має тенденцію до ип (дер) відбитим в типових книгах машинного навчання. Юридично доступні безкоштовно тут .)
- А. Агресті, категоричний аналіз даних , 2-е видання. (Хороша презентація того, як поводитися з дискретними даними в статистичних рамках. Хороша теорія та хороші практичні приклади. Можливо, з традиційного боку в деяких аспектах.)
- Boyd & Vandenberghe, Опукла оптимізація . (Багато найпопулярніших сучасних статистичних оцінок та тестування гіпотез можуть бути сформульовані як проблеми з опуклою оптимізацією. Це також стосується численних методів машинного навчання, наприклад, SVM. є дуже цінним, я думаю. Юридично доступний безкоштовно тут .)
- Ефрон і Тібшірані, вступ до завантажувальної програми . (Ви повинні, принаймні, бути знайомими з завантажувальним інструментом і відповідними техніками. Для підручника - це швидко і легко прочитати.)
- Дж. Лю, Стратегії Монте-Карло в науковому обчисленні або П. Глассерман, Методи Монте-Карло в галузі фінансового інжинірингу . (Останнє звучить дуже спрямовано на певну область застосування, але я думаю, це дасть хороший огляд та практичні приклади всіх найважливіших методів. Застосування фінансового інжинірингу призвело до значної кількості досліджень Монте-Карло протягом останнього десятиліття або близько того .)
- Е. Туфте, Візуальне відображення кількісної інформації . (Хороша візуалізація та подання даних [сильно] недооцінюється навіть статистиками.)
- Дж. Тукі, Дослідницький аналіз даних . (Стандарт. Олді, але добрі. Дехто може сказати, що застарів, але все ж варто подивитися.)
Доповнення
Ось деякі інші книги, переважно трохи більш досконалі, теоретичного та / або допоміжного характеру, які є корисними.
- Ф. А. Грейбілл, теорія та застосування лінійної моделі . (Старомодний, жахливий набір, але охоплює все те саме Себер і Лі та інше. Я кажу, що старомодний, тому що більш сучасні методи лікування, ймовірно, мають тенденцію використовувати SVD для уніфікації та спрощення багатьох методів і доказів.)
- Ф. А. Грейбілл, матриці з додатками в статистиці . (Супровідний текст до вищевказаного. Багаття хорошої матричної алгебри дає корисні статистичні дані тут. Чудова посилання на бюро.)
- Девроє, Дьорфі та Лугосі, ймовірнісна теорія розпізнавання образів . (Суворий та теоретичний текст щодо кількісної оцінки результативності класифікаційних проблем.)
- Броквелл і Девіс, часовий ряд: теорія та методи . (Класичний аналіз часових рядів. Теоретичне лікування. Для більш застосованих текстів тексти Box, Jenkins & Reinsel або Ruey Tsay є пристойними.)
- Мотвані та Рагаван, рандомізовані алгоритми . (Імовірнісні методи та аналіз обчислювальних алгоритмів.)
- Д. Вільямс, Вірогідність та Мартингейли та / або Р. Дюррет, Вірогідність: теорія та приклади . (Якщо ви бачили теорію вимірювань, скажімо, на рівні DL Cohn, але, можливо, це не теорія ймовірностей. І те й інше добре для швидкої швидкості, якщо ви вже знаєте теорію вимірювань.)
- Ф. Харрелл, стратегії регресійного моделювання . (Не настільки добре, як елементи статистичного навчання [ESL], але має інше, і цікаве, взяти на себе речі. Більше "традиційних" прикладних тем статистики охоплює, ніж ESL, і про це варто точно знати.)
Більш розширені тексти (докторантура)
Леманн і Казелла, Теорія оцінки точок . (Лікування балів на рівні доктора наук. Частина завдання цієї книги полягає в тому, щоб прочитати її та зрозуміти, що таке друкарська помилка, а що ні. Коли ви побачите, як швидко розпізнаєте їх, ви зрозумієте, що розумієте. Існує багато практики такого типу там, особливо якщо ви занурилися в проблеми.)
Леман і Романо, випробування статистичних гіпотез . (Лікування гіпотез на рівні доктора наук. Не стільки друкарських помилок, скільки TPE вище.)
А. ван дер Ваарт, Асимптотична статистика . (Прекрасна книга про асимптотичну теорію статистики з хорошими підказками щодо областей застосування. Хоча це не застосована книга. Моя єдина спітка - це те, що використовуються деякі досить химерні позначення, а деталі часом зібрані під килим.)