Математик бажає еквівалентних знань до рівня статистики якості


77

Я знаю, що люди люблять закривати дублікати, тому я не прошу посилання почати вивчати статистику (як тут ).

Я маю докторську ступінь з математики, але ніколи не вивчав статистику. Який найкоротший шлях до еквівалентних знань до найвищого ступеня статистики BS і як я вимірюю, коли я досяг цього.

Якщо переліку книг буде достатньо (якщо припустити, що я виконую вправи), це приголомшливо. Так, я очікую, що розробка проблем буде невід'ємною частиною її вивчення, але я хочу максимально реально відстежувати. Я не шукаю шалено жорсткого поводження, якщо тільки це не є частиною того, що загалом вивчають статистичні спеціальності.


1
в якій галузі математики ви отримали ступінь доктора? Це може бути актуальним.
mpiktas

7
Чи можете ви поділитися з нами, чому ви хочете дізнатися статистику? Цікавість? Потрібен для проекту чи дослідження? Бажаєте змінити роботу? Вам потрібно викладати деякі курси? Хочете співпрацювати зі статистиками як теоретична особа?
whuber

5
Я думаю, що майже завжди важливо також розробити доменний досвід. Дуже багато статистики вивчають моделі, що відповідають конкретним напрямкам.
Трістан

10
Спробуйте повернути назад "статистик хоче еквівалентних знань за якістю математики" - швидше за все, швидких маршрутів не буде.
ймовірністьлогічний

1
"Я знаю, що люди люблять закривати дублікати" змусив мене сміятися.
Мустафа S Еїза

Відповіді:


77

(Дуже) новела

Коротка довга історія, в деякому сенсі, статистика подібна до будь-якої іншої технічної галузі: Швидкої траси немає .

Довга історія

Програми ступінь бакалавра зі статистики порівняно рідкісні в США Однією з причин, на яку я вважаю, що це правда, є те, що досить важко упакувати все необхідне, щоб добре вивчити статистику в бакалавратську програму. Особливо це стосується університетів, які мають значні загальноосвітні вимоги.

Розвиток необхідних навичок (математичних, обчислювальних та інтуїтивних) вимагає чимало зусиль та часу. Статистику можна почати розуміти на досить гідному "операційному" рівні, як тільки студент засвоїв обчислення і пристойну кількість лінійної та матричної алгебри. Однак будь-який прикладний статистик знає, що знайти себе на території, яка не відповідає печиво для вирішення файлів cookie чи підходу до статистики, є досить просто. Щоб реально зрозуміти, що відбувається під поверхнею, потрібно як необхідна умоваматематичної та, в сучасному світі, обчислювальної зрілості, які реально досягти лише в наступні роки навчання в бакалавраті. Це одна з причин того, що справжня статистична підготовка здебільшого розпочинається на рівні МС у США (Індія, присвячений ISI - дещо інша історія. Аналогічний аргумент може бути зроблений і для канадської освіти на базі Канади. Я недостатньо знайомий з цим Бакалаврська статистика на базі європейських чи російських мов, щоб мати усвідомлену думку.)

Практично будь-яка (цікава) робота вимагатиме освіти на рівні MS, а справді цікаві (на мою думку) роботи по суті потребують освіти на рівні доктора.

Бачачи, як ви маєте докторський ступінь з математики, хоча ми не знаємо в якій галузі, ось мої пропозиції щодо чогось ближчого до рівня освіти на рівні MS. Я включаю кілька думок із зауваженнями, щоб пояснити вибір.

  1. Д. Хафф, як брехати зі статистикою . (Дуже швидко, легко читається. Показує багато концептуальних ідей та підводних каменів, зокрема, в представленні статистики для мирян.)
  2. Mood, Graybill and Boes, Вступ до теорії статистики , 3-е видання, 1974 р. (Вступ на рівні MS до теоретичної статистики. Ви дізнаєтесь про розподіл вибірки, оцінку точок та тестування гіпотез у класичному, частоватистському рамках. Мій Думка полягає в тому, що це, як правило, краще і трохи просунутіше, ніж сучасні аналоги, такі як Casella & Berger або Rice.)
  3. Себер і Лі, лінійний регресійний аналіз , 2-е видання. (Викладає теорію за оцінкою точок та тестуванням гіпотез для лінійних моделей, що, мабуть, найважливіша тема, яку слід зрозуміти у прикладній статистиці. Оскільки ви, мабуть, маєте хороший фон лінійної алгебри, вам слід негайно зрозуміти, що відбувається геометрично , що забезпечує багато інтуїції. Також є хороша інформація, що стосується питань оцінки при виборі моделі, відхилень від припущень, прогнозування та надійних версій лінійних моделей.)
  4. Хасті, Тібшірані та Фрідман, Елементи статистичного навчання , 2-е видання, 2009. (Ця книга має набагато більше прикладних відчуттів, ніж остання, і широко охоплює безліч сучасних тем машинного навчання. Основний внесок тут - надання статистичних інтерпретацій багатьох машин навчання ідей, які окупаються в зокрема , в кількісної невизначеності в таких моделях. Це те , що має тенденцію до ип (дер) відбитим в типових книгах машинного навчання. Юридично доступні безкоштовно тут .)
  5. А. Агресті, категоричний аналіз даних , 2-е видання. (Хороша презентація того, як поводитися з дискретними даними в статистичних рамках. Хороша теорія та хороші практичні приклади. Можливо, з традиційного боку в деяких аспектах.)
  6. Boyd & Vandenberghe, Опукла оптимізація . (Багато найпопулярніших сучасних статистичних оцінок та тестування гіпотез можуть бути сформульовані як проблеми з опуклою оптимізацією. Це також стосується численних методів машинного навчання, наприклад, SVM. є дуже цінним, я думаю. Юридично доступний безкоштовно тут .)
  7. Ефрон і Тібшірані, вступ до завантажувальної програми . (Ви повинні, принаймні, бути знайомими з завантажувальним інструментом і відповідними техніками. Для підручника - це швидко і легко прочитати.)
  8. Дж. Лю, Стратегії Монте-Карло в науковому обчисленні або П. Глассерман, Методи Монте-Карло в галузі фінансового інжинірингу . (Останнє звучить дуже спрямовано на певну область застосування, але я думаю, це дасть хороший огляд та практичні приклади всіх найважливіших методів. Застосування фінансового інжинірингу призвело до значної кількості досліджень Монте-Карло протягом останнього десятиліття або близько того .)
  9. Е. Туфте, Візуальне відображення кількісної інформації . (Хороша візуалізація та подання даних [сильно] недооцінюється навіть статистиками.)
  10. Дж. Тукі, Дослідницький аналіз даних . (Стандарт. Олді, але добрі. Дехто може сказати, що застарів, але все ж варто подивитися.)

Доповнення

Ось деякі інші книги, переважно трохи більш досконалі, теоретичного та / або допоміжного характеру, які є корисними.

  1. Ф. А. Грейбілл, теорія та застосування лінійної моделі . (Старомодний, жахливий набір, але охоплює все те саме Себер і Лі та інше. Я кажу, що старомодний, тому що більш сучасні методи лікування, ймовірно, мають тенденцію використовувати SVD для уніфікації та спрощення багатьох методів і доказів.)
  2. Ф. А. Грейбілл, матриці з додатками в статистиці . (Супровідний текст до вищевказаного. Багаття хорошої матричної алгебри дає корисні статистичні дані тут. Чудова посилання на бюро.)
  3. Девроє, Дьорфі та Лугосі, ймовірнісна теорія розпізнавання образів . (Суворий та теоретичний текст щодо кількісної оцінки результативності класифікаційних проблем.)
  4. Броквелл і Девіс, часовий ряд: теорія та методи . (Класичний аналіз часових рядів. Теоретичне лікування. Для більш застосованих текстів тексти Box, Jenkins & Reinsel або Ruey Tsay є пристойними.)
  5. Мотвані та Рагаван, рандомізовані алгоритми . (Імовірнісні методи та аналіз обчислювальних алгоритмів.)
  6. Д. Вільямс, Вірогідність та Мартингейли та / або Р. Дюррет, Вірогідність: теорія та приклади . (Якщо ви бачили теорію вимірювань, скажімо, на рівні DL Cohn, але, можливо, це не теорія ймовірностей. І те й інше добре для швидкої швидкості, якщо ви вже знаєте теорію вимірювань.)
  7. Ф. Харрелл, стратегії регресійного моделювання . (Не настільки добре, як елементи статистичного навчання [ESL], але має інше, і цікаве, взяти на себе речі. Більше "традиційних" прикладних тем статистики охоплює, ніж ESL, і про це варто точно знати.)

Більш розширені тексти (докторантура)

  1. Леманн і Казелла, Теорія оцінки точок . (Лікування балів на рівні доктора наук. Частина завдання цієї книги полягає в тому, щоб прочитати її та зрозуміти, що таке друкарська помилка, а що ні. Коли ви побачите, як швидко розпізнаєте їх, ви зрозумієте, що розумієте. Існує багато практики такого типу там, особливо якщо ви занурилися в проблеми.)

  2. Леман і Романо, випробування статистичних гіпотез . (Лікування гіпотез на рівні доктора наук. Не стільки друкарських помилок, скільки TPE вище.)

  3. А. ван дер Ваарт, Асимптотична статистика . (Прекрасна книга про асимптотичну теорію статистики з хорошими підказками щодо областей застосування. Хоча це не застосована книга. Моя єдина спітка - це те, що використовуються деякі досить химерні позначення, а деталі часом зібрані під килим.)


1
@cardinal, колишні радянські університети мають окремі студії бакалавратської статистики. Наприклад, у Вільнюському університеті ви можете отримати ступінь бакалавра зі статистики. З того, що я бачу зі студентами, я від усієї думки погоджуюся, що для цікавих робіт потрібна освіта на рівні магістра або навіть доктора.
mpiktas

1
+

2
@John Salvatier, ви праві, що ці методи не висвітлені в цьому тексті. Знову ж таки, це вражає мене як питання смаку, тим більше, що основна увага тексту не на алгоритмах. На думку, ваші занепокоєння безпосередньо вирішуються авторами у вступі (стор. 13).
кардинал

2
@cardinal: Скандинавські університети зазвичай пропонують також ступінь бакалаврів. Попри це, я думаю, що статистики ставляться до себе занадто серйозно. Я не погоджуюся, що вам знадобиться ступінь доктора, щоб отримати "цікаву" роботу. Я вважаю, що в міру розвитку науки і досліджень все більше і більше накладається міждисциплінарна статистика для досліджень з багатьох різних областей. Половина статей про журнали з високим впливом мають деякий сумнівний статистичний аналіз для задоволення потреб, хоча це може не мати ніякого сенсу, викладене в оригінальному контексті / області проблеми.
posdef

1
Книга @cardinal Mood була чудовою пропозицією, оскільки сьогодні важко знайти вступну книгу зі статистики, яка є достатньо формальною для тих, хто має математичний досвід. Хтось читав цю книгу нову книгу? Панатерос, "Статистика для математиків" springer.com/us/book/9783319283395
Ігор Фобія

11

Я не можу виступати за більш жорсткі школи, але я займаюся науковою роботою з загальної статистики (найсуворішою в моїй школі) в Каліфорнійському університеті, штат Девіс, і є досить велика залежність від суворості та деривації. Докторський ступінь математики буде корисним, оскільки у вас буде дуже сильний досвід у реальному аналізі та лінійній алгебрі - корисні навички статистики. У моїй статистичній програмі близько 50% курсових робіт на підтримку основ (лінійна алгебра, реальний аналіз, обчислення, ймовірність, оцінка), а інші 50% спрямовані на спеціалізовані теми, що спираються на основи (непараметрика, обчислення, ANOVA / Регресія, часовий ряд, байєсівський аналіз).
Як тільки ви отримаєте основи, перейти до конкретики, як правило, не надто складно. Більшість людей у ​​моїх заняттях борються з доказами та реальним аналізом та легко розуміють статистичні поняття, тому вихід з математичного фону, безумовно, допоможе. Незважаючи на це, наступні два тексти досить добре висвітлюють багато тем, що охоплюються статистикою. До речі, обидва були рекомендовані у наданому вами посиланні, тому я б не сказав, що ваше запитання, а те, що ви пов’язали, обов'язково не пов’язане між собою.

Математичні методи статистики , Харальд Креймер

Вся статистика: Короткий курс зі статистичних висновків , Ларрі Вассерман


3
+1 Вся статистика: це було б чудове місце для початку.
Саймон Берн

1
програма UC-Davis виглядає добре, і я думаю, ви отримаєте чудову освіту там. Я б не вважав це "менш суворим", ніж інші місця. Я думав , що коментар про «ступенях інтегровані BS / MS» сторінці був цікаво і ставленням до теми: «Існує високий попит на статистики, але знання і вміння досягається тим , зі ступенем бакалавра в статистиці часто недостатньо для потреби на робочому місці [уряду чи промисловості] ".
кардинал

9

Королівське статистичне товариство у Великобританії пропонує диплом випускника зі статистики, який є на рівні хорошого ступеня бакалавра. На їхньому веб-сайті можна ознайомитись з навчальним планом, списком читання та попередніми статтями . Я знаю, що математики використовують це, щоб досягти швидкості в статистиці. Здача іспитів (офіційно або в комфорті вашого власного навчання) може бути корисним способом оцінити, коли ви там.


3
Екзамени на випускник є фактично завершальними іспитами на бакалаврат; для "постановочних" цілей існують сертифікати нижчого рівня, які можна прийняти першими. Екзамени на RSS доступні, якщо я правильно пам'ятаю, у всьому світі, за винятком Гонконгу (який має власне статистичне суспільство та іспити). Альтернативою є диплом бакалавра зі статистики, пропонований дистанційним навчанням у Відкритому університеті у Великобританії, але знову доступний у всьому світі. Це дещо нижчий рівень, ніж RSS Grad Dip, тому може розглядатися як підготовка до цього. Як викладений курс, це значно дорожче.
Срібна рибка

5

Я заходжу на веб-сайти навчальних програм найкращих шкіл статистики, записую книги, які вони використовують у своїх курсах з низької кваліфікації, бачу, які з них мають високу оцінку на Amazon, і замовляю їх у вашій публічній / університетській бібліотеці.

Деякі школи враховують:

Доповнюйте тексти різними веб-сайтами для лекцій, такими як MIT OCW та videolectures.net.

У Caltech немає ступеня низького рівня статистики, але ви не помилитесь, дотримуючись навчальних програм їх курсів з нижчої статистики.


1
це здається чимось дивним списком. Наскільки мені відомо, Карнегі Меллон - єдина школа в цьому списку, яка (формально) пропонує ступінь бакалавра зі статистики. Ні Caltech, ні MIT навіть не мають випускних програм зі статистики.
кардинал

@cardinal. чому ти повинен сумніватися в мені? :) Я посилаюся на курси статистики нижчих курсів у цих чудових установах. Крім того, курси змішування та узгодження з кращих шкіл будуть вибиватися за ступенем гіршої школи.
Ніл МакГуйган

2
OCW, безумовно, дуже чудовий ресурс та чудова ініціатива. Це не викликає сумнівів. Щодо вашого твердження, що змішування та узгодження з "кращих шкіл" є чудовим рішенням, я вважаю, що це дуже підозріло, особливо для студентів. Незважаючи на те, що високомотивований студент зобов'язаний отримати дуже хорошу бакалаврську освіту в будь-якій із цих шкіл, нижчу освіту як хорошу чи кращу можна знайти у багатьох, у багатьох "гірших" школах. Шкіли, такі, як ви перераховуєте, як правило, «виграють» для здобуття вищої освіти, я б сказав.
кардинал

2
Власне, це було перше, що я спробував. Я спробував це, перш ніж ставити запитання. Знайти список курсів було не важко, але знайти інформацію про те, які книги насправді звикли до цих курсів та які розділи цих книг були охоплені, було набагато складніше.
Джон Робертсон

3

Я бачив статистичні умовиводи Сілві, використовувані математиками, які потребували певного розуміння статистики в робочий день. Це невелика книга, і по праву повинна бути дешевою. Дивлячись на http://www.amazon.com/Statistic-Inference-Monographs-Statistics-Probability/dp/0412138204/ref=sr_1_1?ie=UTF8&s=books&qid=1298750064&sr=1-1 , це здається дешевим вживаним.

Він старий і концентрується на класичній статистиці. Хоча це не дуже абстрактно, він призначений для досить математичної аудиторії - багато вправ - з диплома Кембридж (Великобританія) з математичної статистики, який в основному є магістратом.


3

Щодо вимірювання ваших знань: Ви можете відвідувати деякі змагання з аналізу даних / аналізу даних, наприклад, 1 , 2 , 3 , 4 , і бачити, як ви оцінюєте порівняно з іншими.

У відповідях є багато вказівників на підручники з математичної статистики. Я хотів би додати як відповідні теми:

  • емпіричний компонент соціальних досліджень, який включає теорію вибірки, соціально-демографічні та регіональні стандарти
  • управління даними, що включає нове відомості про бази даних (написання запитів SQL, загальні схеми баз даних)
  • спілкування, як представити результати таким чином, щоб аудиторія залишалася неспаною (методи візуалізації)

Відмова: Я не статистик, це лише мої 2 відсотки


3

Е. Т. Джейнс "Теорія ймовірностей: Логіка науки: принципи та елементарне застосування", том 1 ", Кембриджський університетський прес, 2003 р. Є майже обов'язковим для читання байєсівської сторони статистики приблизно на потрібному рівні. Я з нетерпінням чекаю рекомендацій щодо частолістської сторони речей (у мене є безліч монографій, але дуже мало хороших загальних текстів).


3
Я б припустив, що це потрібно прочитати для всіх, хто хоче стати хорошим статистиком, частотапедистом, баєсом або чим-небудь ще.
ймовірністьлогічний

10
Я не погоджуюся, що книга Джейнеса є жахливою рекомендацією в цій обставині: 1) позначення неохайне і нестандартне, що ускладнює перехресне посилання з іншими джерелами; (ОП просила "найкоротший маршрут") 3) є також помилки (наприклад, парадокс маргіналізації)
Simon Byrne

1
@Dikran Marsupial, вам належить текст Шервіса про статистичний висновок? Я був на огорожі щодо того, купувати його чи ні, тому було цікаво, оскільки, здається, ви досить сильно відповідаєте байєсівському підходу.
кардинал

1
Я б не сказав, що я сильно відповідав байєсівському підходу. Саме підхід я найкраще розумію, і це не одне і те ж. По суті, я по душі інженер, і хочу, щоб обидва інструменти в моїй панелі інструментів підтримувались у належному порядку! Правильне розуміння переваг та недоліків кожного підходу - це те, до чого ми повинні прагнути. У мене немає книги «Шервіші», але я прочитав документ про його фактори про Байєса, які здалися мені досить хибними (я побачу, чи зможу я її знайти, і опублікую запитання, щоб хтось мені це пояснив!).
Дікран Марсупіал

@Dikran, Ваше (потенційне) запитання звучить цікаво. Я з нетерпінням чекаю публікації на ньому.
кардинал

3

Я походжу з інформатики, орієнтованої на машинне навчання. Однак я по-справжньому почав розуміти (і що важливіше застосовувати) статистику після проходження курсу розпізнавання шаблонів за допомогою Bishop's Book https://www.microsoft.com/en-us/research/people/cmbishop/#!prml-book

ось деякі слайди курсу MIT:
http://www.ai.mit.edu/courses/6.867-f03/lectures.html

Це просто дасть вам основу (+ деякий код matlab), щоб використовувати статистику для справжніх робочих проблем і, безумовно, більше на застосованій стороні.

Тим не менш, це дуже залежить від того, що ви хочете зробити зі своїми знаннями. Щоб визначити, наскільки ви хороші, можливо, ви захочете переглядати вироби відкритого курсу якогось університету для курсів підвищення кваліфікації, щоб перевірити, чи знаєте ви обговорювані теми. Тільки мої 5 центів.


1

Я думаю, що Стенфорд забезпечує найкращі ресурси, коли мова йде про гнучкість. У них навіть є курс машинного навчання в Інтернеті, який би забезпечив вам поважну базу знань, коли справа стосується проектування алгоритмів в Р. Шукайте його в Google, і він перенаправить вас на сторінку Lagunita, де вони мають цікаві курси, більшість з вони є вільними. У мене є книги Тібшірані, Вступ до статистичного навчання "та" Елементи статистичного навчання "у форматах PDF, і обидві - надзвичайно хороші ресурси.

Оскільки ви математик, я все-таки радив би вам не швидко рухатися, оскільки це не дасть вам міцної основи, яка може вам бути корисною в майбутньому, якщо ви взагалі почнете займатися серйозним машинним навчанням. Трактуйте статистику як галузь математики для отримання розуміння даних, і це потребує певної роботи. Крім того, є багато інтернет-ресурсів, Джон Хопкінс надає подібні речі, як Стенфорд. Незважаючи на те, що досвід завжди приносить користь, поважна довіра завжди зміцнить цю базу. Ви також можете придумати конкретні поля, які ви хочете ввести; під цим я маю на увазі, чи хочете ви зайнятися аналізом тексту чи застосовуєте математику та статистичні навички у фінансах. Я входжу в останню категорію, тому маю ступінь економетрики, де ми вивчали фінанси + статистику. Поєднання завжди може бути дуже хорошим.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.