Я не думаю, що мені вдасться регулярно інвестувати гроші на продовження аналізу даних
Я не думаю, що Casella & Berger - це місце, де можна багато чого вивчити на шляху аналізу даних . Це місце для вивчення деяких інструментів статистичної теорії.
Мій досвід, який до цього часу говорить про те, що я є статистикою, повинен мати великі виснажливі обчислення, що включають різні розподіли (Weibull, Cauchy, t, F ...).
Я багато часу проводив як статистик, займаючись аналізом даних. Це рідко (майже ніколи) не припускає мене робити виснажливий розрахунок. Іноді це стосується трохи простої алгебри, але загальні проблеми зазвичай вирішуються, і мені не потрібно витрачати жодних зусиль на їх повторне використання.
Комп’ютер робить усі стомливі розрахунки.
Якщо я знаходжусь у ситуації, коли я не готовий прийняти досить стандартний випадок (наприклад, не готовий використовувати GLM), я, як правило, не маю достатньої кількості інформації, щоб передбачити будь-який інший розподіл, тому питання про розрахунки в LRT, як правило, суперечки (я можу їх робити, коли мені потрібно, вони просто або, як правило, вже вирішені, або виникають так рідко, що це цікаве відвернення).
Я схильний робити багато моделювання; Я також часто намагаюся використовувати перекомпонування в певній формі поряд або замість параметричних припущень.
Чи потрібно мені витрачати 20 годин + на тиждень на це, як раніше?
Це залежить від того, що ти хочеш вміти робити і як швидко ти хочеш попрацювати в цьому.
Аналіз даних - це навик, і для цього потрібна практика та велика база знань. Ви матимете частину знань, які вам вже потрібні.
Якщо ви хочете бути хорошим практиком у найрізноманітніших речах, це займе багато часу - але, на мій погляд, це набагато веселіше, ніж алгебра та таке виконання вправ Казелла та Бергера.
Деякі з навичок, які я побудував на проблемах регресії, корисні для часових рядів, скажімо, - але багато нових навичок потрібно. Тож навчитися інтерпретувати залишкові сюжети та QQ-сюжети зручно, але вони не кажуть мені, скільки мені потрібно турбуватися про невеликий удар в графіку PACF і не дають мені таких інструментів, як використання прогнозування на крок вперед помилки.
Так, наприклад, мені не потрібно витрачати зусилля на з'ясування того, як правильно робити ML для типових моделей гамма або вейбулла , оскільки вони досить стандартні для вирішення проблем, які вже значною мірою поставлені у зручній формі.
Якщо ви приїжджаєте займатися дослідженнями , вам знадобиться набагато більше навичок, які ви набираєте в таких місцях, як Casella & Berger (але навіть маючи такі навички, ви також повинні прочитати більше однієї книги).
Деякі запропоновані речі:
Вам неодмінно слід сформувати деякі навички регресії, навіть якщо ви нічого більше не робите.
Є цілий ряд непоганих книг, але, можливо, Draper & Smith Applied Regression Analysis плюс Fox і Weisberg An R Companion to Applied Regression ; Я б також запропонував вам розглянути наступне питання щодо стратегії регресійного моделювання Гаррелла
(Ви можете замінити будь-яку кількість хороших книг для Дрейпера і Сміта - знайдіть одну або дві, які вам підходять.)
У другій книзі є ряд додаткових онлайн-розділів, які дуже варто прочитати (та власний R-пакет)
-
Хороший другої порції буде Venables & Ріплі Сучасна прикладна статистика з S .
Це деяке обгрунтування досить широкого кола ідей.
Може виявитись, що вам потрібен ще якийсь основний матеріал з деяких тем (я не знаю вашого фону).
Тоді вам потрібно буде почати думати про те, які сфери статистики ви хочете / потребуєте - байєсівська статистика, часовий ряд, багатофакторний аналіз тощо тощо