Що таке практично хороший процес аналізу даних?


15

Мені хотілося б знати чи мати посилання на процес аналізу, який проходить більшість аналітиків статистичних даних для кожного проекту аналізу даних.

Якщо я складаю "список", для завершення проекту аналізу даних аналітик повинен:

  1. спочатку збирайте вимоги до проекту,
  2. планувати / проектувати його аналіз даних на основі цих вимог раніше
  3. фактично попередньо обробляючи дані,
  4. виконання аналізу даних та
  5. написання звіту за результатами його аналізу.

Для цього питання мене цікавить детальніше крок 2. Але я розумію, що це практично не чіткий розріз, оскільки аналітику, можливо, доведеться змінити свій план чи дизайн відповідно до результатів аналізу даних. Чи є посилання на цю тему?

Відповіді:


17

Мій улюблений "план" або "список" - документ Скотта Емерсона " Організація вашого підходу до аналізу даних" .

Примітка: останні дві сторінки знаходяться під заголовком "Загальні вимоги до кандидатського прикладного іспиту", але поради, надані там, узагальнюють роботу над будь-якою проблемою аналізу.


Любіть кожну частину документа. Дякуємо за цінну довідку.
Tae-Sung Shin

5

Я вважав, що робочий процес аналізу даних, використовуючи Stata, є хорошою книгою, особливо (але не тільки) як користувач Stata. Я багато чого з цим не погодився, але навіть це допомогло з’ясувати, чому я роблю речі певними способами.


4
+1, але застереження : ця книга цінна лише тоді, коли ви користувач Stata. Я не використовую Stata (насправді я ніколи не маю). З іншого боку, мені подобається Лонг, тому я перевірив це з бібліотеки. Я впевнений, що там є багато корисної інформації для всіх, але вона настільки ретельно переплетена із використанням Stata, що неможливо витягнути загальну інформацію про домен.
gung - Відновіть Моніку

2

CRISP-DM , придуманий компанією SPSS (зараз належить IBM), є абревіатурою для процесу обміну даними, що таке саме, як і для "аналізу даних". SAS має подібний процес під назвою SEMMA .

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.