Я думаю, що часто схильність відчувати себе так, ніби ви спустилися з кролячої нори за допомогою дослідницьких аналізів, через втрату зору предметних питань, які ви задаєте. Я роблю це час від часу, а потім доводиться нагадувати собі, яка моя мета. Наприклад, я намагаюся побудувати конкретну модель чи оцінювати адекватність існуючої? Я шукаю докази проблем із даними (тобто, криміналістичний аналіз даних)? Або це на ранніх етапах аналізу, де я неформально досліджую конкретні питання (наприклад, чи існує зв’язок між двома змінними?), Перш ніж перейти до розробки формальної моделі? Підсумовуючи це, якщо ви спіймаєте викручування сюжетів та таблиць, але не можете чітко вказати, яка ваша найближча мета або чому цей сюжет / таблиця є актуальним, то ви знаєте,
Я намагаюся підійти до дослідницького аналізу даних, як я пишу, будь то написання програми чи написання статті. В будь-якому випадку я б не почав, не склавши контур спочатку. Цей контур, звичайно, може змінюватися (і часто), але починати писати без нього неефективно, і часто виходить поганий кінцевий продукт.
Організація WRT, кожен аналітик повинен знайти робочий процес, який працює для нього чи її - це IMO важливіше, ніж намагатися суворо дотримуватися чужий робочий процес (хоча завжди корисно отримувати ідеї від того, що роблять інші). Якщо ви працюєте програмно (тобто пишете код, який можна запустити для генерування / відновлення набору результатів) і перевіряєте свою роботу на git, то ви вже на півтора мільйона попереду багатьох. Я підозрюю, що вам може знадобитися витратити деякий час на організацію свого коду, і для цього я б запропонував дотримуватися вашого контуру. Наприклад, тримайте ваші аналітичні файли порівняно короткими та націленими, щоб кожен відповідав на одне конкретне запитання (наприклад, діагностичні схеми для конкретної регресійної моделі). Впорядкуйте їх у підкаталоги на одному чи двох рівнях, залежно від розміру та складності проекту. Таким чином проект стає самодокументованим; перегляд списків каталогів, підкаталогів та файлів (разом із коментарем у верхній частині кожного файлу) теоретично повинен відтворювати ваш контур.
Звичайно, у великому проекті у вас також може бути код, який здійснює очищення та управління даними, код, який ви написали для оцінки певного типу моделі, або інші утиліти, які ви написали, і вони не впишуться в предметне контур для аналізу ваших даних, тому вони повинні бути організовані в іншій частині папки вашого проекту.
Оновлення: Опублікувавши це, я зрозумів, що не звертався безпосередньо до вашого питання про "тупики". Якщо ви дійсно вирішите, що цілий набір аналізів не має ніякої цінності, тоді, якщо ви працюєте в git, ви завжди можете видалити відповідний файл (и) з повідомленням про фіксацію типу "Покинув цей рядок аналізу, оскільки його не було" продуктивний ». На відміну від того, щоб розчавити те, що ви написали, і викинути його у смітник, ви завжди можете повернутися до того, що ви зробили пізніше, якщо бажаєте.
Однак, я думаю, ви виявите, що якщо виходити з контуру, до якого ви задумалися, у вас буде менше так званих тупиків. Натомість, якщо ви витрачаєте час на дослідження вартісного та актуального питання - навіть якщо це призводить до нульової знахідки чи не виходить так, як ви передбачали, ви, ймовірно, все ще хочете вести облік того, що ви зробили, та про результати (на як мінімум, щоб ви не помилилися повторити це згодом). Просто перемістіть їх у нижній частині контуру, у вигляді "Додаток".