Запитання з тегом «eda»

EDA означає «Дослідницький аналіз даних». Розроблений Tukey на противагу конфірмаційному аналізу даних або CDA (формальне тестування гіпотез). EDA зазвичай стосується опису даних чисельно та графічно, щоб полегшити розуміння даних та отримати нові відомості.

24
Основні правила для "сучасної" статистики
Мені подобається книга G van Belle « Статистичні правила великого пальця» , і меншою мірою поширені помилки в статистиці (і як їх уникнути) від Філіппа I Good та Джеймса У. Хардіна. Вони стосуються загальних підводних каменів під час інтерпретації результатів експериментальних та спостережних досліджень та надають практичні рекомендації щодо статистичних …

6
Чи є якісь вагомі причини використовувати PCA замість EFA? Також може PCA бути заміною факторного аналізу?
У деяких дисциплінах PCA (аналіз основних компонентів) систематично використовується без будь-якого обґрунтування, а PCA та EFA (дослідницький факторний аналіз) розглядаються як синоніми. Тому я нещодавно використовував PCA для аналізу результатів перевірки масштабу (21 пункт за 7-бальною шкалою Лікерта, передбачається складати 3 коефіцієнта по 7 предметів), і рецензент запитує мене, чому …

8
Сучасний наступник дослідницького аналізу даних Tukey?
Я читав книгу Тукі «Дослідницький аналіз даних». Написана в 1977 році, книга наголошує на методах паперу / олівця. Чи є більш «сучасний» наступник, який враховує, що ми можемо миттєво побудувати великі набори даних?

8
Функція огляду графічних даних (резюме) в R
Я впевнений, що раніше я стикався з такою функцією в пакеті R, але після обширного гуглінгу я не можу знайти його ніде. Функція, про яку я думаю, створила графічний підсумок для заданої йому змінної, даючи вихід з деякими графіками (гістограмою, можливо, графікою коробки та вуса) та деяким текстом, що дає …

5
Дані “розвідка” порівняно з даними “сноупінг” / “катування”?
Я багато разів наштовхувався на неофіційні застереження щодо "прослідковування даних" (ось один кумедний приклад ), і я думаю, що маю інтуїтивне уявлення приблизно про те, що це означає, і чому це може бути проблемою. З іншого боку, "аналіз дослідницьких даних" видається цілком поважною процедурою в статистиці, принаймні, судячи з того, …

4
Чи схвалив журнал Science «Сад форкінгу патетів»?
Ідея адаптивного аналізу даних полягає в тому, що ви змінюєте свій план аналізу даних, коли ви дізнаєтесь більше про них. Що стосується дослідницького аналізу даних (EDA), це, як правило, гарна ідея (ви часто шукаєте непередбачені зразки в даних), але для підтверджуючого дослідження це широко сприймається як дуже хибний метод аналізу …

2
Як впоратися з дослідницьким аналізом даних та днопоглинанням даних у дослідженнях малих зразків?
Дослідницький аналіз даних (EDA) часто призводить до вивчення інших "слідів", які не обов'язково належать до початкового набору гіпотез. Я стикаюся з такою ситуацією у випадку досліджень з обмеженим розміром вибірки та великою кількістю даних, зібраних за допомогою різних анкетування (соціально-демографічні дані, нейропсихологічні або медичні шкали - наприклад, психічне або фізичне …

5
Чи важливий дослідницький аналіз даних при чисто передбачуваному моделюванні?
Під час побудови прогностичної моделі з використанням машинних методів навчання, який сенс робити дослідницький аналіз даних (EDA)? Чи добре переходити безпосередньо до генерації функцій та будувати свої моделі? Наскільки важлива описова статистика, яка використовується в EDA?

6
Помилковість техаського стрільця в дослідницькому аналізі даних
Я читав цю статтю в "Природі", в якій деякі помилки пояснюються в контексті аналізу даних. Я помітив, що помилок техаських стрільців було особливо важко уникнути: Пізнавальна пастка, яка чекає під час аналізу даних, ілюструється байкою техаського стрільця: невмілий стрілець, який вистрілює випадковим малюнком кульок збоку від сараю, малює ціль навколо …
23 eda  fallacy 

5
Що навчитися після Casella & Berger?
Я чистий студент з математики, малий досвід прикладної математики. З минулої осені я відвідував заняття з книги Casella & Berger, і закінчив сотні (230+) сторінок проблем із фізичними вправами в книзі. Зараз я перебуваю в главі 10. Однак, оскільки я не користувався статистикою або не планував стати статистикою, я не …

5
Як перевірити дослідницький аналіз великих наборів даних?
Коли я починаю дослідницький аналіз великого набору даних (багато зразків, багато змінних), я часто опиняюся з сотнями похідних змінних і тоннами різних ділянок, і немає реального способу відстежувати, що відбувається куди. Код закінчується як спагетті, тому що немає напряму з самого початку ... Чи є які-небудь рекомендовані методи для того, …

1
Що таке "ефект підкови" та / або "ефект дуги" в аналізі PCA / листування?
Існує багато методик екологічної статистики для розвідувального аналізу даних багатовимірних даних. Вони називаються методами «висвячення». Багато хто однаковий або тісно пов'язаний із поширеними методами в статистиці. Можливо, прототипним прикладом буде аналіз основних компонентів (PCA). Екологи можуть використовувати PCA та пов'язані з ними методи для дослідження «градієнтів» (мені не зовсім зрозуміло, …

8
Ідеї ​​програмного забезпечення "лабораторний ноутбук"?
Тож це дивна придатність, хоча насправді я думаю, що це дивно підходить для будь-якого сайту, тому я подумав, що спробую це тут, серед моїх братиків, що стискають дані. Я прийшов до епідеміології та біостатистики з біології, і досі напевно маю деякі звички з цієї галузі. Один з них - це …

2
Як зробити дослідницький аналіз даних, щоб вибрати відповідний алгоритм машинного навчання
Ми вивчаємо машинне навчання за допомогою машинного навчання: ймовірнісна перспектива (Кевін Мерфі). Хоча текст пояснює теоретичну основу кожного алгоритму, він рідко каже, у якому випадку, який алгоритм кращий, а коли це робиться, він не говорить, як сказати, у якому випадку я перебуваю. Наприклад, для вибору ядра мені сказали робити дослідницький …

5
Хороший спосіб графічно показати багато даних
Я працюю над проектом, який включає 14 змінних та 345 000 спостережень за даними про житло (такі речі, як рік побудови, квадратні метри, продана ціна, графство проживання тощо). Мене хвилює намагання знайти хороші графічні прийоми та бібліотеки R, які містять приємні методики побудови графіків. Я вже бачу, що в ggplot …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.