Я намагаюся відокремити дві групи значень з одного набору даних. Я можу припустити, що одна з популяцій зазвичай розподілена і становить щонайменше половину розміру вибірки. Значення другого є і нижчими, або вищими, ніж значення першого (розподіл невідомий). Що я намагаюся зробити - це знайти верхню і нижню межі, які охоплювали б нормально розподілене населення від іншого.
Моє припущення надає мені вихідну точку:
- всі точки міжквартильного діапазону вибірки походять із нормально розподіленої сукупності.
Я намагаюсь перевірити на інших людей, які беруть їх з решти вибірки, поки вони не впишуться в 3 ст.дев нормально розподіленої сукупності. Що не ідеально, але, здається, дає достатньо розумний результат.
Чи моє припущення статистично обгрунтоване? Який був би кращий шлях для цього?
ps виправте теги комусь.