Чи можу я використовувати показник Z зі скасованими та ненормальними даними? [зачинено]


12

Я працював з деякими даними про час циклу процесу та масштабуванням, використовуючи стандартний z-бал, щоб порівняти між частинами повного часу циклу.

Чи варто використовувати якусь іншу трансформацію, оскільки дані сильно нахилені / ненормальні? ("Випускники" ніколи не можуть зайняти негативний час і часто займають набагато більше часу, ніж "середні")

Використання z-оцінка як і раніше "працює" ...

###############
# R code    
###############
mydata <- rweibull(1000,1,1.5)
hist(mydata)
hist(scale(mydata))

5
Що саме ви запитуєте? Звичайно, ви все ще можете обчислити -score, але для чого ви намагаєтесь його використовувати? Кількість стандартних відхилень від середньої величини (якою є -score) може бути не особливо корисною статистикою в деяких ситуаціях. zzz
Макрос

Відповіді:


5

Якщо X сильно перекошений, статистика Z не буде нормально розподілена (або t, якщо стандартне відхилення треба оцінити. Отже, відсоткові Z не будуть стандартними нормальними. Тому в цьому сенсі це не працює).


Наскільки я розумію, те, що X є сильно перекошеним, означає, що розмір вибірки був недостатньо великим (теорема центральної межі). Однак я не впевнений, чи потрібне саме населення, щоб Z статистика працювала. Робить це?
Анджей Гіс

1
ОП говорить про розподіл населення, а не про розподіл середнього. Тому розмір вибірки та центральна гранична теорема не застосовуються.
Майкл Р. Черник

2

Код R спрацює, але z-оцінка буде приблизно такою ж значущою, як і речення "Виноград легенько задзвонює авторучку". Це дійсне речення, але не містить нічого значимого.

Судячи з вашого R-коду, вам здається, ви думаєте, що ваші дані розповсюджуються Weibull. У такому випадку я б просто скористався статистикою Weibull і нічого не масштабував, якщо цього абсолютно не потрібно. Незважаючи на те, що z-бали викладаються в кожному класі статистики введення, це не означає, що ви повинні їх постійно використовувати, і особливо не, якщо у вас немає симетричних даних.


1

Якщо населення нормально не розподілене. У цьому випадку розподіл бару (X) {зразк середнього} наближається до нормального розподілу відповідно до теореми центрального межі; для великих розмірів вибірки Хоча теоретично ми кажемо, що ми використовуємо Стьюдент-t, але для більш високих значень n (розмір вибірки або ступінь свободи), розподіл t і розподіл Z майже рівні.


-4

ВАШІ ДАНІ НЕ МАЮТЬСЯ НОРМАЛЬНО ДЛЯ Z-TEST. (ГОРОД, 2002 р.), ЯКІ ВАРІАНТИ БУДЬ ПІДХІДНО РІВНІ. ПЕРЕВІРИТИСЯ, ЩО ПОВЕРНУТИСЯ ЗВ'ЯЗОК З ПОВЕРНЕННЯМ ДВИХ ДАТАСЕТІВ, А ЯКЩО ВАШІ ВАРІАНТИ ПОДІЛЬНО РІВНІ, РЕЗУЛЬТАТ З Z тестування є корисним. ЯКЩО НЕ, ТРАНСФОРМУЙТЕ ДАНІ.


9
Питання в тому, що перетворення змінної не є тестом, тому я не думаю, що ваша відповідь застосовується. Крім того, це, мабуть, більш інформативно, якщо ви дасте повну довідку замість просто посилання на рік імені та деякі люди заперечують проти SHOUTING.
Maarten Buis

Я погоджуюся з @MaartenBuis, але на відміну від нього, я спростую це.
Ерік
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.