Здається, існує різниця між рівнями та мітками фактора в Р. Дотепер я завжди вважав, що рівні - це "справжня" назва рівнів факторів, а мітки - це імена, що використовуються для виведення (наприклад, таблиці та графіки) . Очевидно, що це не так, як показує наступний приклад:
df <- data.frame(v=c(1,2,3),f=c('a','b','c'))
str(df)
'data.frame': 3 obs. of 2 variables:
$ v: num 1 2 3
$ f: Factor w/ 3 levels "a","b","c": 1 2 3
df$f <- factor(df$f, levels=c('a','b','c'),
labels=c('Treatment A: XYZ','Treatment B: YZX','Treatment C: ZYX'))
levels(df$f)
[1] "Treatment A: XYZ" "Treatment B: YZX" "Treatment C: ZYX"
Я думав, що рівні ('a', 'b', 'c') якимось чином можна отримати доступ до сценаріїв, але це не працює:
> df$f=='a'
[1] FALSE FALSE FALSE
Але це робить:
> df$f=='Treatment A: XYZ'
[1] TRUE FALSE FALSE
Отже, моє запитання складається з двох частин:
Яка різниця між рівнями та мітками?
Чи можливо мати різні назви рівнів факторів для сценаріїв та результатів?
Передумови: Для більш довгих сценаріїв сценарій з короткими рівнями фактора здається набагато простішим. Однак для звітів та сюжетів цей короткий коефіцієнт може бути недостатнім, і його слід замінити точнішими назвами.