Прочитавши набір даних:
dataset <- read.csv("forR.csv")
- Як я можу отримати R, щоб він міг кількість випадків, які він містить?
- Також, чи буде повертане значення включати виключення випадків, пропущених із
na.omit(dataset)
?
Прочитавши набір даних:
dataset <- read.csv("forR.csv")
na.omit(dataset)
?Відповіді:
dataset
буде кадром даних. Оскільки у мене немає forR.csv
, складу невеликий кадр даних для ілюстрації:
set.seed(1)
dataset <- data.frame(A = sample(c(NA, 1:100), 1000, rep = TRUE),
B = rnorm(1000))
> head(dataset)
A B
1 26 0.07730312
2 37 -0.29686864
3 57 -1.18324224
4 91 0.01129269
5 20 0.99160104
6 90 1.59396745
Щоб отримати кількість випадків, підрахуйте кількість рядків, використовуючи nrow()
або NROW()
:
> nrow(dataset)
[1] 1000
> NROW(dataset)
[1] 1000
Для підрахунку даних після того, як опускаючи NA
, використовувати ті ж інструменти, але обернути dataset
в na.omit()
:
> NROW(na.omit(dataset))
[1] 993
Різниця між NROW()
і NCOL()
та їх малими варіантами ( ncol()
іnrow()
) полягає в тому, що малі версії працюватимуть лише для об'єктів, що мають розміри (масиви, матриці, кадри даних). Версії верхнього регістру працюватимуть з векторами, які трактуються так, ніби вони є матрицею з 1 стовпцем, і є надійними, якщо ви в кінцевому підсумку підмножили свої дані таким чином, що R видає порожній вимір.
Крім того, використовуйте complete.cases()
і sum
він ( complete.cases()
повертає логічний вектор [ TRUE
або FALSE
], вказуючи, чи є спостереження NA
для будь-яких рядків.
> sum(complete.cases(dataset))
[1] 993
Коротко:
Запустіть dim(dataset)
для отримання n і k , ви також можете використовувати nrow(df)
і ncol(df)
(і навіть NROW(df)
і NCOL(df)
- варіанти потрібні і для інших типів).
Якщо ви перетворитесь, наприклад, через via dataset <- na.omit(dataset)
, випадки відпадають і не рахуються. Але якщо ви робите, наприклад, summary(dataset)
випадки НС обліковуються.
str()
оскільки це містить інші корисні деталі щодо вашого об’єкта. Часто можна пояснити, чому стовпець не веде себе так, як слід (коефіцієнт замість числового тощо).