У мене є набір даних ascii, який складається з трьох стовпців, але лише два останні є фактичними даними. Тепер я хочу створити точку діаграм даних за допомогою read.csv(file = "result1", sep= " ")
. R читає всі три колонки. Як я цього уникаю?
У мене є набір даних ascii, який складається з трьох стовпців, але лише два останні є фактичними даними. Тепер я хочу створити точку діаграм даних за допомогою read.csv(file = "result1", sep= " ")
. R читає всі три колонки. Як я цього уникаю?
Відповіді:
Ви можете використовувати colClasses
аргумент read.csv
для вибору потрібних стовпців. У цьому випадку, ви можете встановити colClasses
вc("NULL", NA, NA)
read.csv(file="result1", sep=" ", colClasses=c("NULL", NA, NA))
Більш загально, ви можете використовувати colClasses для визначення конкретних типів стовпців; NA
означає використовувати підхід за замовчуванням, який полягає в тому, щоб спробувати зрозуміти, що таке стовпець автоматично. Докладнішу інформацію див. На сторінці довідки read.csv
.
Інший варіант - читати у всьому файлі, але зберігати лише два стовпці, наприклад:
read.csv(file = "result1", sep = " ")[ ,1:2]
або, використовуючи назви стовпців, наприклад. якщо стовпці названі "col1, col2, col3"
read.csv(file = "result1", sep = " ")[ ,c('col1', 'col2')]
Цей час займає менше часу порівняно з наданими відповідями
library(data.table)
fread(file="result1", sep=" ", colClasses=c("NULL", NA, NA))