Для рішення, яке позбавлене прискіпливих зовнішніх залежностей *, існує readxl
:
Пакет readxl дозволяє легко отримувати дані з Excel та в R. У порівнянні з багатьма існуючими пакетами (наприклад, gdata, xlsx, xlsReadWrite) readxl не має зовнішніх залежностей, тому його легко встановити та використовувати у всіх операційних системах. Він призначений для роботи з табличними даними, що зберігаються в одному аркуші.
Readxl підтримує як застарілий формат .xls, так і сучасний формат .xlsx на основі xml. Підтримка .xls стала можливою за допомогою бібліотеки libxls C, яка абстрагує багато складностей базового двійкового формату. Для синтаксичного аналізу .xlsx ми використовуємо бібліотеку RapidXML C ++.
Його можна встановити так:
install.packages("readxl")
або
devtools::install_github("hadley/readxl")
Використання
library(readxl)
read_excel("my-old-spreadsheet.xls")
read_excel("my-new-spreadsheet.xlsx")
read_excel("my-spreadsheet.xls", sheet = "data")
read_excel("my-spreadsheet.xls", sheet = 2)
read_excel("my-spreadsheet.xls", na = "NA")
* не є суто істинним, він вимагає Rcpp
пакету , який, у свою чергу, вимагає Rtools (для Windows) або Xcode (для OSX), які є зовнішніми залежностями від R. Але вони не вимагають жодної возиння із шляхами тощо, тому це перевага над залежностями Java та Perl.
Оновлення Зараз існує пакет rexcel . Це обіцяє отримати форматування Excel, функції та багато інших видів інформації з файлу Excel і в R.
.csv
.