Запитання з тегом «dplyr»

Використовуйте цей тег для запитань щодо функцій із пакету dplyr, таких як group_by, підсумовуйте, фільтруйте та виберіть.

3
data.table vs dplyr: чи можна зробити щось добре, а інший не може чи погано?
Огляд Я відносно знайомий data.table, не так вже й багато dplyr. Я прочитав кілька dplyrвіньєт та прикладів, які з’явились на SO, і поки що мої висновки: data.tableі dplyrвони порівнянні за швидкістю, за винятком випадків, коли існує багато (тобто> 10-100 К) груп, а також за інших обставин (див. орієнтири нижче) dplyr …
758 r  data.table  dplyr 

5
Відображення / друк усіх рядків таблички (tbl_df)
tibble(раніше tbl_df) - це версія фрейму даних, створеного dplyrпакетом маніпулювання кадром даних у Р. Це запобігає довгим результатам таблиці при випадковому виклику кадру даних. Після того, як кадр даних завернуто в tibble/ tbl_df, чи існує команда для перегляду всього кадру даних (усі рядки та стовпці кадру даних)? Якщо я використовую …
192 r  dplyr  options  display 

4
Фільтруйте рядки, які містять певний рядок
Я повинен фільтрувати кадр даних, використовуючи в якості критерію ту рядок, в якому міститься рядок RTB. Я використовую dplyr. d.del <- df %.% group_by(TrackingPixel) %.% summarise(MonthDelivery = as.integer(sum(Revenue))) %.% arrange(desc(MonthDelivery)) Я знаю , що можу використовувати функцію filterв dplyrале я не точно , як сказати йому , щоб перевірити вміст …
188 r  filter  dplyr 

5
Чи можна використовувати пакет dplyr для умовної мутації?
Чи можна використовувати мутацію, коли мутація умовна (залежно від значень певних значень стовпців)? Цей приклад допомагає показати, що я маю на увазі. structure(list(a = c(1, 3, 4, 6, 3, 2, 5, 1), b = c(1, 3, 4, 2, 6, 7, 2, 6), c = c(6, 3, 6, 5, 3, 6, …

7
Витягніть колонку dplyr tbl як вектор
Чи є більш стислий спосіб отримати один стовпчик dplyr tbl як вектор, з tbl з бек-ендом бази даних (тобто кадр / таблицю даних не можна безпосередньо підмножити)? require(dplyr) db <- src_sqlite(tempfile(), create = TRUE) iris2 <- copy_to(db, iris) iris2$Species # NULL Це було б занадто просто, так collect(select(iris2, Species))[, 1] …

8
Виправлення декількох попереджень "невідомий стовпець"
У мене є стійке багаторазове попередження про "невідомий стовпець" для всіх типів команд (наприклад, str (x) для встановлення оновлень на пакети), і не впевнений, як це налагодити чи виправити. Попередження "невідомий стовпець" явно пов'язане зі змінною в tbl_df, яку я перейменував, але попередження з'являється у всіх видах команд, здавалося б, …
171 r  dplyr 

9
Використовуйте імена динамічних змінних у `dplyr '
Я хочу використовувати dplyr::mutate()для створення декількох нових стовпців у кадрі даних. Назви стовпців та їх вміст повинні динамічно генеруватися. Приклад даних із райдужної оболонки: library(dplyr) iris <- tbl_df(iris) Я створив функцію для вимкнення моїх нових стовпців зі Petal.Widthзмінної: multipetal <- function(df, n) { varname <- paste("petal", n , sep=".") df …
168 r  dplyr  r-faq 

9
Згрупуйте по декількох стовпцях у dplyr, використовуючи рядок векторного введення
Я намагаюся перенести своє розуміння plyr в dplyr, але не можу зрозуміти, як згрупуватися за кількома колонками. # make data with weird column names that can't be hard coded data = data.frame( asihckhdoydkhxiydfgfTgdsx = sample(LETTERS[1:3], 100, replace=TRUE), a30mvxigxkghc5cdsvxvyv0ja = sample(LETTERS[1:3], 100, replace=TRUE), value = rnorm(100) ) # get the columns …
157 r  dplyr  r-faq 

7
Відносні частоти / пропорції з dplyr
Припустимо, я хочу обчислити частку різних значень у кожній групі. Наприклад, використовуючи mtcarsдані, як можна обчислити відносну частоту кількості передач за am (автоматичною / ручною) за один перехід dplyr? library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency mtcars %>% group_by(am, gear) %>% summarise(n = n()) # am gear n # …
153 r  group-by  dplyr  frequency 

9
Виберіть перший і останній рядок із згрупованих даних
Питання Використовуючи dplyr, як я вибираю верхні і нижні спостереження / ряди згрупованих даних в одній заяві? Дані та приклад Дано кадр даних df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), stopId=c("a","b","c","a","b","c","a","b","c"), stopSequence=c(1,2,3,3,1,4,3,1,2)) Я можу отримати спостереження вгорі та внизу від кожної групи за допомогою slice, але за допомогою двох окремих статей: firstStop <- df …
137 r  dplyr 


6
Застосування функції до кожного рядка таблиці за допомогою dplyr?
Під час роботи з plyrмені часто було корисно використовувати adplyдля скалярних функцій, які мені доводиться застосовувати до кожного ряду. напр data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Max.Len 1 5.1 3.5 1.4 0.2 setosa 5.1 2 4.9 3.0 1.4 0.2 setosa 4.9 …
121 r  plyr  dplyr 

4
Що означає%>% функція в R?
Я бачив використання функції %>%(на відсоток більше відсотка) у деяких пакетах, таких як dplyr та rvest . Що це означає? Це спосіб записати блоки закриття в R?
119 r  syntax  dplyr  magrittr  r-faq 

6
Заміна на "перейменувати" в dplyr
Мені подобається функція перейменування plyr rename. Нещодавно я почав використовувати dplyr, і мені було цікаво, чи існує простий спосіб перейменувати змінні за допомогою функції з dplyr, що є таким же простим у використанні, як і для plyr rename?
118 r  rename  dplyr 

1
Чи може dplyr приєднатися до декількох стовпців або складеного ключа?
Я розумію, що dplyrv3.0 дозволяє вам приєднуватися до різних змінних: left_join(x, y, by = c("a" = "b")буде відповідати x.aдоy.b Однак чи можна приєднатись до комбінації змінних чи мені потрібно заздалегідь додати складений ключ? Щось на зразок цього: left_join(x, y, by = c("a c" = "b d")відповідати конкатенації [ x.aі x.c] …
111 r  dplyr 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.