Запитання з тегом «dataframe»

Кадр даних - це таблична структура даних. Зазвичай він містить дані, де рядки - це спостереження, а стовпці - змінні різних типів. Хоча "кадр даних" або "кадр даних" - це термін, використовуваний для цього поняття на декількох мовах (R, Apache Spark, deedle, Maple, бібліотека панд на Python та бібліотека DataFrames в Джулії), "table" - це термін, використовуваний у MATLAB і SQL.

7
Використання Pandas для pd.read_excel () для кількох робочих аркушів однієї робочої книги
У мене є великий файл електронних таблиць (.xlsx), який я обробляю за допомогою панд python. Буває, що мені потрібні дані з двох вкладок у цьому великому файлі. Одна з вкладок містить тону даних, а друга - лише кілька квадратних комірок. Коли я використовую pd.read_excel () на будь-якому робочому аркуші, мені …

4
Pandas DataFrame до списку словників
У мене є такі DataFrame: замовник item1 item2 item3 1 яблучний молочний помідор 2 води апельсинової картоплі 3 стружки манго з соком що я хочу перекласти це до списку словників у рядку rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'}, {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'}, …

8
Переформатування файлів data.frame від широкого до довгого формату
У мене є певні проблеми перетворити свою data.frameз широкого столу на довгий. На даний момент це виглядає приблизно так: Code Country 1950 1951 1952 1953 1954 AFG Afghanistan 20,249 21,352 22,532 23,557 24,555 ALB Albania 8,097 8,986 10,058 11,123 12,246 Тепер я хотів би перетворити це data.frameна довге data.frame. Щось …
164 r  dataframe  reshape  r-faq 

7
Нумерація рядків у групах у кадрі даних
Робота з фреймом даних, подібним до цього: set.seed(100) df <- data.frame(cat = c(rep("aaa", 5), rep("bbb", 5), rep("ccc", 5)), val = runif(15)) df <- df[order(df$cat, df$val), ] df cat val 1 aaa 0.05638315 2 aaa 0.25767250 3 aaa 0.30776611 4 aaa 0.46854928 5 aaa 0.55232243 6 bbb 0.17026205 7 bbb 0.37032054 …
163 r  dataframe  r-faq 


13
Порівняйте два DataFrames та виведіть їх відмінності поряд
Я намагаюся виділити саме те, що змінилося між двома фреймами даних. Припустимо, у мене є два фрейми даних Python Pandas: "StudentRoster Jan-1": id Name score isEnrolled Comment 111 Jack 2.17 True He was late to class 112 Nick 1.11 False Graduated 113 Zoe 4.12 True "StudentRoster Jan-2": id Name score …
162 python  html  pandas  dataframe  panel 

13
Порівняйте два data.frames, щоб знайти рядки у data.frame 1, яких немає у data.frame 2
У мене є такі 2 data.frames: a1 <- data.frame(a = 1:5, b=letters[1:5]) a2 <- data.frame(a = 1:3, b=letters[1:3]) Я хочу знайти рядок a1, який не має a2. Чи є вбудована функція для цього типу операцій? (ps: я написав рішення для цього, мені просто цікаво, чи хтось уже зробив більш складений …
161 r  merge  compare  rows  dataframe 

4
Додати новий рядок до фрейму даних у певному індексі рядка, не доданий?
Наступний код поєднує вектор з фреймом даних: newrow = c(1:4) existingDF = rbind(existingDF,newrow) Однак цей код завжди вставляє новий рядок в кінці фрейму даних. Як я можу вставити рядок у вказаній точці в рамці даних? Наприклад, скажімо, що у фрейму даних є 20 рядків, як я можу вставити новий рядок …
160 r  dataframe  insert 


5
Укажіть рядки кадрів даних відповідно до вектора з конкретним порядком
Чи є більш простий спосіб забезпечити впорядкування рядків кадру даних відповідно до "цільового" вектора, як той, який я реалізував у короткому прикладі нижче? df <- data.frame(name = letters[1:4], value = c(rep(TRUE, 2), rep(FALSE, 2))) df # name value # 1 a TRUE # 2 b TRUE # 3 c FALSE …
158 r  sorting  dataframe 

12
Фільтрування фреймів даних Pandas за датами
У мене є DataFrame Pandas зі стовпцем "дата". Тепер мені потрібно відфільтрувати всі рядки в DataFrame, які мають дати поза наступними двома місяцями. По суті, мені потрібно лише зберегти рядки, які є протягом наступних двох місяців. Який найкращий спосіб досягти цього?

9
Фільтруйте рядки data.frame за логічною умовою
Я хочу фільтрувати рядки з data.frameурахуванням логічної умови. Припустимо, що у мене є такий кадр даних expr_value cell_type 1 5.345618 bj fibroblast 2 5.195871 bj fibroblast 3 5.247274 bj fibroblast 4 5.929771 hesc 5 5.873096 hesc 6 5.665857 hesc 7 6.791656 hips 8 7.133673 hips 9 7.574058 hips 10 7.208041 …
155 r  subset  dataframe 


8
Об'єднати / узагальнити кілька змінних у групі (наприклад, сума, середнє значення)
З кадру даних, є простий спосіб агрегації ( sum, mean, maxодночасно с) і ін кілька змінних? Нижче наведено кілька зразкових даних: library(lubridate) days = 365*2 date = seq(as.Date("2000-01-01"), length = days, by = "day") year = year(date) month = month(date) x1 = cumsum(rnorm(days, 0.05)) x2 = cumsum(rnorm(days, 0.05)) df1 = …


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.