Запитання з тегом «dataframe»

Кадр даних - це таблична структура даних. Зазвичай він містить дані, де рядки - це спостереження, а стовпці - змінні різних типів. Хоча "кадр даних" або "кадр даних" - це термін, використовуваний для цього поняття на декількох мовах (R, Apache Spark, deedle, Maple, бібліотека панд на Python та бібліотека DataFrames в Джулії), "table" - це термін, використовуваний у MATLAB і SQL.

7
Повторіть рядки data.frame N разів
У мене є такий фрейм даних: data.frame(a = c(1,2,3),b = c(1,2,3)) a b 1 1 1 2 2 2 3 3 3 Я хочу повторити рядки n разів. Наприклад, тут рядки повторюються 3 рази: a b 1 1 1 2 2 2 3 3 3 4 1 1 5 2 …
77 r  dataframe 

3
Spark SQL: застосувати агреговані функції до списку стовпців
Чи є спосіб застосувати сукупну функцію до всіх (або списку) стовпців фрейму даних, коли виконується groupBy? Іншими словами, чи є спосіб уникнути цього для кожного стовпця: df.groupBy("col1") .agg(sum("col2").alias("col2"), sum("col3").alias("col3"), ...)

4
Pandas версія rbind
У R ви можете поєднати два кадри даних, приклеївши стовпці одного до нижньої частини стовпців іншого, використовуючи rbind. Як ви робите в пандах те саме? Це здається химерно важким. Використання додатка призводить до жахливого безладу, включаючи NaN та інші речі з причин, які я не розумію. Я просто намагаюся "зв'язати" …
76 python  r  dataframe  pandas 

11
Як побудувати графік усіх стовпців кадру даних у R
Кадр даних містить n стовпців, і я хотів би отримати n графіків, по одному графіку для кожного стовпця. Я новачок і не вільно володію R, у будь-якому випадку я знайшов два рішення. Перший працює, але він не друкує назви стовпця (а вони мені потрібні!): data <- read.csv("sample.csv",header=T,sep=",") for ( c …
76 r  plot  dataframe 

6
Об’єднайте два списки в R
У мене є два списки first = list(a = 1, b = 2, c = 3) second = list(a = 2, b = 3, c = 4) Я хочу об’єднати ці два списки, щоб вийшов кінцевий продукт $a [1] 1 2 $b [1] 2 3 $c [1] 3 4 Чи …
75 r  list  dataframe 

4
R Функція Apply () у певних стовпцях фреймів даних
Я хочу використовувати функцію apply у фреймі даних, але застосувати функцію лише до останніх 5 стовпців. B<- by(wifi,(wifi$Room),FUN=function(y){apply(y, 2, A)}) Це стосується A для всіх стовпців y B<- by(wifi,(wifi$Room),FUN=function(y){apply(y[4:9], 2, A)}) Це стосується A лише для стовпців 4-9 y, але загальна віддача B позбавляє перших 3 стовпців ... Я все …
75 r  dataframe  apply 

7
Додайте новий стовпчик до фрейму даних на основі словника
У мене є фрейм даних та словник. Мені потрібно додати новий кадр до фрейму даних і обчислити його значення на основі словника. Машинне навчання, додавання нової функції на основі таблиці: score = {(1, 45, 1, 1) : 4, (0, 1, 2, 1) : 5} df = pd.DataFrame(data = { 'gender' …

5
Коефіцієнт відхилення та повернення для кожної змінної?
У мене є кадр даних, який записує відповіді виборців мов програмування 19717 року через запитання з численним вибором. Перша колонка - це, звичайно, стать респондента, а решта - вибір. Отже, якщо я виберу Python, то моя відповідь буде записана в колонку Python, а не bash, і навпаки. ID Gender Python …


3
Отримайте найближчу відстань за допомогою двох геодефрагментів у пандах
Ось мій перший геодедрам: !pip install geopandas import pandas as pd import geopandas city1 = [{'City':"Buenos Aires","Country":"Argentina","Latitude":-34.58,"Longitude":-58.66}, {'City':"Brasilia","Country":"Brazil","Latitude":-15.78 ,"Longitude":-70.66}, {'City':"Santiago","Country":"Chile ","Latitude":-33.45 ,"Longitude":-70.66 }] city2 = [{'City':"Bogota","Country":"Colombia ","Latitude":4.60 ,"Longitude":-74.08}, {'City':"Caracas","Country":"Venezuela","Latitude":10.48 ,"Longitude":-66.86}] city1df = pd.DataFrame(city1) city2df = pd.DataFrame(city2) gcity1df = geopandas.GeoDataFrame( city1df, geometry=geopandas.points_from_xy(city1df.Longitude, city1df.Latitude)) gcity2df = geopandas.GeoDataFrame( city2df, geometry=geopandas.points_from_xy(city2df.Longitude, city2df.Latitude)) Місто1 City …

4
Обчисліть відсоток аналогічних значень у фреймі даних панди
У мене є один фрейм даних dfз двома стовпцями: Сценарій (з текстом) і Speaker Script Speaker aze Speaker 1 art Speaker 2 ghb Speaker 3 jka Speaker 1 tyc Speaker 1 avv Speaker 2 bhj Speaker 1 У мене є такий список: L = ['a','b','c'] З наступним кодом: df = …

3
Чому присвоєння [:] проти iloc [:] дає різні результати в пандах?
Мене так плутають різні методи індексації, які використовуються ilocв пандах. Скажімо, я намагаюся перетворити 1-d Dataframe у 2-d Dataframe. По-перше, у мене є наступний 1-d Dataframe a_array = [1,2,3,4,5,6,7,8] a_df = pd.DataFrame(a_array).T І я збираюсь перетворити це у 2-денний Dataframe розміром 2x4. Почніть із попереднього встановлення 2-денного фрейму даних наступним …

3
Повільні пандами DataFrame MultiIndex reindex
У мене панда DataFrame форми: id start_time sequence_no value 0 71 2018-10-17 20:12:43+00:00 114428 3 1 71 2018-10-17 20:12:43+00:00 114429 3 2 71 2018-10-17 20:12:43+00:00 114431 79 3 71 2019-11-06 00:51:14+00:00 216009 100 4 71 2019-11-06 00:51:14+00:00 216011 150 5 71 2019-11-06 00:51:14+00:00 216013 180 6 92 2019-12-01 00:51:14+00:00 114430 …

1
Як перемикати кадр даних, що складається з стовпця з розділом і підрозділом в R
У мене нижче згаданий кадр даних: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16 06:13:55", "2020-03-16 10:03:43", "2020-03-16 12:37:09", "2020-03-16 06:40:24", "2020-03-16 09:46:45", "2020-03-16 12:07:44", "2020-03-16 14:09:51", "2020-03-16 09:19:23"), Status = c("SA", "SA", "SA", "RE", "RE", "RE", …

2
Створюють відфільтровані двійкові декартові продукти
Постановка проблеми Я шукаю ефективний спосіб генерування повної бінарної декартової продукції (таблиці з усіма комбінаціями True і False з певною кількістю стовпців), відфільтрованих за певними ексклюзивними умовами. Наприклад, для трьох стовпців / біт n=3ми отримали б повну таблицю df_combs = pd.DataFrame(itertools.product(*([[True, False]] * n))) 0 1 2 0 True True …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.