Запитання з тегом «dataframe»

Кадр даних - це таблична структура даних. Зазвичай він містить дані, де рядки - це спостереження, а стовпці - змінні різних типів. Хоча "кадр даних" або "кадр даних" - це термін, використовуваний для цього поняття на декількох мовах (R, Apache Spark, deedle, Maple, бібліотека панд на Python та бібліотека DataFrames в Джулії), "table" - це термін, використовуваний у MATLAB і SQL.

10
Як замінити значення NA у таблиці для вибраних стовпців
Є багато публікацій про заміну значень NA. Мені відомо, що можна замінити НС у наступній таблиці / фреймі такими: x[is.na(x)]<-0 Але що, якщо я хочу обмежити його лише певними стовпцями? Давайте покажу вам приклад. Спочатку почнемо з набору даних. set.seed(1234) x <- data.frame(a=sample(c(1,2,NA), 10, replace=T), b=sample(c(1,2,NA), 10, replace=T), c=sample(c(1:5,NA), 10, …

10
Spark Dataframe розрізняє стовпці з дубльованою назвою
Отож, як я знаю у Spark Dataframe, для кількох стовпців може бути однакове ім’я, як показано на знімку кадру даних: [ Row(a=107831, f=SparseVector(5, {0: 0.0, 1: 0.0, 2: 0.0, 3: 0.0, 4: 0.0}), a=107831, f=SparseVector(5, {0: 0.0, 1: 0.0, 2: 0.0, 3: 0.0, 4: 0.0})), Row(a=107831, f=SparseVector(5, {0: 0.0, 1: …


5
Перетворити список на колонку даних Pandas Dataframe
Мені потрібно перетворити мій список у фрейм даних з пандами в один стовпець Поточний список (len = 3): ['Thanks You', 'Its fine no problem', 'Are you sure'] Потрібні Pandas DF (форма = 3,): 0 Thank You 1 Its fine no problem 2 Are you sure Будь ласка, зверніть увагу, що …

1
Перетворити кадр даних на data.table без копії
У мене є великий фрейм даних (порядку декількох ГБ), який я хотів би перетворити на data.table. Використання as.data.tableстворює копію кадру даних, а це означає, що мені потрібна доступна пам’ять принаймні вдвічі більша за розмір даних. Чи є спосіб зробити перетворення без копії? Ось простий приклад для демонстрації: library(data.table) N <- …

13
Елегантний спосіб повідомляти про відсутні значення в data.frame
Ось невеличка частина коду, яку я написав, щоб повідомити про змінні з відсутніми значеннями з кадру даних. Я намагаюся придумати більш елегантний спосіб зробити це, який, можливо, повертає data.frame, але я застряг: for (Var in names(airquality)) { missing <- sum(is.na(airquality[,Var])) if (missing > 0) { print(c(Var,missing)) } } Редагувати: Я …

9
Замініть недійсні значення на None в Pandas DataFrame
Чи існує якийсь метод заміни значень Noneна Pandas у Python? Ви можете використовувати df.replace('pre', 'post')і можете замінити значення іншим, але цього не можна зробити, якщо ви хочете замінити Noneзначенням, що при спробі ви отримаєте дивний результат. Ось приклад: df = DataFrame(['-',3,2,5,1,-5,-1,'-',9]) df.replace('-', 0) що повертає успішний результат. Але, df.replace('-', None) …

6
Видаліть / обріжте всі рядки кадру даних
Очищаючи значення багатоканального кадру даних у python / pandas, я хочу обрізати рядки. Зараз я роблю це за двома інструкціями: import pandas as pd df = pd.DataFrame([[' a ', 10], [' c ', 5]]) df.replace('^\s+', '', regex=True, inplace=True) #front df.replace('\s+$', '', regex=True, inplace=True) #end df.values Це досить повільно, що я …

10
Як надрукувати (на папері) приємно відформатований кадр даних
Я хотів би надрукувати красиво відформатовані кадри даних на папері, в ідеалі - всередині сценарію. (Я намагаюся збирати дані за допомогою інструменту та автоматично обробляти та друкувати їх за допомогою сценарію R). Зараз я можу записати фрейм даних у текстовий файл за допомогою write.table(), але це має дві проблеми: Отриманий …



8
Перемістіть стовпець у перше місце у кадрі даних
Я хотів би, щоб останній стовпець кадру даних перемістився на початок (як перший стовпець). Як я можу це зробити в R? Мій data.frame має близько тисячі стовпців, щоб змінити порядок, як правило. Я просто хочу вибрати одну колонку і "перенести її на початок".
79 r  dataframe 

3
створення графіків розсіювання matplotlib з фреймів даних у пандах Python
Який найкращий спосіб створити серію графіків розсіювання за matplotlibдопомогою pandasкадру даних у Python? Наприклад, якщо у мене є фрейм даних, dfякий має деякі цікаві стовпці, я зазвичай перетворюю все в масиви: import matplotlib.pylab as plt # df is a DataFrame: fetch col1 and col2 # and drop na rows if …

6
Витяг значень у Pandas value_counts ()
Скажімо, ми використовували панди, dataframe[column].value_counts()які виводять: apple 5 sausage 2 banana 2 cheese 1 Як витягувати значення в такому ж порядку, як показано вище, з максимуму на мінімум? наприклад: [apple,sausage,banana,cheese]

4
Як підсумувати значення стовпця data.frame?
У мене є кадр даних з кількома стовпцями; деякий числовий і якийсь символ. Як обчислити суму конкретного стовпця? Я гугл для цього , і я бачу безліч функцій ( sum, cumsum, rowsum, rowSums, colSums, aggregate, apply) , але я не можу зрозуміти все це. Наприклад, припустимо, у мене є кадр …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.