Запитання з тегом «dataframe»

Кадр даних - це таблична структура даних. Зазвичай він містить дані, де рядки - це спостереження, а стовпці - змінні різних типів. Хоча "кадр даних" або "кадр даних" - це термін, використовуваний для цього поняття на декількох мовах (R, Apache Spark, deedle, Maple, бібліотека панд на Python та бібліотека DataFrames в Джулії), "table" - це термін, використовуваний у MATLAB і SQL.

1
Які правила Pandas використовує для створення перегляду та копії?
Мене бентежить правила, які Pandas використовує, приймаючи рішення про те, що вибір з фрейму даних є копією оригінального фрейму даних або переглядом оригіналу. Якщо я маю, наприклад, df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Я розумію, що queryповертає копію, щоб щось подібне foo = df.query('2 < index <= 5') foo.loc[:,'E'] = 40 …

11
Знайдіть максимальне значення стовпця та поверніть відповідні значення рядків за допомогою Pandas
Використовуючи Python Pandas, я намагаюся знайти Country& Placeз максимальним значенням. Це повертає максимальне значення: data.groupby(['Country','Place'])['Value'].max() Але як мені отримати відповідне Countryта Placeім’я?
118 python  pandas  dataframe  max 


6
Перетворити рядок кадру даних у вектор
Я хочу створити вектор із ряду кадрів даних. Але я не хочу мати рядки та назви стовпців. Я спробував кілька речей ... але не пощастило. Це мій кадр даних: > df <- data.frame(a=c(1,2,4,2),b=c(2,6,2,1),c=c(2.6,8.2,7.5,3)) > df a b c 1 1 2 2.6 2 2 6 8.2 3 4 2 7.5 …
116 r  vector  dataframe 


7
Додавання стовпця до фрейму data.frame
Я маю data.frame нижче. Я хочу додати стовпчик, який класифікує мої дані відповідно до стовпця 1 ( h_no) таким чином, що перша серія h_no 1,2,3,4 - клас 1, друга серія h_no(1 - 7) - клас 2 тощо. такі, як зазначено в останньому стовпці. h_no h_freq h_freqsq 1 0.09091 0.008264628 1 …
115 r  dataframe 

9
Гарне друк фрейму даних панди
Як я можу надрукувати фрейм даних панди як приємну текстову таблицю, як-от нижче? +------------+---------+-------------+ | column_one | col_two | column_3 | +------------+---------+-------------+ | 0 | 0.0001 | ABCD | | 1 | 1e-005 | ABCD | | 2 | 1e-006 | long string | | 3 | 1e-007 | ABCD …


6
Створення теплової карти з панд DataFrame
У мене є кадр даних, згенерований з пакету Pandas Python. Як я можу генерувати теплову карту за допомогою DataFrame з пакету pandas. import numpy as np from pandas import * Index= ['aaa','bbb','ccc','ddd','eee'] Cols = ['A', 'B', 'C','D'] df = DataFrame(abs(np.random.randn(5, 4)), index= Index, columns=Cols) >>> df A B C D …

4
Перетворити рядок у заголовок стовпця для Pandas DataFrame,
Дані, з якими я маю працювати, трохи безладні. У його даних є назви заголовків. Як я можу вибрати рядок із існуючого фрейму даних панд і зробити його (перейменувати його) на заголовок стовпця? Я хочу зробити щось на кшталт: header = df[df['old_header_name1'] == 'new_header_name1'] df.columns = header

4
Перетворити час Unix на читабельну дату у фреймі даних панд
У мене є фрейм даних з часами unix та цінами в ньому. Я хочу перетворити індексний стовпець так, щоб він відображався у читаних людиною датах. Так, наприклад , у мене є , dateяк 1349633705в колонці , але я хочу, щоб показати , як 10/07/2012(або , по крайней мере 10/07/2012 18:15). …


5
витягнути значення стовпця на основі іншого фрейму даних панди стовпців
Я ніби не зациклююся на витягуванні значення однієї змінної кондиціонування на іншу змінну. Наприклад, такий фрейм даних: A B p1 1 p1 2 p3 3 p2 4 Як я можу отримати значення Aколи B=3? Кожного разу, коли я Aдіставав значення , я отримував об'єкт, а не рядок.
109 python  pandas  dataframe 

8
Створення фрейму даних R за рядком
Я хотів би побудувати кадр даних за рядком у Р. Я здійснив пошук, і все, що я придумав, - це пропозиція створити порожній список, тримати скалярний індекс списку, а потім кожного разу додавати до списку однорядний кадр даних і просуньте індекс списку по одному. Нарешті, do.call(rbind,)у списку. Хоча це працює, …
107 list  r  dataframe 

4
Перемістіть кадр даних
Мені потрібно перенести великий кадр даних, і тому я використав: df.aree <- t(df.aree) df.aree <- as.data.frame(df.aree) Ось що я отримую: df.aree[c(1:5),c(1:5)] 10428 10760 12148 11865 name M231T3 M961T5 M960T6 M231T19 GS04.A 5.847557e+03 0.000000e+00 3.165891e+04 2.119232e+04 GS16.A 5.248690e+04 4.047780e+03 3.763850e+04 1.187454e+04 GS20.A 5.370910e+03 9.518396e+03 3.552036e+04 1.497956e+04 GS40.A 3.640794e+03 1.084391e+04 4.651735e+04 4.120606e+04 …
107 r  dataframe 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.