Програмування dataframe

5

Як отримати доступ до груп даних панди за допомогою ключа даних

Як я можу отримати доступ до відповідного фрейму даних groupby в об'єкті groupby за допомогою ключа? З наступною групою: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) Я можу повторити його, щоб отримати ключі та групи: In [11]: for …

154 python pandas dataframe group-by pandas-groupby

3

Логічні оператори для булевої індексації в Pandas

Я працюю з булевим індексом у Pandas. Питання, чому твердження: a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] добре працює тоді a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] виходить із помилкою? Приклад: a=pd.DataFrame({'x':[1,1],'y':[10,20]}) In: a[(a['x']==1)&(a['y']==10)] Out: x y 0 1 10 In: a[(a['x']==1) and (a['y']==10)] Out: ValueError: The truth value of an array with more than one element is …

154 python pandas dataframe boolean filtering

9

Визначте типи даних стовпців кадру даних

Я використовую R і завантажую дані в рамку даних за допомогою read.csv(). Як визначити тип даних кожного стовпця в кадрі даних?

153 r dataframe types

6

Перетворити формат стовпців data.frame з символу в фактор

Я хотів би змінити формат (клас) деяких стовпців мого data.frame object ( mydf) з charactor на factor . Я не хочу цього робити, коли читаю текстовий файл за read.table()функціями. Будь-яка допомога буде вдячна.

153 r dataframe character r-faq

7

Панди: сумуйте рядки DataFrame для заданих стовпців

У мене є такі DataFrame: In [1]: import pandas as pd df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'], 'd':[5,9,1]}) df Out [1]: a b c d 0 1 2 dd 5 1 2 3 ee 9 2 3 4 ff 1 Я хотів би додати стовпець, 'e'який є сумою стовпця …

153 python pandas dataframe sum

6

Чи варто використовувати data.frame або матрицю?

Коли слід використовувати a data.frame, а коли краще використовувати a matrix? Обидва зберігають дані у прямокутному форматі, тому іноді це незрозуміло. Чи існують якісь загальні правила, коли потрібно використовувати тип даних?

152 r matrix dataframe r-faq

5

Як позбутися стовпця "Без імені: 0" у пандах DataFrame?

У мене ситуація, коли іноді, коли я читаю csvз, dfя отримую небажаний стовпчик, що нагадує індекс unnamed:0. file.csv ,A,B,C 0,1,2,3 1,4,5,6 2,7,8,9 CSV читається з цим: pd.read_csv('file.csv') Unnamed: 0 A B C 0 0 1 2 3 1 1 4 5 6 2 2 7 8 9 Це дуже дратує! …

152 python pandas csv dataframe

8

Чи можуть панди автоматично розпізнавати дати?

Сьогодні я був позитивно здивований тим фактом, що під час читання даних із файлу даних (наприклад) панди здатні розпізнавати типи значень: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) Наприклад, це можна перевірити таким чином: for i, r in df.iterrows(): print type(r['col1']), type(r['col2']), type(r['col3']) Зокрема цілі числа, поплавці та рядки були розпізнані правильно. …

151 python date types dataframe pandas

3

Панди створюють порожні DataFrame з лише іменами стовпців

У мене є динамічний DataFrame, який працює чудово, але коли немає даних, які потрібно додати до DataFrame, я отримую помилку. І тому мені потрібно рішення створити порожній DataFrame з лише назвами стовпців. Наразі у мене є щось подібне: df = pd.DataFrame(columns=COLUMN_NAMES) # Note that there are now row data inserted. …

151 python pandas dataframe

10

Найшвидший спосіб замінити NA у великому таблицю даних

У мене є великий data.table , з великою кількістю відсутніх значень, розкиданих по його ~ 200k рядків та 200 стовпців. Я хотів би перекодувати ці значення NA на нулі якомога ефективніше. Я бачу два варіанти: 1: Перетворити в data.frame і використовувати щось на зразок цього 2: Якась класна команда встановлення …

150 r performance dataframe data.table

8

Повторіть кожен рядок data.frame кількість разів, вказану в стовпці

df <- data.frame(var1 = c('a', 'b', 'c'), var2 = c('d', 'e', 'f'), freq = 1:3) Який найпростіший спосіб розширити кожен рядок перші два стовпчики даних data.frame вище, щоб кожен рядок повторювався кількість разів, вказаних у стовпці 'freq'? Іншими словами, перейдіть до цього: df var1 var2 freq 1 a d 1 …

150 r dataframe replicate

12

Заміна порожніх значень (пробіл) на NaN у пандах

Я хочу знайти всі значення у фреймі даних Pandas, які містять пробіл (будь-яку довільну кількість) і замінити ці значення NaN. Будь-які ідеї, як це можна вдосконалити? В основному я хочу перетворити це: A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 -1.387326 foo 2 2000-01-04 0.814772 baz …

150 python pandas dataframe

11

Видаліть стовпці з фрейму даних, де ВСІ значення є NA

У мене виникли проблеми з кадром даних і не може реально вирішити цю проблему сам: dataframe має довільні властивості, стовпців і кожен рядок являє собою один набір даних . Питання: Як позбутися стовпців, де для ВСІХ рядків значення NA ?

149 r apply dataframe

7

Перетворити назви рядків у перший стовпець

У мене є такий кадр даних: df VALUE ABS_CALL DETECTION P-VALUE 1007_s_at "957.729231881542" "P" "0.00486279317241156" 1053_at "320.632701283368" "P" "0.0313356324173416" 117_at "429.842323161046" "P" "0.0170004527476119" 121_at "2395.7364289242" "P" "0.0114473584876183" 1255_g_at "116.493632746934" "A" "0.39799368200131" 1294_at "739.927122116896" "A" "0.0668649772942343" Я хочу перетворити назви рядків у перший стовпець. В даний час я використовую щось подібне …

147 r dataframe col rowname

10

Розщеплення словника / списку всередині стовпця Панди на окремі стовпці

У мене збережені дані в базі даних postgreSQL. Я запитую ці дані за допомогою Python2.7 і перетворюю їх у Pandas DataFrame. Однак останній стовпчик цього фрейму даних містить в собі словник (або список?) Значень. DataFrame виглядає так: [1] df Station ID Pollutants 8809 {"a": "46", "b": "3", "c": "12"} 8810 …

147 python pandas dictionary dataframe

Запитання з тегом «dataframe»