Запитання з тегом «pandas»

Pandas - бібліотека Python для маніпулювання та аналізу даних, наприклад, фрейми даних, багатовимірні часові ряди та набори даних поперечного перерізу, які зазвичай зустрічаються в статистиці, результатах експериментальної науки, економетрії або фінансах. Pandas - одна з головних бібліотек наукових даних на Python.

4
Видаліть ім’я індексу в пандах
У мене такий фрейм даних, як цей: In [10]: df Out[10]: Column 1 foo Apples 1 Oranges 2 Puppies 3 Ducks 4 Як видалити index name fooз цього фрейму даних? Бажаний результат виглядає так: In [10]: df Out[10]: Column 1 Apples 1 Oranges 2 Puppies 3 Ducks 4

9
Замініть недійсні значення на None в Pandas DataFrame
Чи існує якийсь метод заміни значень Noneна Pandas у Python? Ви можете використовувати df.replace('pre', 'post')і можете замінити значення іншим, але цього не можна зробити, якщо ви хочете замінити Noneзначенням, що при спробі ви отримаєте дивний результат. Ось приклад: df = DataFrame(['-',3,2,5,1,-5,-1,'-',9]) df.replace('-', 0) що повертає успішний результат. Але, df.replace('-', None) …

6
Сукупна функція Pandas DataFrame із використанням декількох стовпців
Чи є спосіб написати функцію агрегування, як використовується в DataFrame.aggметоді, яка мала б доступ до більш ніж одного стовпця даних, що агрегуються? Типовими випадками використання є середньозважена, зважена функція стандартного відхилення. Я хотів би мати можливість написати щось подібне def wAvg(c, w): return ((c * w).sum() / w.sum()) df = …
80 python  pandas 

6
Видаліть / обріжте всі рядки кадру даних
Очищаючи значення багатоканального кадру даних у python / pandas, я хочу обрізати рядки. Зараз я роблю це за двома інструкціями: import pandas as pd df = pd.DataFrame([[' a ', 10], [' c ', 5]]) df.replace('^\s+', '', regex=True, inplace=True) #front df.replace('\s+$', '', regex=True, inplace=True) #end df.values Це досить повільно, що я …

3
Pandas лівий зовнішній приєднати результати в таблиці більше, ніж ліва таблиця
З того, що я розумію про ліве зовнішнє з'єднання, отримана таблиця ніколи не повинна мати більше рядків, ніж ліва таблиця ... Будь ласка, дайте мені знати, якщо це неправильно ... Моя ліва таблиця - 192572 рядки та 8 стовпців. Моя права таблиця - 42160 рядків і 5 стовпців. У моїй …
80 python  pandas 

5
Як використовувати sklearn fit_transform з пандами і повернути фрейм даних замість масиву numpy?
Я хочу застосувати масштабування (за допомогою StandardScaler () від sklearn.preprocessing) до фрейму даних pandas. Наступний код повертає масив numpy, тому я втрачаю всі імена стовпців та індекси. Це не те, що я хочу. features = df[["col1", "col2", "col3", "col4"]] autoscaler = StandardScaler() features = autoscaler.fit_transform(features) "Рішення", яке я знайшов в …

3
панди python перетворюють індекс в datetime
Як перетворити індекс рядків pandas у формат datetime мій фрейм даних "df" такий value 2015-09-25 00:46 71.925000 2015-09-25 00:47 71.625000 2015-09-25 00:48 71.333333 2015-09-25 00:49 64.571429 2015-09-25 00:50 72.285714 але індекс має тип рядка, але мені потрібен формат дати та часу, оскільки я отримую помилку 'Index' object has no attribute …
80 python  pandas 

8
Помилка пам'яті при використанні панд read_csv
Я намагаюся зробити щось досить просте, читаючи великий файл CSV у фреймі даних pandas. data = pandas.read_csv(filepath, header = 0, sep = DELIMITER,skiprows = 2) Код або не працює MemoryError, або просто ніколи не закінчується. Використання пам’яті в диспетчері завдань зупинилося на рівні 506 Мб, і через 5 хвилин без …
79 python  windows  pandas 

5
Збереження ділянок (AxesSubPlot), згенерованих з панд python за допомогою savefig matplotlib
Я використовую панди для створення сюжету з фрейму даних, який я хотів би зберегти у файл: dtf = pd.DataFrame.from_records(d,columns=h) fig = plt.figure() ax = dtf2.plot() ax = fig.add_subplot(ax) fig.savefig('~/Documents/output.png') Здається, що останній рядок, використовуючи файл збереження matplotlib, повинен зробити цю справу. Але цей код видає таку помилку: Traceback (most recent …

4
Додавання обчислених стовпців до фрейму даних у пандах
У мене є набір даних про ціни OHLC, який я проаналізував із CSV у фрейм даних Pandas і зробив вибірку до 15-хвилинних барів: <class 'pandas.core.frame.DataFrame'> DatetimeIndex: 500047 entries, 1998-05-04 04:45:00 to 2012-08-07 00:15:00 Freq: 15T Data columns: Close 363152 non-null values High 363152 non-null values Low 363152 non-null values Open …
78 python  pandas 

3
створення графіків розсіювання matplotlib з фреймів даних у пандах Python
Який найкращий спосіб створити серію графіків розсіювання за matplotlibдопомогою pandasкадру даних у Python? Наприклад, якщо у мене є фрейм даних, dfякий має деякі цікаві стовпці, я зазвичай перетворюю все в масиви: import matplotlib.pylab as plt # df is a DataFrame: fetch col1 and col2 # and drop na rows if …

6
Витяг значень у Pandas value_counts ()
Скажімо, ми використовували панди, dataframe[column].value_counts()які виводять: apple 5 sausage 2 banana 2 cheese 1 Як витягувати значення в такому ж порядку, як показано вище, з максимуму на мінімум? наприклад: [apple,sausage,banana,cheese]

10
перемішування / перестановка DataFrame в пандах
Що таке простий та ефективний спосіб перетасувати кадр даних у пандах, за рядками чи стовпцями? Тобто як записати функцію, shuffle(df, n, axis=0)яка приймає фрейм даних, кількість перетасовувань nта вісь ( axis=0дорівнює рядкам, axis=1є стовпчиками) і повертає копію кадру даних, перемішану nразів. Редагувати : ключ - це робити, не руйнуючи мітки …
78 python  numpy  pandas 

11
чи можна зробити нечітке злиття збігів з пандами python?
У мене є два DataFrames, які я хочу об’єднати на основі стовпця. Однак через альтернативні написання, різну кількість пробілів, відсутність / наявність діакритичних знаків, я хотів би мати можливість об’єднатися, доки вони подібні один до одного. Підійде будь-який алгоритм подібності (soundex, Levenshtein, difflib's). Скажімо, один DataFrame має такі дані: df1 …
78 python  pandas 

8
Як додати окремий предмет до серії Pandas
Як додати один елемент до серіалізованої серії панд? Я знаю, що це не найефективніший спосіб пам’яті, але мені все одно потрібно це зробити. Щось разом: >> x = Series() >> N = 4 >> for i in xrange(N): >> x.some_appending_function(i**2) >> print x 0 | 0 1 | 1 2 …
77 python  pandas 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.