Програмування pandas

8

Як я можу взяти декілька списків і розмістити їх як різні стовпці у фреймі даних python? Я спробував це рішення, але мав деякі проблеми. Спроба 1: Складіть три списки та скопіюйте їх разом і скористайтеся цим res = zip(lst1,lst2,lst3) Виходить лише один стовпчик Спроба 2: percentile_list = pd.DataFrame({'lst1Tite' : [lst1], …

164 python numpy pandas

10

Створіть колони списків Pandas, створіть рядок для кожного елемента списку

У мене є кадр даних, де деякі комірки містять списки з кількома значеннями. Замість того, щоб зберігати кілька значень у комірці, я хотів би розширити рамку даних, щоб кожен елемент у списку отримав свій власний рядок (з однаковими значеннями у всіх інших стовпцях). Тож якщо я маю: import pandas as …

163 python pandas list

13

Порівняйте два DataFrames та виведіть їх відмінності поряд

Я намагаюся виділити саме те, що змінилося між двома фреймами даних. Припустимо, у мене є два фрейми даних Python Pandas: "StudentRoster Jan-1": id Name score isEnrolled Comment 111 Jack 2.17 True He was late to class 112 Nick 1.11 False Graduated 113 Zoe 4.12 True "StudentRoster Jan-2": id Name score …

162 python html pandas dataframe panel

3

Панди отримують найвищі n записів у кожній групі

Припустимо, у мене є такі панди DataFrame: >>> df = pd.DataFrame({'id':[1,1,1,2,2,2,2,3,4],'value':[1,2,3,1,2,3,4,1,1]}) >>> df id value 0 1 1 1 1 2 2 1 3 3 2 1 4 2 2 5 2 3 6 2 4 7 3 1 8 4 1 Я хочу отримати новий DataFrame з топ-2 записами …

162 python pandas greatest-n-per-group window-functions top-n

5

Форматування / придушення наукових позначень за результатами агрегації Python Pandas

Як можна змінити формат виходу з групової операції в пандах, що створює наукові позначення для дуже великої кількості? Я знаю, як зробити формат рядків у python, але я втрачаю, коли справа доходить до його застосування тут. df1.groupby('dept')['data1'].sum() dept value1 1.192433e+08 value2 1.293066e+08 value3 1.077142e+08 Це пригнічує наукові позначення, якщо я …

162 python pandas floating-point scientific-notation number-formatting

12

Панди python: Видаліть дублікати стовпцями A, зберігаючи рядок з найвищим значенням у стовпці B

У мене є фрейм даних з повторюваними значеннями у стовпці А. Я хочу скинути дублікати, зберігаючи рядок з найвищим значенням у стовпці B. Отже це: A B 1 10 1 20 2 30 2 40 3 10 Слід перетворитись на це: A B 1 20 2 40 3 10 Уес …

162 python duplicates pandas

4

Чому панди зливаються в python швидше, ніж злиття data.table в R у 2012 році?

Нещодавно я натрапив на бібліотеку панди для python, яка відповідно до цього орієнтиру виконує дуже швидкі злиття в пам'яті. Це навіть швидше, ніж пакет data.table в R (мою мову для вибору для аналізу). Чому pandasтак швидше, ніж data.table? Це через притаманну перевагу швидкості в пітоні над R, чи є якийсь …

160 python r join data.table pandas

8

NumPy або Pandas: зберігає тип масиву як ціле число, маючи значення NaN

Чи є кращий спосіб зберегти тип даних numpyмасиву фіксованим як int( int64або будь-який інший), зберігаючи при цьому елемент всередині, вказаний як numpy.NaN? Зокрема, я перетворюю внутрішню структуру даних у DataFrame Pandas. У нашій структурі є стовпці цілого типу, які все ще мають NaN (але тип стовпця є int). Здається, переробляємо …

160 python numpy int pandas type-conversion

5

Об’єднайте два кадри даних за індексом

Привіт, у мене є такі фрейми даних: > df1 id begin conditional confidence discoveryTechnique 0 278 56 false 0.0 1 1 421 18 false 0.0 1 > df2 concept 0 A 1 B Як злитися на індекси, щоб отримати: id begin conditional confidence discoveryTechnique concept 0 278 56 false 0.0 …

160 python pandas dataframe merge concat

6

Видаліть всі повторювані рядки в Python Pandas

Ця pandas drop_duplicatesфункція чудово підходить для «уніфікації» фрейму даних. Тим НЕ менше, один з іменованих аргументів , щоб передати це take_last=Trueабо take_last=False, в той час як я хотів би, щоб видалити всі рядки , які дублюють через підмножина стовпців. Чи можливо це? A B C 0 foo 0 A 1 …

160 python pandas duplicates

6

Випадковий вибір рядків у фреймі даних Pandas

Чи є спосіб вибрати випадкові рядки з DataFrame в Pandas. У R, використовуючи автомобільний пакет, є корисна функція, some(x, n)яка схожа на голову, але вибирає, у цьому прикладі, 10 рядків навмання з x. Я також переглянув документацію нарізки і, здається, немає нічого еквівалентного. Оновлення Зараз використовується версія 20. Існує метод …

159 python pandas

9

Завантажте дані з txt за допомогою панд

Я завантажую файл txt, що містить мікс даних з поплавком і рядком. Я хочу зберігати їх у масиві, де я можу отримати доступ до кожного елемента. Зараз я просто роблю import pandas as pd data = pd.read_csv('output_list.txt', header = None) print data Це структура вхідного файлу: 1 0 2000.0 70.2836942112 …

159 python io pandas

6

Індикатор прогресу під час операцій панди

Я регулярно виконую операції панд на кадрах даних, що перевищують 15 мільйонів рядків, і я б хотів отримати доступ до показника прогресу для певних операцій. Чи існує текстовий показник прогресу для операцій розділення-застосування-поєднання панд? Наприклад, у чомусь подібному: df_users.groupby(['userID', 'requestDate']).apply(feature_rollup) де feature_rollupє дещо задіяна функція, яка займає багато стовпців DF …

158 python pandas ipython

12

Фільтрування фреймів даних Pandas за датами

У мене є DataFrame Pandas зі стовпцем "дата". Тепер мені потрібно відфільтрувати всі рядки в DataFrame, які мають дати поза наступними двома місяцями. По суті, мені потрібно лише зберегти рядки, які є протягом наступних двох місяців. Який найкращий спосіб досягти цього?

157 python datetime pandas filtering dataframe

9

Як визначити, чи містить стовпчик Pandas певне значення

Я намагаюся визначити, чи є запис у стовпці Pandas, який має певне значення. Я намагався це зробити if x in df['id']. Я думав, що це працює, за винятком випадків, коли я вводив його значення, яке я знав, що він не знаходиться в стовпці, до якого 43 in df['id']він все одно …

156 python pandas

Запитання з тегом «pandas»