Запитання з тегом «pandas»

Pandas - бібліотека Python для маніпулювання та аналізу даних, наприклад, фрейми даних, багатовимірні часові ряди та набори даних поперечного перерізу, які зазвичай зустрічаються в статистиці, результатах експериментальної науки, економетрії або фінансах. Pandas - одна з головних бібліотек наукових даних на Python.

8
Візьміть декілька списків у кадр даних
Як я можу взяти декілька списків і розмістити їх як різні стовпці у фреймі даних python? Я спробував це рішення, але мав деякі проблеми. Спроба 1: Складіть три списки та скопіюйте їх разом і скористайтеся цим res = zip(lst1,lst2,lst3) Виходить лише один стовпчик Спроба 2: percentile_list = pd.DataFrame({'lst1Tite' : [lst1], …
164 python  numpy  pandas 

10
Створіть колони списків Pandas, створіть рядок для кожного елемента списку
У мене є кадр даних, де деякі комірки містять списки з кількома значеннями. Замість того, щоб зберігати кілька значень у комірці, я хотів би розширити рамку даних, щоб кожен елемент у списку отримав свій власний рядок (з однаковими значеннями у всіх інших стовпцях). Тож якщо я маю: import pandas as …
163 python  pandas  list 

13
Порівняйте два DataFrames та виведіть їх відмінності поряд
Я намагаюся виділити саме те, що змінилося між двома фреймами даних. Припустимо, у мене є два фрейми даних Python Pandas: "StudentRoster Jan-1": id Name score isEnrolled Comment 111 Jack 2.17 True He was late to class 112 Nick 1.11 False Graduated 113 Zoe 4.12 True "StudentRoster Jan-2": id Name score …
162 python  html  pandas  dataframe  panel 


5
Форматування / придушення наукових позначень за результатами агрегації Python Pandas
Як можна змінити формат виходу з групової операції в пандах, що створює наукові позначення для дуже великої кількості? Я знаю, як зробити формат рядків у python, але я втрачаю, коли справа доходить до його застосування тут. df1.groupby('dept')['data1'].sum() dept value1 1.192433e+08 value2 1.293066e+08 value3 1.077142e+08 Це пригнічує наукові позначення, якщо я …

12
Панди python: Видаліть дублікати стовпцями A, зберігаючи рядок з найвищим значенням у стовпці B
У мене є фрейм даних з повторюваними значеннями у стовпці А. Я хочу скинути дублікати, зберігаючи рядок з найвищим значенням у стовпці B. Отже це: A B 1 10 1 20 2 30 2 40 3 10 Слід перетворитись на це: A B 1 20 2 40 3 10 Уес …

4
Чому панди зливаються в python швидше, ніж злиття data.table в R у 2012 році?
Нещодавно я натрапив на бібліотеку панди для python, яка відповідно до цього орієнтиру виконує дуже швидкі злиття в пам'яті. Це навіть швидше, ніж пакет data.table в R (мою мову для вибору для аналізу). Чому pandasтак швидше, ніж data.table? Це через притаманну перевагу швидкості в пітоні над R, чи є якийсь …
160 python  r  join  data.table  pandas 

8
NumPy або Pandas: зберігає тип масиву як ціле число, маючи значення NaN
Чи є кращий спосіб зберегти тип даних numpyмасиву фіксованим як int( int64або будь-який інший), зберігаючи при цьому елемент всередині, вказаний як numpy.NaN? Зокрема, я перетворюю внутрішню структуру даних у DataFrame Pandas. У нашій структурі є стовпці цілого типу, які все ще мають NaN (але тип стовпця є int). Здається, переробляємо …


6
Видаліть всі повторювані рядки в Python Pandas
Ця pandas drop_duplicatesфункція чудово підходить для «уніфікації» фрейму даних. Тим НЕ менше, один з іменованих аргументів , щоб передати це take_last=Trueабо take_last=False, в той час як я хотів би, щоб видалити всі рядки , які дублюють через підмножина стовпців. Чи можливо це? A B C 0 foo 0 A 1 …

6
Випадковий вибір рядків у фреймі даних Pandas
Чи є спосіб вибрати випадкові рядки з DataFrame в Pandas. У R, використовуючи автомобільний пакет, є корисна функція, some(x, n)яка схожа на голову, але вибирає, у цьому прикладі, 10 рядків навмання з x. Я також переглянув документацію нарізки і, здається, немає нічого еквівалентного. Оновлення Зараз використовується версія 20. Існує метод …
159 python  pandas 

9
Завантажте дані з txt за допомогою панд
Я завантажую файл txt, що містить мікс даних з поплавком і рядком. Я хочу зберігати їх у масиві, де я можу отримати доступ до кожного елемента. Зараз я просто роблю import pandas as pd data = pd.read_csv('output_list.txt', header = None) print data Це структура вхідного файлу: 1 0 2000.0 70.2836942112 …
159 python  io  pandas 

6
Індикатор прогресу під час операцій панди
Я регулярно виконую операції панд на кадрах даних, що перевищують 15 мільйонів рядків, і я б хотів отримати доступ до показника прогресу для певних операцій. Чи існує текстовий показник прогресу для операцій розділення-застосування-поєднання панд? Наприклад, у чомусь подібному: df_users.groupby(['userID', 'requestDate']).apply(feature_rollup) де feature_rollupє дещо задіяна функція, яка займає багато стовпців DF …
158 python  pandas  ipython 

12
Фільтрування фреймів даних Pandas за датами
У мене є DataFrame Pandas зі стовпцем "дата". Тепер мені потрібно відфільтрувати всі рядки в DataFrame, які мають дати поза наступними двома місяцями. По суті, мені потрібно лише зберегти рядки, які є протягом наступних двох місяців. Який найкращий спосіб досягти цього?

9
Як визначити, чи містить стовпчик Pandas певне значення
Я намагаюся визначити, чи є запис у стовпці Pandas, який має певне значення. Я намагався це зробити if x in df['id']. Я думав, що це працює, за винятком випадків, коли я вводив його значення, яке я знав, що він не знаходиться в стовпці, до якого 43 in df['id']він все одно …
156 python  pandas 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.