Запитання з тегом «pandas»

Pandas - бібліотека Python для маніпулювання та аналізу даних, наприклад, фрейми даних, багатовимірні часові ряди та набори даних поперечного перерізу, які зазвичай зустрічаються в статистиці, результатах експериментальної науки, економетрії або фінансах. Pandas - одна з головних бібліотек наукових даних на Python.

6
Отримання вертикальних ліній сітки для відображення у графіку рядків у matplotlib
Я хочу отримати як горизонтальну, так і вертикальну лінії сітки на моєму графіку, але за замовчуванням відображаються лише горизонтальні лінії сітки. Я використовую запит pandas.DataFrameз sql у python, щоб сформувати графік рядка з датами на осі x. Я не впевнений, чому вони не відображаються на датах, і я намагався знайти …

5
Побудуйте різні кадри даних на одному малюнку
У мене є файл температури з багаторічними записами температури у форматі, наведеному нижче: 2012-04-12,16:13:09,20.6 2012-04-12,17:13:09,20.9 2012-04-12,18:13:09,20.6 2007-05-12,19:13:09,5.4 2007-05-12,20:13:09,20.6 2007-05-12,20:13:09,20.6 2005-08-11,11:13:09,20.6 2005-08-11,11:13:09,17.5 2005-08-13,07:13:09,20.6 2006-04-13,01:13:09,20.6 Кожен рік має різні цифри, час записів, тому індекси дати і часу панд різні. Я хочу побудувати дані різного року на одному малюнку для порівняння. Вісь X …

6
Як динамічно оновлювати графік у циклі в блокноті Ipython (в межах однієї комірки)
Середовище: Python 2.7, matplotlib 1.3, ноутбук IPython 1.1, linux, chrome. Код знаходиться в одній вхідній комірці, використовуючи--pylab=inline Я хочу використовувати блокнот і панди IPython для споживання потоку та динамічного оновлення сюжету кожні 5 секунд. Коли я просто використовую оператор print для друку даних у текстовому форматі, він працює чудово: вихідна …

6
Група панд за сукупною сумою
Я хотів би додати стовпець сукупної суми до мого кадру даних Pandas, щоб: name | day | no -----|-----------|---- Jack | Monday | 10 Jack | Tuesday | 20 Jack | Tuesday | 10 Jack | Wednesday | 50 Jill | Monday | 40 Jill | Wednesday | 110 стає: …
93 python  pandas 

4
Pandas Merge - Як уникнути дублювання стовпців
Я намагаюся об'єднати два кадри даних. Кожен фрейм даних має два рівні індексу (дата, cusip). Наприклад, у стовпцях деякі стовпці збігаються між собою (валюта, дата коригування). Який найкращий спосіб об’єднати їх за індексом, але не брати дві копії валюти та дати коригування. Кожен фрейм даних - 90 стовпців, тому я …
93 python  pandas 

1
Python Pandas: Як читати лише перші n рядків файлів CSV?
У мене дуже великий набір даних, і я не можу дозволити собі прочитати весь набір даних. Отже, я думаю прочитати лише один його фрагмент для навчання, але я не уявляю, як це зробити. Будь-яка думка буде оцінена.
93 python  pandas  csv  file-io 

6
Неоднозначність у визначенні "осі" масиву даних Pandas / масиву Numpy
Я був дуже заплутаний щодо того, як визначаються осі python, і чи посилаються вони на рядки або стовпці DataFrame. Розглянемо наведений нижче код: >>> df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], columns=["col1", "col2", "col3", "col4"]) >>> df col1 col2 col3 col4 0 1 …

11
Розбиття кадру даних на кілька кадрів даних
У мене дуже великий кадр даних (близько 1 мільйона рядків) з даними експерименту (60 респондентів). Я хотів би розділити фрейм даних на 60 фреймів (фрейм даних для кожного учасника). У фреймі даних dataіснує змінна з назвою 'name', яка є унікальним кодом для кожного учасника. Я спробував наступне, але нічого не …

4
Завантаження файлу з декількома рядками JSON у Pandas
Я намагаюсь прочитати у файлі JSON у фреймі даних Python pandas (0.14.0). Ось перший рядок файлу JSON: {"votes": {"funny": 0, "useful": 0, "cool": 0}, "user_id": "P_Mk0ygOilLJo4_WEvabAA", "review_id": "OeT5kgUOe3vcN7H6ImVmZQ", "stars": 3, "date": "2005-08-26", "text": "This is a pretty typical cafe. The sandwiches and wraps are good but a little overpriced and …

4
Які плюси та мінуси між get_dummies (Pandas) та OneHotEncoder (Scikit-learn)?
Я вивчаю різні методи перетворення категоріальних змінних у числові для класифікаторів машинного навчання. Я натрапив на pd.get_dummiesметод, і sklearn.preprocessing.OneHotEncoder()я хотів побачити, як вони відрізняються з точки зору продуктивності та використання. Я знайшов підручник з використання OneHotEncoder()на https://xgdgsc.wordpress.com/2015/03/20/note-on-using-onehotencoder-in-scikit-learn-to-work-on-categorical-features/, оскільки sklearnдокументація була не дуже корисно на цій функції. У мене таке відчуття, …


2
Попередження користувача Python Pandas: Сортування, оскільки вісь, що не об’єднується, не вирівняна
Я роблю практику коду та застосовую злиття фреймів даних, роблячи це, отримуючи попередження користувача /usr/lib64/python2.7/site-packages/pandas/core/frame.py:6201: FutureWarning: сортування, оскільки вісь, що не є конкатенацією, не вирівняна. Майбутня версія панд зміниться на не сортувати за замовчуванням. Щоб прийняти майбутню поведінку, передайте 'sort = True'. Щоб зберегти поточну поведінку та заглушити попередження, передайте …
92 python  pandas 

6
Перетворити серію панд на DataFrame
У мене є серія Pandas sf: email email1@email.com [1.0, 0.0, 0.0] email2@email.com [2.0, 0.0, 0.0] email3@email.com [1.0, 0.0, 0.0] email4@email.com [4.0, 0.0, 0.0] email5@email.com [1.0, 0.0, 3.0] email6@email.com [1.0, 5.0, 0.0] І я хотів би перетворити його на такий DataFrame: index | email | list _____________________________________________ 0 | email1@email.com | …

3
Python: отримайте підрахунок частоти на основі двох стовпців (змінних) у фреймі даних pandas деяких рядків
Привіт, у мене такий фрейм даних. Group Size Short Small Short Small Moderate Medium Moderate Small Tall Large Я хочу підрахувати частоту того, скільки разів той самий рядок відображається у фреймі даних. Group Size Time Short Small 2 Moderate Medium 1 Moderate Small 1 Tall Large 1

2
Pandas Group за діапазоном цінностей
Чи є простий метод у пандах викликати groupbyдіапазон приростів значень? Наприклад, наведеному нижче прикладі, чи можу я bin та групувати стовпець Bіз 0.155збільшенням, так що, наприклад, перші пари груп у стовпці Bподіляються на діапазони між '0 - 0,155, 0,155 - 0,31 ...' import numpy as np import pandas as pd …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.