Запитання з тегом «pandas»

Pandas - бібліотека Python для маніпулювання та аналізу даних, наприклад, фрейми даних, багатовимірні часові ряди та набори даних поперечного перерізу, які зазвичай зустрічаються в статистиці, результатах експериментальної науки, економетрії або фінансах. Pandas - одна з головних бібліотек наукових даних на Python.

6
Як передати інший цілий стовпець як аргумент pandas fillna ()
Я хотів би заповнити відсутні значення в одному стовпці значеннями з іншого стовпця, використовуючи fillnaметод. (Я читав, що перебирання кожного рядка було б дуже поганою практикою, і що краще було б робити все за один раз, але я не міг дізнатися, як це зробити fillna.) Дані до: Day Cat1 Cat2 …
95 python  pandas  fillna 

4
У чому різниця між pandas.qcut та pandas.cut?
Документація говорить: http://pandas.pydata.org/pandas-docs/dev/basics.html "Неперервні значення можна дискретизувати за допомогою функцій cut (bins на основі значень) та qcut (bins на основі зразків квантилів)" Для мене це звучить дуже абстрактно ... Я бачу відмінності у наведеному нижче прикладі, але що насправді означає / означає qcut (квантиль вибірки)? Коли б ви використовували qcut …
94 python  pandas 

1
Для чого потрібні аргументи "рівні", "ключі" та імена у функції concat від Pandas?
Питання Як я використовую pd.concat? Для чого levelsаргумент? Для чого keysаргумент? Чи є купа прикладів, які допоможуть пояснити, як використовувати всі аргументи? concatФункція Пандаса - це швейцарський армійський ніж комунальних служб. Різноманітність ситуацій, в яких це корисно, безліч. Існуюча документація залишає кілька деталей щодо деяких необов’язкових аргументів. Серед них є …
94 python  pandas 

11
Знайти цілочисельний індекс рядків з NaN у фреймі даних pandas
У мене є панда DataFrame, така: a b 2011-01-01 00:00:00 1.883381 -0.416629 2011-01-01 01:00:00 0.149948 -1.782170 2011-01-01 02:00:00 -0.407604 0.314168 2011-01-01 03:00:00 1.452354 NaN 2011-01-01 04:00:00 -1.224869 -0.947457 2011-01-01 05:00:00 0.498326 0.070416 2011-01-01 06:00:00 0.401665 NaN 2011-01-01 07:00:00 -0.019766 0.533641 2011-01-01 08:00:00 -1.101303 -1.408561 2011-01-01 09:00:00 1.671795 -0.764629 Чи існує …
94 python  pandas 

5
Яка різниця між NaN та None?
Я читаю два стовпці CSV-файлу за допомогою панд, readcsv()а потім присвоюю значення словнику. Стовпці містять рядки цифр і букв. Іноді бувають випадки, коли клітина порожня. На мою думку, значення, прочитане для цього словникового запису, має бути, Noneале замість цього nanприсвоюється. Звичайно, Noneце є більш описовим для порожньої комірки, оскільки воно …
94 python  numpy  pandas  nan 

11
Блокнот Юпітера відображає дві таблиці панд поряд
У мене є дві фрейми даних панд, і я хотів би відобразити їх у блокноті Юпітера. Робимо щось на зразок: display(df1) display(df2) Показує їх один під одним: Я хотів би мати другий фрейм даних праворуч від першого. Є подібне запитання , але схоже, що людина задоволена або злиттям їх в …

3
Як можна вилучити пробіли з заголовків Pandas DataFrame?
Я аналізую дані з файлу Excel, який містить зайвий пробіл у деяких заголовках стовпців. Коли я перевіряю стовпці отриманого фрейму даних df.columns, я бачу: Index(['Year', 'Month ', 'Value']) ^ # Note the unwanted trailing space on 'Month ' Отже, я не можу зробити: df["Month"] Тому що це скаже мені, що …

3
Сукупний підрахунок панд різний
Скажімо, у мене є журнал активності користувачів, і я хочу сформувати звіт про загальну тривалість та кількість унікальних користувачів за день. import numpy as np import pandas as pd df = pd.DataFrame({'date': ['2013-04-01','2013-04-01','2013-04-01','2013-04-02', '2013-04-02'], 'user_id': ['0001', '0001', '0002', '0002', '0002'], 'duration': [30, 15, 20, 15, 30]}) Тривалість агрегування досить проста: …
94 python  pandas 

10
Видалення кількох стовпців на основі назв стовпців у Pandas
У мене є деякі дані, і коли я їх імпортую, я отримую такі непотрібні стовпці, я шукаю простий спосіб видалити всі ці 'Unnamed: 24', 'Unnamed: 25', 'Unnamed: 26', 'Unnamed: 27', 'Unnamed: 28', 'Unnamed: 29', 'Unnamed: 30', 'Unnamed: 31', 'Unnamed: 32', 'Unnamed: 33', 'Unnamed: 34', 'Unnamed: 35', 'Unnamed: 36', 'Unnamed: 37', …
94 python  pandas 

7
Pandas Як відфільтрувати серію
У мене є така серія після того, як я зробив groupby ('name') і використав функцію mean () в іншому стовпці name 383 3.000000 663 1.000000 726 1.000000 737 9.000000 833 8.166667 Чи може хто-небудь показати мені, як відфільтрувати рядки із середніми значеннями 1000000? Дякую і дуже вдячний за вашу допомогу.
94 python  pandas 

5
Побудова категоріальних даних за допомогою панд та matplotlib
У мене є фрейм даних з категоричними даними: colour direction 1 red up 2 blue up 3 green down 4 red left 5 red right 6 yellow down 7 blue down Я хочу сформувати декілька графіків, таких як кругові діаграми та гістограми на основі категорій. Чи можливо це без створення …
94 python  pandas 

6
Чи є у Pandas спосіб використовувати попереднє значення рядка в dataframe.apply, коли попереднє значення також обчислюється в застосунку?
У мене є такий фрейм даних: Index_Date A B C D =============================== 2015-01-31 10 10 Nan 10 2015-02-01 2 3 Nan 22 2015-02-02 10 60 Nan 280 2015-02-03 10 100 Nan 250 Вимагати: Index_Date A B C D =============================== 2015-01-31 10 10 10 10 2015-02-01 2 3 23 22 2015-02-02 …

4
Сортувати дані кадру Pandas за датою
У мене є фрейм даних pandas наступним чином: Symbol Date A 02/20/2015 A 01/15/2016 A 08/21/2015 Я хочу відсортувати Date, але стовпець - це просто object. Я намагався зробити стовпець об'єктом дати, але зіткнувся з проблемою, коли цей формат не є необхідним форматом. Необхідний формат - це 2015-02-20,тощо. Тож зараз …
94 python  pandas 

3
python pandas dataframe стовпці перетворюють у ключ і значення dict
У мене є кадр даних pandas з декількома стовпцями, і я хотів би побудувати дикт із двох стовпців: один як ключі дикту, а інший як значення дикту. Як я можу це зробити? Кадр даних: area count co tp DE Lake 10 7 Forest 20 5 FR Lake 30 2 Forest …

11
Як розгорнути список всередині комірки Dataframe в окремі рядки
Я прагну перетворити клітинку панд, що містить список, у рядки для кожного з цих значень. Отже, візьмімо це: Якщо я хотів би розпакувати та скласти значення у nearest_neighborsстовпці так, щоб кожне значення було рядком у кожному opponentіндексі, як би я найкраще це зробив? Чи існують методи панд, призначені для таких …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.