Запитання з тегом «pandas»

Pandas - бібліотека Python для маніпулювання та аналізу даних, наприклад, фрейми даних, багатовимірні часові ряди та набори даних поперечного перерізу, які зазвичай зустрічаються в статистиці, результатах експериментальної науки, економетрії або фінансах. Pandas - одна з головних бібліотек наукових даних на Python.

11
Графічна кореляційна матриця за допомогою панд
У мене є набір даних з величезною кількістю функцій, тому аналізу кореляційної матриці стало дуже складно. Я хочу побудувати матрицю кореляції, яку ми отримуємо за допомогою dataframe.corr()функції з бібліотеки панд. Чи є якась вбудована функція, що надається бібліотекою панд для побудови цієї матриці?


7
Яка різниця між об'єднанням та злиттям у Pandas?
Припустимо, у мене є два подібних DataFrames: left = pd.DataFrame({'key1': ['foo', 'bar'], 'lval': [1, 2]}) right = pd.DataFrame({'key2': ['foo', 'bar'], 'rval': [4, 5]}) Я хочу їх об'єднати, тому спробую щось подібне: pd.merge(left, right, left_on='key1', right_on='key2') І я задоволений key1 lval key2 rval 0 foo 1 foo 4 1 bar 2 …
208 python  pandas  dataframe  join 

9
Зберігайте лише частину дати під час використання pandas.to_datetime
Я використовую pandas.to_datetimeдля розбору дат у своїх даних. Панди за замовчуванням представляють дати, datetime64[ns]хоча дати є лише щоденними. Цікаво, чи існує елегантний / розумний спосіб перетворення дат на datetime.dateабо datetime64[D]так, що коли я записую дані в CSV, дати не додаються 00:00:00. Я знаю, що я можу конвертувати тип вручну по …
206 python  pandas  csv  datetime  series 

7
Панди згруповані за сумою
Я використовую цей кадр даних: Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes …

20
Розділити (вибухнути) запис рядка даних панд даних на окремі рядки
У мене є a, pandas dataframeв якому один стовпець текстових рядків містить знаки, розділені комами. Я хочу розділити кожне поле CSV та створити новий рядок на запис (припустимо, що CSV чистий і його потрібно розділити лише на ','). Наприклад, aповинні стати b: In [7]: a Out[7]: var1 var2 0 a,b,c …

17
Виявлення та виключення залишків у кадрі даних Pandas
У мене є кадр даних панди з кількома стовпцями. Тепер я знаю, що певні рядки - це інше, що базується на певному значенні стовпця. Наприклад у стовпці "Vol" є всі значення навколо, 12xxі одне значення 4000(outlier). Тепер я хотів би виключити ті рядки, які мають такий Volстовпець. Отже, по суті …

8
Виберіть рядки DataFrame між двома датами
Я створюю DataFrame з CSV наступним чином: stock = pd.read_csv('data_in/' + filename + '.csv', skipinitialspace=True) У DataFrame є стовпець дати. Чи є спосіб створити новий DataFrame (або просто перезаписати існуючий), який містить лише рядки зі значеннями дати, які знаходяться у визначеному діапазоні дат або між двома вказаними значеннями дати?
198 python  pandas 

11
Як розділити стовпчик на два стовпчики?
У мене є кадр даних з одним стовпцем, і я хотів би розділити його на два стовпці, з одним заголовком стовпця як ", fips'а іншим"'row' Мій кадр даних dfвиглядає приблизно так: row 0 00000 UNITED STATES 1 01000 ALABAMA 2 01001 Autauga County, AL 3 01003 Baldwin County, AL 4 …
197 python  dataframe  pandas 

7
Додайте мітки x і y до ділянки панди
Припустимо, у мене є наступний код, який побудує щось дуже просте за допомогою панд: import pandas as pd values = [[1, 2], [2, 5]] df2 = pd.DataFrame(values, columns=['Type A', 'Type B'], index=['Index 1', 'Index 2']) df2.plot(lw=2, colormap='jet', marker='.', markersize=10, title='Video streaming dropout by category') Як легко встановлювати x і y-мітки, …

9
Зміна конкретного імені стовпця в пандах DataFrame
Я шукав елегантний спосіб змінити вказане ім’я стовпця на DataFrame. відтворити дані ... import pandas as pd d = { 'one': [1, 2, 3, 4, 5], 'two': [9, 8, 7, 6, 5], 'three': ['a', 'b', 'c', 'd', 'e'] } df = pd.DataFrame(d) Найелегантніше рішення, яке я знайшов поки що ... …
195 python  pandas 

3
Які відмінності між Pandas і NumPy + SciPy в Python? [зачинено]
Закрито . Це питання ґрунтується на думці . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб на нього можна було відповісти фактами та цитатами, відредагувавши цю публікацію . Закрито 4 роки тому . Удосконаліть це питання Вони обидва здаються надзвичайно схожими, і мені цікаво, який пакет буде …
195 python  numpy  scipy  pandas 

15
Як я читаю великий файл csv з пандами?
Я намагаюся прочитати великий файл csv (близько 6 ГБ) у пандах, і я отримую помилку пам’яті: MemoryError Traceback (most recent call last) <ipython-input-58-67a72687871b> in <module>() ----> 1 data=pd.read_csv('aphro.csv',sep=';') ... MemoryError: Будь-яка допомога з цього приводу?
194 python  pandas  csv  memory  chunks 

10
панди тристоронні приєднання декількох фреймів даних на стовпцях
У мене є 3 CSV файли. У кожному є перший стовпець як (рядок) імена людей, тоді як усі інші стовпці у кожному кадрі даних є атрибутами цієї людини. Як я можу "об'єднати" всі три документи CSV, щоб створити єдиний CSV, в кожному рядку якого є всі атрибути для кожного унікального …
191 python  pandas  join  merge 

4
Панди Python Фільтрування нану з вибору даних стовпця рядків
Без використання, groupbyяк би я фільтрував дані без NaN? Скажімо, у мене є матриця, у якій клієнти заповнюватимуть "N / A", "n / a" або будь-яку з його варіантів, а інші залишають це порожнім: import pandas as pd import numpy as np df = pd.DataFrame({'movie': ['thg', 'thg', 'mol', 'mol', 'lob', …
190 python  pandas  dataframe 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.