Запитання з тегом «pandas»

Pandas - бібліотека Python для маніпулювання та аналізу даних, наприклад, фрейми даних, багатовимірні часові ряди та набори даних поперечного перерізу, які зазвичай зустрічаються в статистиці, результатах експериментальної науки, економетрії або фінансах. Pandas - одна з головних бібліотек наукових даних на Python.

6
Панди: перетворення категорій у числа
Припустимо, у мене є фрейм даних із країнами, який називається: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 Я знаю, що існує функція pd.get_dummies для перетворення країн на "гаряче кодування". Однак я хочу замість цього перетворити їх на індекси, які я отримаю cc_index …

2
збережіть панд. Сюжет гістограми серій у файл
У ipython Notebook спочатку створіть об’єкт pandas Series, а потім, викликавши метод екземпляра .hist (), браузер відображає рисунок. Мені цікаво, як зберегти цю цифру у файл (я маю на увазі не клацання правою кнопкою миші та збереження як, а команди, необхідні у сценарії).

3
Об’єднайте дві рамки даних панд (об’єднайте загальний стовпець)
У мене є 2 кадри даних: restaurant_ids_dataframe Data columns (total 13 columns): business_id 4503 non-null values categories 4503 non-null values city 4503 non-null values full_address 4503 non-null values latitude 4503 non-null values longitude 4503 non-null values name 4503 non-null values neighborhoods 4503 non-null values open 4503 non-null values review_count 4503 …

2
Як встановити деякі xlim та ylim у сітці Seaborn lmplot
Я використовую lmplot Seaborn для побудови лінійної регресії, розділяючи свій набір даних на дві групи з категоріальною змінною. І для x, і для y я хотів би вручну встановити нижню межу для обох графіків, але залишити верхню межу за замовчуванням Seaborn. Ось простий приклад: import pandas as pd import seaborn …
85 python  pandas  seaborn 

6
Різниця (и) між merge () та concat () у пандах
Яка суттєва різниця (и) між pd.DataFrame.merge()і pd.concat()? Поки що це я знайшов, будь ласка, прокоментуйте, наскільки повним і точним є моє розуміння: .merge()може використовувати лише стовпці (плюс індекси рядків), і це семантично підходить для операцій у стилі бази даних. .concat()може використовуватися з будь-якою віссю, використовуючи лише індекси, і дає можливість …
85 python  pandas  join  merge  concat 

3
Обчисліть різницю в часі даних панди від часу між двома стовпцями в годинах і хвилинах
У мене є два стовпці, fromdateі todate, у фреймі даних. import pandas as pd data = {'todate': [pd.Timestamp('2014-01-24 13:03:12.050000'), pd.Timestamp('2014-01-27 11:57:18.240000'), pd.Timestamp('2014-01-23 10:07:47.660000')], 'fromdate': [pd.Timestamp('2014-01-26 23:41:21.870000'), pd.Timestamp('2014-01-27 15:38:22.540000'), pd.Timestamp('2014-01-23 18:50:41.420000')]} df = pd.DataFrame(data) Я додаю новий стовпець,, diffщоб знайти різницю між двома датами df['diff'] = df['fromdate'] - df['todate'] Я отримую …

6
pandas: складний фільтр у рядках DataFrame
Я хотів би фільтрувати рядки за функцією кожного рядка, наприклад def f(row): return sin(row['velocity'])/np.prod(['masses']) > 5 df = pandas.DataFrame(...) filtered = df[apply_to_all_rows(df, f)] Або для іншого більш складного, надуманого прикладу, def g(row): if row['col1'].method1() == 1: val = row['col1'].method2() / row['col1'].method3(row['col3'], row['col4']) else: val = row['col2'].method5(row['col6']) return np.sin(val) df = …
85 python  pandas 

3
Як надати гістограму pandas / matplotlib власні кольори
Я щойно почав використовувати pandas / matplotlib як заміну Excel для створення накопичених гістограм. Я стикаюся з проблемою (1) у картці кольорів за замовчуванням лише 5 кольорів, тому якщо у мене більше 5 категорій, кольори повторюються. Як я можу вказати більше кольорів? В ідеалі, градієнт із початковим та кінцевим кольорами …

8
Панда: середнє значення за часовим інтервалом
Я новачок у Pandas .... У мене є маса даних опитування; Я хочу обчислити ковзаюче середнє, щоб отримати оцінку кожного дня на основі триденного вікна. Як я зрозумів з цього питання , функції rolling_ * обчислюють вікно на основі заданої кількості значень, а не конкретного діапазону часу та часу. Чи …


2
Об’єднання фреймів даних панд за іменами стовпців
У мене є два кадри даних із такими іменами стовпців: frame_1: event_id, date, time, county_ID frame_2: countyid, state Я хотів би отримати фрейм даних із наступними стовпцями, приєднавшись (зліва) county_ID = countyid: joined_dataframe event_id, date, time, county, state Я не можу зрозуміти, як це зробити, якщо стовпці, до яких я …


2
Python - Вимір кадру даних
Нове у Python. У R ви можете отримати розмірність матриці, використовуючи dim (...). Яка відповідна функція в Python Pandas для їх кадру даних?
85 python  pandas 


7
Pandas concat: ValueError: Форма переданих значень бла, індекси означають blah2
Я намагаюся об'єднати (Pandas 14.1) фрейм даних та серію. Серія повинна утворювати новий стовпець з деякими NA (оскільки значення індексу серії є підмножиною значень індексу кадру даних). Це працює для прикладу іграшок, але не з моїми даними (детально нижче). Приклад: import pandas as pd import numpy as np df1 = …
85 python  pandas 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.