Як я можу побудувати окремі програми Pandas DataFrames як підзаблоки?


129

У мене є декілька даних Pandas DataFrames, що мають однакову шкалу значень, але мають різні стовпці та індекси. При виклику df.plot()я отримую окремі сюжетні зображення. Я дійсно хочу, щоб вони мали все в одному сюжеті, як і субплоти, але я, на жаль, не знаходжу рішення щодо того, як і буду дуже вдячний за деяку допомогу.

Відповіді:


252

Ви можете вручну створити субплоти за допомогою matplotlib, а потім побудувати рамки даних на певній підпрограмі за допомогою axключового слова. Наприклад для 4 субплотів (2х2):

import matplotlib.pyplot as plt

fig, axes = plt.subplots(nrows=2, ncols=2)

df1.plot(ax=axes[0,0])
df2.plot(ax=axes[0,1])
...

Ось axesмасив, який містить різні осі субплату, і ви можете отримати доступ до нього просто шляхом індексації axes.
Якщо ви хочете загальну вісь х, то ви можете надати sharex=Trueв plt.subplots.


33
Зауважте, що, дратуючи, .subplots()повертає різні системи координат залежно від розмірів масиву підплотів, які ви створюєте. Тож якщо ви повернете субплоти, де, скажімо nrows=2, ncols=1, вам потрібно буде проіндексувати осі як axes[0]і axes[1]. Див stackoverflow.com/a/21967899/1569221
canary_in_the_data_mine

3
@canary_in_the_data_mine Дякую, це насправді дратує ... ваш коментар врятував мене деякий час :) не вдалося зрозуміти, чому я отримуюIndexError: too many indices for array
snd

9
@canary_in_the_data_mine Це дратує лише те, що використовуються аргументи за замовчуванням для .subplot(). Встановіть squeeze=Falseсилу, .subplot()щоб завжди повертати знаки ndarrayв будь-якому випадку рядків і знаків.
Мартін

73

Ви можете бачити e.gs. в документації, що демонструє відповідь joris. Крім того, з документів, можна також встановити subplots=Trueі layout=(,)в панд plotфункції:

df.plot(subplots=True, layout=(1,2))

Ви також можете використовувати, fig.add_subplot()який приймає параметри сітки субплоти, такі як 221, 222, 223, 224 і т.д., як описано в публікації тут . Хороші приклади сюжету на фреймі даних панди, включаючи субплоти, можна побачити в цьому зошиті ipython .


2
хоча відповідь joris чудово підходить для загального використання matplotlib, це відмінно підходить для тих, хто хоче використовувати панди для швидкої візуалізації даних. Він також трохи підходить в рядку з питанням.
Столики маленького Бобі

Майте на увазі, що subplotsі layoutkwargs генеруватиме декілька сюжетів ТІЛЬКИ для одного фрейму даних. Це пов'язано з питаннями ОП щодо побудови декількох фреймів даних в один сюжет, але не для вирішення цього питання.
Остін А

1
Це краща відповідь для чистого використання панди. Для цього не потрібно імпортувати matplotlib безпосередньо (хоча це зазвичай слід у будь-якому випадку) і не вимагає циклу для довільних фігур (можна використовувати layout=(df.shape[1], 1), наприклад).
Анатолій Макаревич

20

Ви можете використовувати звичний стиль Matplotlib, який називає a figureі subplot, але вам просто потрібно вказати поточну вісь за допомогою plt.gca(). Приклад:

plt.figure(1)
plt.subplot(2,2,1)
df.A.plot() #no need to specify for first axis
plt.subplot(2,2,2)
df.B.plot(ax=plt.gca())
plt.subplot(2,2,3)
df.C.plot(ax=plt.gca())

тощо ...


7

Ви можете побудувати кілька підпрограмів з декількох фреймів даних панд, використовуючи matplotlib, простим трюком складання списку всіх кадрів даних. Потім використовуйте цикл for для побудови підзаготівлі.

Робочий код:

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
# dataframe sample data
df1 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df2 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df3 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df4 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df5 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df6 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
#define number of rows and columns for subplots
nrow=3
ncol=2
# make a list of all dataframes 
df_list = [df1 ,df2, df3, df4, df5, df6]
fig, axes = plt.subplots(nrow, ncol)
# plot counter
count=0
for r in range(nrow):
    for c in range(ncol):
        df_list[count].plot(ax=axes[r,c])
        count=+1

введіть тут опис зображення

Використовуючи цей код, ви зможете побудувати субплоти в будь-якій конфігурації. Вам потрібно просто визначити кількість рядків nrowта кількість стовпців ncol. Також вам потрібно скласти список кадрів даних, df_listякі ви хотіли побудувати.


2
зверніть увагу на друкарські помилки в останньому ряду: це не count =+1такcount +=1
PEBKAC

4

Ви можете скористатися цим:

fig = plt.figure()
ax = fig.add_subplot(221)
plt.plot(x,y)

ax = fig.add_subplot(222)
plt.plot(x,z)
...

plt.show()

3

Можливо, вам взагалі не потрібно буде використовувати Pandas. Ось сюжетний графік частот котячих кішок:

введіть тут опис зображення

x = np.linspace(0, 2*np.pi, 400)
y = np.sin(x**2)

f, axes = plt.subplots(2, 1)
for c, i in enumerate(axes):
  axes[c].plot(x, y)
  axes[c].set_title('cats')
plt.tight_layout()

1

Спираючись на відповідь @joris вище, якщо ви вже встановили посилання на субплот, ви можете також використовувати посилання. Наприклад,

ax1 = plt.subplot2grid((50,100), (0, 0), colspan=20, rowspan=10)
...

df.plot.barh(ax=ax1, stacked=True)

0

Як створити кілька сюжетів із словника фреймів даних із довгими (охайними) даними

  • Припущення

    • Є словник з декількох фреймів даних охайних даних
      • Створено за допомогою читання з файлів
      • Створено розділенням одного фрейму даних на кілька кадрів даних
    • Категорії cat,, можливо, перекриваються, але всі рамки даних можуть містити не всі значенняcat
    • hue='cat'
  • Оскільки фрейми даних переглянуті, немає гарантії, що кольори будуть відображені однаково для кожного сюжету

    • Необхідно створити спеціальну кольорову карту з унікальних 'cat'значень для всіх фреймів даних
    • Оскільки кольори будуть однаковими, розмістіть одну легенду збоку сюжетів, а не легенду в кожному сюжеті

Імпорт та синтетичні дані

import pandas as pd
import numpy as np  # used for random data
import random  # used for random data
import matplotlib.pyplot as plt
from matplotlib.patches import Patch  # for custom legend
import seaborn as sns
import math import ceil  # determine correct number of subplot


# synthetic data
df_dict = dict()
for i in range(1, 7):
    np.random.seed(i)
    random.seed(i)
    data_length = 100
    data = {'cat': [random.choice(['A', 'B', 'C']) for _ in range(data_length)],
            'x': np.random.rand(data_length),
            'y': np.random.rand(data_length)}
    df_dict[i] = pd.DataFrame(data)


# display(df_dict[1].head())

  cat         x         y
0   A  0.417022  0.326645
1   C  0.720324  0.527058
2   A  0.000114  0.885942
3   B  0.302333  0.357270
4   A  0.146756  0.908535

Створіть кольорові відображення та сюжет

# create color mapping based on all unique values of cat
unique_cat = {cat for v in df_dict.values() for cat in v.cat.unique()}  # get unique cats
colors = sns.color_palette('husl', n_colors=len(unique_cat))  # get a number of colors
cmap = dict(zip(unique_cat, colors))  # zip values to colors

# iterate through dictionary and plot
col_nums = 3  # how many plots per row
row_nums = math.ceil(len(df_dict) / col_nums)  # how many rows of plots
plt.figure(figsize=(10, 5))  # change the figure size as needed
for i, (k, v) in enumerate(df_dict.items(), 1):
    plt.subplot(row_nums, col_nums, i)  # create subplots
    p = sns.scatterplot(data=v, x='x', y='y', hue='cat', palette=cmap)
    p.legend_.remove()  # remove the individual plot legends
    plt.title(f'DataFrame: {k}')

plt.tight_layout()
# create legend from cmap
patches = [Patch(color=v, label=k) for k, v in cmap.items()]
# place legend outside of plot; change the right bbox value to move the legend up or down
plt.legend(handles=patches, bbox_to_anchor=(1.06, 1.2), loc='center left', borderaxespad=0)
plt.show()

введіть тут опис зображення

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.