Теплова карта в matplotlib з pcolor?


100

Я хотів би зробити теплову карту так (показано на FlowingData ): теплова карта

Вихідні дані є тут , але випадкові дані та мітки були б чудовими у використанні, тобто

import numpy
column_labels = list('ABCD')
row_labels = list('WXYZ')
data = numpy.random.rand(4,4)

Зробити теплову карту досить просто в matplotlib:

from matplotlib import pyplot as plt
heatmap = plt.pcolor(data)

І я навіть знайшов аргументи кольорової карти, які добре виглядають:heatmap = plt.pcolor(data, cmap=matplotlib.cm.Blues)

Але крім цього, я не можу зрозуміти, як відображати мітки для стовпців та рядків та відображати дані у правильній орієнтації (початок ліворуч, а не ліворуч внизу).

Спроби маніпулювати heatmap.axes(наприклад heatmap.axes.set_xticklabels = column_labels) провалилися. Що я тут пропускаю?


З цим питанням теплової карти багато перегукується - можливо, вам буде якась корисна інформація.
Джон Ліон

Методи етикетки з цього поста може допомогти stackoverflow.com/questions/6352740/matplotlib-label-each-bin
tacaswell

Відповіді:


123

Це пізно, але ось моя пітонна реалізація теплової карти NBA.

оновлено: 4.04.2014 : дякую всім

# -*- coding: utf-8 -*-
# <nbformat>3.0</nbformat>

# ------------------------------------------------------------------------
# Filename   : heatmap.py
# Date       : 2013-04-19
# Updated    : 2014-01-04
# Author     : @LotzJoe >> Joe Lotz
# Description: My attempt at reproducing the FlowingData graphic in Python
# Source     : http://flowingdata.com/2010/01/21/how-to-make-a-heatmap-a-quick-and-easy-solution/
#
# Other Links:
#     http://stackoverflow.com/questions/14391959/heatmap-in-matplotlib-with-pcolor
#
# ------------------------------------------------------------------------

import matplotlib.pyplot as plt
import pandas as pd
from urllib2 import urlopen
import numpy as np
%pylab inline

page = urlopen("http://datasets.flowingdata.com/ppg2008.csv")
nba = pd.read_csv(page, index_col=0)

# Normalize data columns
nba_norm = (nba - nba.mean()) / (nba.max() - nba.min())

# Sort data according to Points, lowest to highest
# This was just a design choice made by Yau
# inplace=False (default) ->thanks SO user d1337
nba_sort = nba_norm.sort('PTS', ascending=True)

nba_sort['PTS'].head(10)

# Plot it out
fig, ax = plt.subplots()
heatmap = ax.pcolor(nba_sort, cmap=plt.cm.Blues, alpha=0.8)

# Format
fig = plt.gcf()
fig.set_size_inches(8, 11)

# turn off the frame
ax.set_frame_on(False)

# put the major ticks at the middle of each cell
ax.set_yticks(np.arange(nba_sort.shape[0]) + 0.5, minor=False)
ax.set_xticks(np.arange(nba_sort.shape[1]) + 0.5, minor=False)

# want a more natural, table-like display
ax.invert_yaxis()
ax.xaxis.tick_top()

# Set the labels

# label source:https://en.wikipedia.org/wiki/Basketball_statistics
labels = [
    'Games', 'Minutes', 'Points', 'Field goals made', 'Field goal attempts', 'Field goal percentage', 'Free throws made', 'Free throws attempts', 'Free throws percentage',
    'Three-pointers made', 'Three-point attempt', 'Three-point percentage', 'Offensive rebounds', 'Defensive rebounds', 'Total rebounds', 'Assists', 'Steals', 'Blocks', 'Turnover', 'Personal foul']

# note I could have used nba_sort.columns but made "labels" instead
ax.set_xticklabels(labels, minor=False)
ax.set_yticklabels(nba_sort.index, minor=False)

# rotate the
plt.xticks(rotation=90)

ax.grid(False)

# Turn off all the ticks
ax = plt.gca()

for t in ax.xaxis.get_major_ticks():
    t.tick1On = False
    t.tick2On = False
for t in ax.yaxis.get_major_ticks():
    t.tick1On = False
    t.tick2On = False

Вихід виглядає приблизно так: течійдатоподібна теплова карта nba

Там в IPython ноутбук з усіма цим кодом тут . Я багато чого навчився із "переповнення", тому, сподіваємось, хтось знайде це корисним.


1
Вищевказаний код не працював у ноутбуці iPythnon. Я вніс невелику модифікацію, змінивши nba_sort = nba_norm.sort ('PTS', висхідний = True, замість = True) на nba_sort = nba_norm.copy () nba_sort.sort ('PTS', висхідний = True, замість = True) як сортування працює за побічним ефектом, а не за функцією повернення! Дякуємо за чудовий приклад концерту!
Ю. Шень

1
Гммм ... ти, здається, ти прав. Не впевнений, що це все. Я виправлю код. Дякую!
BubbleGuppies

Що було б найпростішим способом зробити подібну графіку, але відобразити значення статистики в таблиці. Тобто я хочу зробити pcolorподібне, але і це має числові значення. АБО: Я хочу зробити матплотліб, tableякий забарвлює його клітини. Я бачив рішення іншої проблеми, і вони естетично некрасиві. Це виглядає чудово, якби тільки я знав, як перекрити цифри.
8one6

Так. Я спіткнувся своїм шляхом до того , що у відповідь на чуже запитання: stackoverflow.com/a/21167108/2501018
8one6

@joelotz Чи бажаєте ви внести (модифіковану) версію цього документа в документи Matplotlib? Якщо так, то просто відкрийте PR або надішліть мені повідомлення електронною поштою (див. Мій профіль).
tacaswell

12

Модуль народження python заснований на matplotlib і дає дуже гарну теплову карту.

Нижче представлена ​​реалізація з новонародженими, розроблена для ноутбука ipython / jupyter.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
# import the data directly into a pandas dataframe
nba = pd.read_csv("http://datasets.flowingdata.com/ppg2008.csv", index_col='Name  ')
# remove index title
nba.index.name = ""
# normalize data columns
nba_norm = (nba - nba.mean()) / (nba.max() - nba.min())
# relabel columns
labels = ['Games', 'Minutes', 'Points', 'Field goals made', 'Field goal attempts', 'Field goal percentage', 'Free throws made', 
          'Free throws attempts', 'Free throws percentage','Three-pointers made', 'Three-point attempt', 'Three-point percentage', 
          'Offensive rebounds', 'Defensive rebounds', 'Total rebounds', 'Assists', 'Steals', 'Blocks', 'Turnover', 'Personal foul']
nba_norm.columns = labels
# set appropriate font and dpi
sns.set(font_scale=1.2)
sns.set_style({"savefig.dpi": 100})
# plot it out
ax = sns.heatmap(nba_norm, cmap=plt.cm.Blues, linewidths=.1)
# set the x-axis labels on the top
ax.xaxis.tick_top()
# rotate the x-axis labels
plt.xticks(rotation=90)
# get figure (usually obtained via "fig,ax=plt.subplots()" with matplotlib)
fig = ax.get_figure()
# specify dimensions and save
fig.set_size_inches(15, 20)
fig.savefig("nba.png")

Вихід виглядає приблизно так: seaborn nba теплова карта я використовував кольорову карту matplotlib Blues, але особисто знаходжу кольори за замовчуванням досить красивими. Я використовував matplotlib для обертання міток осі x, оскільки не міг знайти синтаксис новонароджених. Як зазначає grexor, потрібно було вказати розміри (fig.set_size_inches) методом проб і помилок, що виявило мене трохи засмучуючим.

Як зазначив Пол Н, ви можете легко додати значення до теплових карт (annot = True), але в цьому випадку я не вважав, що це покращило цифру. Кілька фрагментів коду були взяті з чудової відповіді joelotz.


11

Основне питання полягає в тому, що спочатку потрібно встановити місце розташування ваших кліщів x та y. Крім того, це допомагає використовувати більш об'єктно-орієнтований інтерфейс для matplotlib. А саме, безпосередньо взаємодійте з axesоб’єктом.

import matplotlib.pyplot as plt
import numpy as np
column_labels = list('ABCD')
row_labels = list('WXYZ')
data = np.random.rand(4,4)
fig, ax = plt.subplots()
heatmap = ax.pcolor(data)

# put the major ticks at the middle of each cell, notice "reverse" use of dimension
ax.set_yticks(np.arange(data.shape[0])+0.5, minor=False)
ax.set_xticks(np.arange(data.shape[1])+0.5, minor=False)


ax.set_xticklabels(row_labels, minor=False)
ax.set_yticklabels(column_labels, minor=False)
plt.show()

Сподіваюся, що це допомагає.


Дякую, @Paul H, що прекрасно працює. Я використовував heatmap.axesмайно, яке чомусь нічого не робить.
Джейсон Сундрам

Чи знаєте ви, як перемістити мітки осі x, щоб бути вгорі? Я намагався очевидного ax.xaxis.set_label_position('top')безрезультатно.
Джейсон Сундрам

@JasonSundram Вам слід відкрити нове запитання щодо переміщення позиції етикетки, адже це має спрацювати, і дивно, що це не так.
tacaswell

1
@tcaswell, хороший момент. Нове запитання тут: stackoverflow.com/questions/14406214 / ...
Jason Sundram

1
@ Tgsmith61591 Я б використовував функцію теплової карти моряка, встановлюючи, annot=Trueколи його викликали ( stanford.edu/~mwaskom/software/seaborn/generated/… )
Пол H

3

Хтось редагував це питання, щоб видалити використаний я код, тому я був змушений додати його як відповідь. Дякуємо всім, хто брав участь у відповіді на це питання! Я думаю, що більшість інших відповідей кращі за цей код, я просто залишаю це тут для довідки.

Дякую Полу Н та unutbu (який відповів на це запитання ), у мене є дуже гарний вигляд:

import matplotlib.pyplot as plt
import numpy as np
column_labels = list('ABCD')
row_labels = list('WXYZ')
data = np.random.rand(4,4)
fig, ax = plt.subplots()
heatmap = ax.pcolor(data, cmap=plt.cm.Blues)

# put the major ticks at the middle of each cell
ax.set_xticks(np.arange(data.shape[0])+0.5, minor=False)
ax.set_yticks(np.arange(data.shape[1])+0.5, minor=False)

# want a more natural, table-like display
ax.invert_yaxis()
ax.xaxis.tick_top()

ax.set_xticklabels(row_labels, minor=False)
ax.set_yticklabels(column_labels, minor=False)
plt.show()

І ось результат:

Matplotlib HeatMap

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.