У мене є кадр даних панди з декількома записами, і я хочу обчислити співвідношення між доходами певного типу магазинів. Існує ряд магазинів з даними про доходи, класифікацією сфери діяльності (театр, магазини тканин, продукти харчування ...) та іншими даними.
Я спробував створити новий кадр даних і вставити стовпчик із доходом усіх видів магазинів, що належать до однієї категорії, а у кадрі даних, що повертаються, заповнений лише перший стовпець, а решта заповнена NaN. Код, який я втомив:
corr = pd.DataFrame()
for at in activity:
stores.loc[stores['Activity']==at]['income']
Я хочу це зробити, тому можу використовувати, .corr()
щоб дати матрицю кореляції між категоріями магазинів.
Після цього я хотів би знати, як я можу побудувати матричні значення (-1 до 1, оскільки я хочу використовувати кореляцію Пірсона) з matplolib.