У мене є такий фрейм даних Top15
:
Я створюю стовпець, в якому оцінюється кількість посилаються документів на людину:
Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energy Supply per Capita']
Top15['Citable docs per Capita'] = Top15['Citable documents'] / Top15['PopEst']
Я хочу знати співвідношення між кількістю цінних документів на душу населення та енергопостачанням на душу населення. Тому я використовую .corr()
метод (кореляція Пірсона):
data = Top15[['Citable docs per Capita','Energy Supply per Capita']]
correlation = data.corr(method='pearson')
Я хочу повернути єдине число, але результат такий:
.corr
безпосередньо до свого фрейму даних, він поверне всі парні кореляції; тому ви спостерігаєте 1s по діагоналі вашої матриці (кожен стовпчик ідеально співвідноситься з самим собою). Дивіться мою редакцію нижче.